热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

KMP算法在字符串中的应用

KMP算法是处理字符串匹配的一种高效算法它首先用O(m)的时间对模板进行预处理,然后用O(n)的时间完成匹配。从渐进的意义上说,这样时间复

KMP算法是处理字符串匹配的一种高效算法

       它首先用O(m)的时间对模板进行预处理,然后用O(n)的时间完成匹配。从渐进的意义上说,这样时间复杂度已经是最好的了,需要O(m+n)时间。对KMP的学习可以为AC-自动机做铺垫,学习KMP算法的核心是要理解失配函数,比如一条状态链,其中编号为i的节点表示已经匹配了i个字符,匹配开始的状态是0,成功匹配状态是1(表示多匹配了一个字符),而失配时沿着“失配边”走。为方便起见,这里的失配函数f[i]表示状态i失配时应转移到的新状态,特别需要注意f[0]=0;


有了失配函数以后,KMP算法不难写出:

void find(char *t,char *p,int *f)
{int n=strlen(t),m=strlen(p);getfail(p,f);int j=0;for(int i=0;i}

总的时间复杂度为O(n)


状态转移图是构造KMP的关键也是最巧妙的地方,算法思想就是自己匹配自己,进行递推:

void getfaile(char *p,int *f){int m=strlen(p);f[0]=0;f[1]=0;for(int i=1;i

求周期串类型(KMP模板题)

链接:https://icpcarchive.ecs.baylor.edu/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&problem=1027

题解:

根据后缀函数的定义,“错位部分”长度为i-f[i],如果这i个字符组成一个周期串,那么“错位”部分恰好是一个循环节,因此k(i-f[i])=i(注意k>1,因此i-f[i]不能等于i,必须有饭f[i]>0)

#include
#include
#include
#include
using namespace std;
const int maxn=1000000+10;
int f[maxn];
string p;
int main()
{int n,cas&#61;0;while(cin>>n){if(n&#61;&#61;0) break;cin>>p;f[0]&#61;0;f[1]&#61;0;for(int i&#61;1;i0&&i%(i-f[i])&#61;&#61;0)printf("%d %d\n",i,i/(i-f[i]));cout<}

KMP裸题&#xff08;求子串重复的次数&#xff09; &#xff08;本人poj的第50题&#xff09;

链接&#xff1a; http://poj.org/problem?id&#61;3461

#include
#include
#include
using namespace std;
const int maxn&#61;1000000&#43;10;
int f[maxn];
char p[maxn],t[maxn];
int main()
{int k;cin>>k;while(k--){cin>>p>>t;int n&#61;strlen(t),m&#61;strlen(p);memset(f,0,sizeof(f));f[0]&#61;0;f[1]&#61;0;for(int i&#61;1;i}

KMP找出第一次出现匹配的位置&#xff1a;

链接&#xff1a;http://acm.hdu.edu.cn/showproblem.php?pid&#61;1711

#include
#include
#include
using namespace std;
const int maxn&#61;1000000&#43;10;
int p[maxn],t[maxn];
int f[maxn];
int main()
{int k;scanf("%d",&k);while(k--){int n,m;scanf("%d%d",&n,&m);for(int i&#61;0;i}


求最短的重复串出现的次数

链接&#xff1a;http://poj.org/problem?id&#61;2406

思路&#xff1a;KMP&#xff0c;next表示模式串如果第i位(设str[0]为第0位)与文本串第j位不匹配则要回到第next[i]位继续与文本串第j位匹配。则模式串第1位到next[n]与模式串第n-next[n]位到n位是匹配的。所以思路和上面一样&#xff0c;如果n%&#xff08;n-next[n]&#xff09;&#61;&#61;0,则存在重复连续子串&#xff0c;长度为n-next[n]。

例如&#xff1a;a    b    a    b    a    b

next:-1   0    0    1    2    3    4

next[n]&#61;&#61;4,代表着&#xff0c;前缀abab与后缀abab相等的最长长度&#xff0c;这说明&#xff0c;ab这两个字母为一个循环节&#xff0c;长度&#61;n-next[n];


#include
#include
#include
using namespace std;
const int maxn&#61;1000000&#43;10;
char p[maxn];
int f[maxn];
int main()
{while(scanf("%s",p)!&#61;EOF){if(p[0]&#61;&#61;&#39;.&#39;) break;int n&#61;strlen(p);memset(f,0,sizeof(f));f[0]&#61;0;f[1]&#61;0;for(int i&#61;1;i}


转:https://www.cnblogs.com/wolf940509/p/6617113.html



推荐阅读
  • 深入浅出TensorFlow数据读写机制
    本文详细介绍TensorFlow中的数据读写操作,包括TFRecord文件的创建与读取,以及数据集(dataset)的相关概念和使用方法。 ... [详细]
  • HDU 2871 内存管理问题(线段树优化)
    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2871。本题涉及内存管理操作,包括重置、申请、释放和查询内存块。通过使用线段树进行高效管理和维护。 ... [详细]
  • Python notes
    6.1.1.执行模块当你用下面的方式运行一个Python模块pythonfibo.py模块中的代码将会被执行,就像导入它一样,不过此时__name__被设置为__main__。 ... [详细]
  • 在寻找轻量级Ruby Web框架的过程中,您可能会遇到Sinatra和Ramaze。两者都以简洁、轻便著称,但它们之间存在一些关键区别。本文将探讨这些差异,并提供详细的分析,帮助您做出最佳选择。 ... [详细]
  • 本文深入探讨了UNIX/Linux系统中的进程间通信(IPC)机制,包括消息传递、同步和共享内存等。详细介绍了管道(Pipe)、有名管道(FIFO)、Posix和System V消息队列、互斥锁与条件变量、读写锁、信号量以及共享内存的使用方法和应用场景。 ... [详细]
  • 本文介绍了一个经典的算法问题——活动选择问题,来源于牛客网的比赛题目。该问题要求从一系列活动集合中选出最多数量的相容活动,确保这些活动的时间段不重叠。 ... [详细]
  • 近期我们开发了一款包含天气预报功能的万年历应用,为了满足这一需求,团队花费数日时间精心打造并测试了一个稳定可靠的天气API接口,现正式对外开放。 ... [详细]
  • 一个登陆界面
    预览截图html部分123456789101112用户登入1314邮箱名称邮箱为空15密码密码为空16登 ... [详细]
  • 开发笔记:由数据库某字段存数组引发的json_encode/serialize思考
    开发笔记:由数据库某字段存数组引发的json_encode/serialize思考 ... [详细]
  • 解决Windows下创建子进程时代码重复执行的问题
    在Windows系统中,当启动子进程时,主进程的文件会被复制到子进程中。由于导入模块时会执行该模块中的代码,因此可能导致某些代码在主进程和子进程中各执行一次。本文探讨了这一现象的原因及其解决方案。 ... [详细]
  • 本题探讨如何在两个长度为 n 的整数序列中,找到它们的最长公共子序列(LCS)。题目保证第一个序列中的元素各不相同。我们将深入分析并提供一种高效的求解方法。 ... [详细]
  • 本文将详细介绍通过CAS(Central Authentication Service)实现单点登录的原理和步骤。CAS由耶鲁大学开发,旨在为多应用系统提供统一的身份认证服务。文中不仅涵盖了CAS的基本架构,还提供了具体的配置实例,帮助读者更好地理解和应用这一技术。 ... [详细]
  • 本文详细介绍如何通过设置SSH密钥来获取连接GitHub远程仓库的权限,包括生成密钥、添加到GitHub账户以及验证连接等步骤。 ... [详细]
  • Google排名优化-面向Google(Search Engine Friendly)的URL设计 ... [详细]
  • KMP算法是一种高效的字符串模式匹配算法,能够在不进行回溯的情况下完成匹配,其时间复杂度为O(m+n),其中m和n分别为文本串和模式串的长度。本文将详细介绍KMP算法的工作原理,并提供C语言实现。 ... [详细]
author-avatar
核电列兵_851
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有