KMP算法c++代码
先放代码,对着代码来讲一讲(代码没加注释)
#include<iostream>
#include<string.h>
const int MAXLEN = 50;
int next[MAXLEN] = { 0 };
int nextval[MAXLEN] = { 0 };
void get_next(char s[],int lens)
{
int j = 0;
int k = -1;
next[j] = k;
while (j < lens-1)
{
if (k == -1 || s[j] == s[k])
{
k++;
j++;
next[j] = k;
}
else
k = next[k];
}
}
int main()
{
char strings[] = "hello worldolollo,I'm the king of the world,and you'll be die!";
char pattern[] = "olol";
int lens = strlen(strings);
int lenpatt = strlen(pattern);
get_next(pattern, lenpatt);
int i = 0, j = 0;
while (i < lens&&pattern[j]!='\0')
{
if (j == -1 || strings[i] == pattern[j])
{
i++;
j++;
}
else
{
j = next[j];
}
}
if (pattern[j] == '\0')
printf("%d\n", i - lenpatt);
else
printf("not found\n");
return 0;
}
1、kmp算法的核心就是减少不必要的回溯,也就是说,我们在匹配到中间某个字符发现失配的时候,不需要重头再来(回忆太累人了你说是吧),我们已经在过程中有了很多线索,这些线索可以帮助我们只回溯到必要的部分。
这里我给出一个粗略的理解:
这就是回溯位置的函数,很直观的一个理解就是,字符串1由ABCABD六个子串(每个子串都有若干字符)连接而成,字符串2由ABCABE组成,这时候匹配到E自然就产生失配,可是我们不需要回到开头的那个A。如下图(灵魂画手上线),我们想找一个位置可以减小回溯,那么这个位置之前,也就是第三行格子紫色格子之前,必须和第一行格子(也就是要匹配的文本)对应位置匹配,而由之前的步骤可知,图中3处 已经和图中2处匹配,所以我们要找的位置有这样的位置关系
1处==2处
2处==3处
所以 1处==3处 也就是1处等于4处(因为第二行和第三行是一模一样滴),这也就是上面的函数表达式。
理解了算法的思路,关键在于求next 数组 。而求next数组其实也是利用了上面的思想,具体可看代码,仔细想想。