牛客连接:KMP算法
解法1:KMP算法
KMP算法的核心思想就是求一个next数组,其中 next[i] = j 表示的是下标为i的字符前的字符串最长相等前后缀的长度为j。
如:abab中,next[0] = 0,next[1] = 0, next[2] = 1,next[3] = 2;其中next[1]=0是最长相等前后缀为a,next[3]=2的原因是最长相等前后缀为ab;
这里比较难理解的是递归求解j中的j=next[j-1]操作。
当j>0且S[i]!=S[j]时,j>0表明当前字符i的上一个字符为结尾的字符串中,存在最长相等前后缀。但是当前(j++操作和for循环中++i操作则表示将上一字符结尾的最长前缀往后拓展一位,当前字符往后拓展一位后观察是否匹配)S[i]!=S[j],表明这两个字符不相等,即上一前缀往后拓展一位和上一字符结尾的字符串的最长后缀拓展一位并不相等。我们需要递归到上一字符结尾的最长前缀中寻找其next值(最长相等前后缀),查看该前缀是否能够与当前字符的后缀进行匹配。(为什么可以这么做,上一字符结尾的最长前缀的最长相等前缀(next[j-1])中,前后缀是相等的,这一前缀部分与当前字符的前一字符的部分值应该是相等的。)递归直到无法匹配,j=0结束。
class Solution {
public:
/** * 代码中的类名、方法名、参数名已经指定,请勿修改,直接返回方法规定的值即可 * * 计算模板串S在文本串T中出现了多少次 * @param S string字符串 模板串 * @param T string字符串 文本串 * @return int整型 */
int kmp(string S, string T) {
// write code here
vector<int > next(S.size(),0);
int j = 0;
int ans = 0;
for(int i =1; i< S.size(); ++i){
while(j>0 && S[i] != S[j])
j = next[j-1];
if(S[i] == S[j])
{
j++; //如果相等,则表明前缀长度可以延长1
}
next[i] = j;
}
j = 0;
for(int i =0;i<T.size();++i){
if(T[i] == S[j])
j++;
else
while(j>0 && T[i] != S[j])
j = next[j-1];
if(j == S.size()){
ans++;
j = next[j-1];
}
}
return ans;
}
};