学习笔记:
详细讲解:https://blog.csdn.net/pengwill97/article/details/80879387
字符串hash:
利用unsigned long long的范围自然溢出,相当于自动对2^64−1取模
单Hash公式:
hash[i]=(hash[i−1])∗p+idx(s[i]) % mod
其中p和mod均为质数,且有p<mod,对于此种Hash方法,将p和mod尽量取大即可,这种情况下,冲突的概率是很低的。
双Hash公式:
hash1[i]=(hash1[i−1])∗p+idx(s[i]) % mod1
hash2[i]=(hash2[i−1])∗p+idx(s[i]) % mod2
hash结果为<hash1[n],hash2[n]>,这种Hash很安全。
获取子串的hash公式:
题目地址:http://poj.org/problem?id=3461
题目:
求模式串在文本串中出现的次数
解题思路:
p去13331,预处理出p^n,计算模式串的hash值,计算出文本串的hash数组,匹配模式串的hash值和文本串子串的hash值,统计答案。
时间复杂度:O(len(文本串))
ac代码:
#include<iostream>
#include <cstring>
#include <stdio.h>
using namespace std;
typedef unsigned long long ll;
const int maxn = 1e6+5;
const ll p = 133331;
char s1[maxn], s2[maxn];
ll power[maxn], has[maxn];
void init() //预处理出p^n
{
power[0] = 1;
for(int i = 1; i < maxn; i++)
power[i] = power[i - 1] * p; //unsigned long long 自然溢出
}
int main()
{
//freopen("/Users/zhangkanqi/Desktop/11.txt","r",stdin);
init();
int t;
scanf("%d", &t);
while(t--)
{
scanf("%s", s1 + 1);
scanf("%s", s2 + 1);
int len1 = strlen(s1 + 1), len2 = strlen(s2 + 1);
has[0] = 0;
for(int i = 1; i <= len2; i++)
has[i] = has[i - 1] * p + (ll)(s2[i] - 'A' + 1);
ll sum = 0, ans = 0;
for(int i = 1; i <= len1; i++)
sum = sum * p + (ll)(s1[i] - 'A' + 1);
for(int i = len1; i <= len2; i++)
{
ll tmp = has[i] - has[i - len1] * power[len1];
if(sum == tmp) ans++;
}
printf("%llu\n", ans);
}
return 0;
}