题目描述
一个长度为\(N\)的母串,有四个元素分别是:N,S,W,N.
有M个长度为100的模式串.
现在要求每个模式串的前缀与母串匹配最长长度.
输入样例
7 3
SNNSSNS
NNSS
NNN
WSEE
输出样例
4
2
0
题解
这是AC自动机的模板题
关键是判断模式串的前缀是否被匹配
因为AC自动机的一个结点代表一个前缀,通过fail指针的遍历可以标记所有匹配的前缀
首先将模式串插入到trie树中,构造自动机
再将母串输入到AC自动机中,把匹配到的前缀即结点都标记一下.这里有一个剪枝,如果当前结点已经标记过了,那就可以break了,因为这个结点到根节点一定标记了.
最后再将每个模式串输入到AC自动机中,如果当前结点被标记就更新答案.当前结点被标记说明前缀已匹配.
代码
最开始有个小细节重要东西没注意导致RE
数组开了400,当时理由是100*4
果然是退役久了变傻了,状态肯定不止400,画一个四叉树就知道了,状态数应该选字符串总长比较合适
#pragma GCC optimize(2)
#pragma GCC optimize(3,"Ofast","inline")
#include <bits/stdc++.h>
using namespace std;
const int N = 110;
const int M = 1e5 + 7;
namespace AC {
int tr[10000000][4], tot;
int fail[10000000];
bool vis[10000000];
inline int id(char ch) {
if (ch == 'E') return 0;
else if (ch == 'S') return 1;
else if (ch == 'W') return 2;
else if (ch == 'N') return 3;
return 0;
}
void insert(char *s) {
int u = 0, k = 0;
for (int i = 1; s[i]; ++i) {
k = id(s[i]);
if (!tr[u][k]) tr[u][k] = ++tot;
u = tr[u][k];
}
}
queue<int> q;
void build() {
for (int i = 0; i < 4; ++i) {
if (tr[0][i]) {
q.push(tr[0][i]);
}
}
while (!q.empty()) {
int u = q.front();
q.pop();
for (int i = 0; i < 4; ++i) {
if (tr[u][i]) {
fail[tr[u][i]] = tr[fail[u]][i];
q.push(tr[u][i]);
} else {
tr[u][i] = tr[fail[u]][i];
}
}
}
}
void query(char *t) {
int u = 0;
for (int i = 1; t[i]; ++i) {
u = tr[u][id(t[i])];
for (int j = u; j && vis[j] != 1; j = fail[j]) {
vis[j] = true;
}
}
}
int get_ans(char *s) {
int u = 0, res = 0;
for (int i = 1; s[i]; ++i) {
u = tr[u][id(s[i])];
if (vis[u]) res = i;
}
return res;
}
}
char str[M][N];
char p[10000005];
int main() {
int n, m;
scanf("%d %d", &n, &m);
scanf("%s", p + 1);
for (int i = 1; i <= m; ++i) {
scanf("%s", str[i] + 1);
AC::insert(str[i]);
}
AC::build();
AC::query(p);
for (int i = 1; i <= m; ++i) {
printf("%d\n", AC::get_ans(str[i]));
}
return 0;
}
这个题虽然是以前做过的,但久了就忘了,当时也没有真正理解其精髓