Acesrc and String Theory

前言

来提供一种跑得还行(1872ms)并且比较好想(连我这个刚知道启发式合并还不会敲的人都想到了)的 $nlog^2n$ 的做法。
比赛时启发式合并那部分交给队友敲了，这几天学了一波启发式合并自己试着敲了一发，就顺便来写个博客。

题意

大概就是给你一个字符串，让你统计有多少子串可以有k个相同的字符串首位相接得到。

思路

考虑每一个子串是否可以向后延伸k-1倍，如果可以，显然对答案贡献+1.
子串 $s[i...j]$ 能往后延伸当且仅当 $lcp(i,j+1)>=(k-1)*(j+1-i)$ 。
显然答案可以表示成 $\sum_{0<=i<n}\sum_{i<j<=n}[lcp(i,j)>=(k-1)*(j-i)]$ 。
即对于任意两个后缀，只要他们的 $lcp$ 大于 $(k-1)*(j-i)$ ，就会令答案+1。
我们反过来考虑，这等价于，对于任意两个前缀，只要他们的最长公共后缀大于 $(k-1)*(j-i)$ ，就会令答案+1。
两个前缀的最长公共后缀等于他们的节点在后缀自动机 $fail$ 树上的 $lca$ 的 $len$ 。
我们考虑一个节点 $u$ ，考虑以 $u$ 为 $lca$ 的后缀对答案的贡献，该贡献为以 $u$ 为 $lca$ 的 $endpos$ 对中有多少对之差的绝对值小于等于 $(len[u]/(k-1))$ 。
显然我们可以在启发式合并维护endpos集合的合并操作时统计这个贡献。
每次当我们把轻儿子的 $endpos$ 插入到重儿子的集合中时，可以统计对于轻儿子的每个 $endpos\quad j$ ，重儿子中有多少 $endpos \quad i$ 满足 $i \in [j-len[u]/(k-1),j+len[u]/(k-1)]$ ，这部分可以由树状数组完成，先统计整个轻儿子插入产生的贡献，再将整个轻儿子插入。
即启发式合并的复杂度 $nlogn$ 再乘上维护树状数组和查询的复杂度 $logn$ ，总的复杂度为 $nlog^2n$ 。
PS:k等于1要特判。

代码

#include <cstdio>
#include <algorithm>
#include <cstring>
using namespace std;
typedef long long ll;
const int N = 6e5+100;
char s[N];
int n,m,k;
struct SAM{
    int next[N][26],fa[N],len[N],endpos[N];
    int root,tot,last;ll ans;
    int newnode(int l){
        fa[tot]=-1; endpos[tot]=-1;
        for(int i=0;i<26;++i)  next[tot][i]=-1;
        len[tot++]=l; return tot-1;
    }
    void init(){
        tot=ans=0;
        last=root=newnode(0);
    }
    void extend(int x,int ep){
        int p=last; int cur=newnode(len[p]+1); endpos[cur]=ep;
        while(p!=-1&&next[p][x]==-1){
            next[p][x]=cur; p=fa[p];
        }
        if(p==-1) fa[cur]=root;
        else{
            int q=next[p][x];
            if(len[q]==len[p]+1) fa[cur]=q;
            else{
                int tmp = newnode(len[p]+1);
                memcpy(next[tmp],next[q],sizeof(next[q]));
                fa[tmp]=fa[q]; fa[q]=fa[cur]=tmp;
                while(p!=-1&&next[p][x]==q){
                    next[p][x]=tmp; p=fa[p];
                }
            }
        }
        last=cur;
    }
    int head[N],nex[N],to[N],tol;
    void build(){
        for(int i=0;i<tot;++i) head[i]=-1; tol=0;
        for(int i=1;i<tot;++i){
            to[tol]=i; nex[tol]=head[fa[i]];
            head[fa[i]]=tol; tol++;
        }
    }
    int bit[N>>1];
    int sum(int i){
        int s=0;
        while(i>0){
            s+=bit[i];
            i-=i&-i;
        }
        return s;
    }
    void add(int i,int x){
        while(i<=n){
            bit[i]+=x;
            i+=i&-i;
        }
    }
    int sz[N],son[N];
    void dfs1(int u){
        sz[u]=1; son[u]=-1;
        for(int i=head[u];~i;i=nex[i]){
            dfs1(to[i]); sz[u]+=sz[to[i]];
            if(son[u]==-1||sz[son[u]]<sz[to[i]]) son[u]=to[i];
        }
    }
    void dfs2(int u,int v){
        if(~endpos[u]) add(endpos[u],v);
        for(int i=head[u];~i;i=nex[i]) dfs2(to[i],v);
    }
    void dfs3(int u,int rt){
        if(~endpos[u]) ans+=sum(min(n,endpos[u]+len[rt]/k))-sum(max(0,endpos[u]-len[rt]/k-1));
        for(int i=head[u];~i;i=nex[i]) dfs3(to[i],rt);
    }
    void dfs4(int u,bool clean){
        for(int i=head[u];~i;i=nex[i]){
            if(to[i]==son[u]) continue;
            dfs4(to[i],true);
        }
        if(~son[u]) dfs4(son[u],false);
        if(~endpos[u]){
            ans+=sum(min(n,endpos[u]+len[u]/k))-sum(max(0,endpos[u]-len[u]/k-1));
            add(endpos[u],1);
        }
        for(int i=head[u];~i;i=nex[i]){
            if(to[i]==son[u]) continue;
            dfs3(to[i],u); dfs2(to[i],1);
        }
        if(clean) dfs2(u,-1);
    }
}sam;



int main(){
    int t; scanf("%d",&t);
    while(t--){
        scanf("%d %s",&k,s); n=strlen(s); k-=1; sam.init();
        if(k==0){
            printf("%lld\n",1LL*n*(n+1)/2); continue;
        }
        for(int i=0;i<n;++i) sam.extend(s[i]-'a',i+1);
        sam.build(); sam.dfs1(sam.root); sam.dfs4(sam.root,true);
        printf("%lld\n",sam.ans);
    }
}