题目描述:给出一个字符串,求重复次数最多的子串。若多个,输出字典序最小的。


题解:先穷举长度 L,然后求长度为 L 的子串最多能连续出现几次。首先连续出现1 次是肯定可以的,所以这里只考虑至少 2 次的情况。假设在原字符串中连续出现 2 次,记这个子字符串为 S,那么 S 肯定包括了字符 r[0], r[L], r[L*2],r[L*3], ……中的某相邻的两个。所以只须看字符 r[L*i]和 r[L*(i+1)]往前和往后各能匹配到多远,记这个总长度为 K,那么这里连续出现了 K/L+1 次。最后看最大值是多少。



注意的问题:

1、求完后缀的LCP后,一步一步向前移动,寻找最长的LCP。

2、K/L 是整除的意思,比如 11/9,意味着LCP的最后两位不能算入答案中,这就导致输出答案的长度不是LCP的大小,而是循环节的个数乘以循环节的长度。


代码:

#include<cstdio>
#include<algorithm>
#include<cmath>
#include<string>
#include<cstring>
#define N 100010
using namespace std;

char s[N];
int sa[N],t[N],t2[N],c[N],n,rak[N],height[N];int f[N][20]={0};

void build_sa(int m,char *s)
{
    int i,*x=t,*y=t2;
    for (i=0;i<m;i++)c[i]=0;
    for (i=0;i<n;i++)c[x[i]=s[i]]++;
    for (i=1;i<m;i++)c[i]+=c[i-1];
    for (i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
    for (int k=1;k<=n;k<<=1)
    {
        int p=0;
        for (i=n-k;i<n;i++)y[p++]=i;
        for (i=0;i<n;i++)if (sa[i]>=k)y[p++]=sa[i]-k;
        for (i=0;i<m;i++)c[i]=0;
        for (i=0;i<n;i++)c[x[y[i]]]++;
        for (i=0;i<m;i++)c[i]+=c[i-1];
        for (i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
        swap(x,y);
        p=1; x[sa[0]]=0;
        for (i=1;i<n;i++)
            x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
        if (p>=n) break;
        m=p;
    }
}

void getheight()
{
    int i,j,k=0;
    for (i=0;i<n;i++)rak[sa[i]]=i;
    for (i=0;i<n;i++)
    {
        if (k)k--;
        if (!rak[i])continue;
        j=sa[rak[i]-1];
        while (s[i+k]==s[j+k])k++;
        height[rak[i]]=k;
    }
}

int LCP(int l,int r)
{
    if (l==r)return height[r];
    int k=(int) log2(r-l);
    return min(f[l][k],f[r-(1<<k)+1][k]);
}

int main()
{
    int T=0;
    while (~scanf("%s",s) && s[0]!='#')
    {
        n=strlen(s);
        int len=n;
        s[n]='0'; n++;
        build_sa(300,s);
        getheight();

        for (int i=0;i<n;i++) f[i][0]=height[i];
            for (int k=1;(1<<k)<n;k++)
                for (int i=0;i<n;i++) if (i+(1<<k-1)<n)
                    f[i][k]=min(f[i][k-1],f[i+(1<<k-1)][k-1]);

        int r=sa[1],w=1,ans=1;
        for (int L=1;L<=len/2;L++)
        {
            for (int i=0;i+L<len;i+=L)
            {
                if (s[i]!=s[i+L])continue;
                int x=rak[i],y=rak[i+L];
                if (x>y)swap(x,y);
                int t=LCP(x+1,y);
                if (t/L+1>ans || t/L+1==ans && rak[i]<rak[r]) { ans=t/L+1; r=i; w=ans*L;}
                int k=1;
                while (k<L && i-k>=0 && s[i-k]==s[i-k+L])
                {
                    t++;
                    if (t/L+1>ans || t/L+1==ans && rak[i-k]<rak[r]) { ans=t/L+1; r=i-k; w=ans*L;}
                    k++;
                }
            }
        }
        printf("Case %d: ",++T);
        for (int i=0;i<w;i++) printf("%c",s[r+i]);puts("");
    }
    return 0;
}