题目描述:给出一个字符串,求重复次数最多的子串。若多个,输出字典序最小的。
题解:先穷举长度 L,然后求长度为 L 的子串最多能连续出现几次。首先连续出现1 次是肯定可以的,所以这里只考虑至少 2 次的情况。假设在原字符串中连续出现 2 次,记这个子字符串为 S,那么 S 肯定包括了字符 r[0], r[L], r[L*2],r[L*3], ……中的某相邻的两个。所以只须看字符 r[L*i]和 r[L*(i+1)]往前和往后各能匹配到多远,记这个总长度为 K,那么这里连续出现了 K/L+1 次。最后看最大值是多少。
注意的问题:
1、求完后缀的LCP后,一步一步向前移动,寻找最长的LCP。
2、K/L 是整除的意思,比如 11/9,意味着LCP的最后两位不能算入答案中,这就导致输出答案的长度不是LCP的大小,而是循环节的个数乘以循环节的长度。
代码:
#include<cstdio>
#include<algorithm>
#include<cmath>
#include<string>
#include<cstring>
#define N 100010
using namespace std;
char s[N];
int sa[N],t[N],t2[N],c[N],n,rak[N],height[N];int f[N][20]={0};
void build_sa(int m,char *s)
{
int i,*x=t,*y=t2;
for (i=0;i<m;i++)c[i]=0;
for (i=0;i<n;i++)c[x[i]=s[i]]++;
for (i=1;i<m;i++)c[i]+=c[i-1];
for (i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
for (int k=1;k<=n;k<<=1)
{
int p=0;
for (i=n-k;i<n;i++)y[p++]=i;
for (i=0;i<n;i++)if (sa[i]>=k)y[p++]=sa[i]-k;
for (i=0;i<m;i++)c[i]=0;
for (i=0;i<n;i++)c[x[y[i]]]++;
for (i=0;i<m;i++)c[i]+=c[i-1];
for (i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1; x[sa[0]]=0;
for (i=1;i<n;i++)
x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
if (p>=n) break;
m=p;
}
}
void getheight()
{
int i,j,k=0;
for (i=0;i<n;i++)rak[sa[i]]=i;
for (i=0;i<n;i++)
{
if (k)k--;
if (!rak[i])continue;
j=sa[rak[i]-1];
while (s[i+k]==s[j+k])k++;
height[rak[i]]=k;
}
}
int LCP(int l,int r)
{
if (l==r)return height[r];
int k=(int) log2(r-l);
return min(f[l][k],f[r-(1<<k)+1][k]);
}
int main()
{
int T=0;
while (~scanf("%s",s) && s[0]!='#')
{
n=strlen(s);
int len=n;
s[n]='0'; n++;
build_sa(300,s);
getheight();
for (int i=0;i<n;i++) f[i][0]=height[i];
for (int k=1;(1<<k)<n;k++)
for (int i=0;i<n;i++) if (i+(1<<k-1)<n)
f[i][k]=min(f[i][k-1],f[i+(1<<k-1)][k-1]);
int r=sa[1],w=1,ans=1;
for (int L=1;L<=len/2;L++)
{
for (int i=0;i+L<len;i+=L)
{
if (s[i]!=s[i+L])continue;
int x=rak[i],y=rak[i+L];
if (x>y)swap(x,y);
int t=LCP(x+1,y);
if (t/L+1>ans || t/L+1==ans && rak[i]<rak[r]) { ans=t/L+1; r=i; w=ans*L;}
int k=1;
while (k<L && i-k>=0 && s[i-k]==s[i-k+L])
{
t++;
if (t/L+1>ans || t/L+1==ans && rak[i-k]<rak[r]) { ans=t/L+1; r=i-k; w=ans*L;}
k++;
}
}
}
printf("Case %d: ",++T);
for (int i=0;i<w;i++) printf("%c",s[r+i]);puts("");
}
return 0;
}