题目(来自PTA,没有测试平台)

给定一个全部由小写英文字母组成的字符串,允许你至多删掉其中 3 个字符,结果可能有多少种不同的字符串?

输入格式:
输入在一行中给出全部由小写英文字母组成的、长度在区间 [4, 10^6] 内的字符串。

输出格式:
在一行中输出至多删掉其中 3 个字符后不同字符串的个数。

输入样例:
ababcc
输出样例:
25
提示:

删掉 0 个字符得到 "ababcc"。

删掉 1 个字符得到 "babcc", "aabcc", "abbcc", "abacc" 和 "ababc"。

删掉 2 个字符得到 "abcc", "bbcc", "bacc", "babc", "aacc", "aabc", "abbc", "abac" 和 "abab"。

删掉 3 个字符得到 "abc", "bcc", "acc", "bbc", "bac", "bab", "aac", "aab", "abb" 和 "aba"。

解题思路

dp。
dp[i][j]表示前i个字符,删除j个字符,得到的不同字符串的数目。
假如所有字符都不相同,那么删除j个字符后得到的不同字符串的数目为dp[i-1][j]+dp[i-1][j],含义为对于第i个字符,我们可以不选它,也可以选它。
但是存在重复的情况,此时dp[i][j]-=dp[k-1][j-(i-k)]。
含义为,我们将区间[k,i-1]的字符删去与将区间[k+1,i]的字符删去,最终得到的字符串相同,这属于重复的情况,我们需要删去重复的情况。
如何判断是否存在重复?
当存在是s[k]=s[i]时,说明前i个字符要删除j个字符,而此时删去区间[k,i-1]与删除区间[k+1,i]得到的字符串相同,就要减去重复的情况,即前k-1个字符删去j-(i-k)个字符是重复的。

AC代码

#include<bits/stdc++.h>
#define ll long long//开ll 
using namespace std;
const int N=1e6+10;
ll dp[N][4];
string str;
int main(){
    cin>>str;
    int n=str.size();
    str='.'+str;
    dp[0][0]=1;
    for(int i=1;i<=n;i++){
        for(int j=0;j<=3;j++){
            if(j==0) dp[i][j]=1;
            else dp[i][j]=dp[i-1][j]+dp[i-1][j-1];
            for(int k=i-1;j>=(i-k) && k>=1;k--){
                if(str[i]==str[k]) {
                    dp[i][j]-=dp[k-1][j-(i-k)];
                    break;
                }
            }        
        }
    }
    cout<<dp[n][0]+dp[n][1]+dp[n][2]+dp[n][3]<<endl;
}