DNA Sequence

题意:题目给m个病毒串,问不包含病毒串的长度为n的DNA p段有几个

难度:两颗星

思路:

图片说明
这个图是例子{“ACG”,”C”},构建树后如图所示,从每个结点出发都有4条边(A,T,C,G)
•从状态0出发走一步有4种走法:
–走A到状态1(安全);
–走C到状态4(危险);
–走T到状态0(安全);
–走G到状态0(安全);
•所以当n=1时,答案就是3
•当n=2时,就是从状态0出发走2步,就形成一个长度为2的字符串,只要路径上没有经过危险结点,有几种走法,那么答案就是几种。依此类推走n步就形成长度为n的字符串。
matrix矩阵如下(矩阵i行j列的权值是结点i转移到结点j的方案数):
n=1
2 1 0 0 0
2 1 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
n=2
6 3 0 0 0
6 3 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0

代码+注释:

#include<cstdio>
#include<cstring>
#include<iostream> 
#include<queue>
#define ll long long
using namespace std;
int ch[111][4],f[111],sz;
int idx[128];            //病毒只有4个字符,可以简单处理 
bool val[111];
/*题目的数据范围是10个长度10的病毒串,所以Trie树中最多101左右个节点,
那么AC自动机整个转移就可以构建一张101*101的邻接矩阵,矩阵i行j列的权值是节点i转移到节点j的方案数。
而进行k次转移,从节点i转移到节点j的方案数是这个矩阵的k次幂,这个结论离散数学的图论有(我没学,只能信了)*/
struct Trie{
    Trie(){ sz = 0; memset(ch,0,sizeof(ch)); memset(val,0,sizeof val);};
    void insert(char *s){
        int u=0;
        for(int i=0;s[i];++i){
            int c=idx[s[i]];
            if(!ch[u][c]) ch[u][c] = ++sz;
            u=ch[u][c];
        }
        val[u]=1;    //val数组标记节点是否为单词结尾,last数组和val数组是同一个数组,没必要都要,所以这里没有last数组 
    }
};
//fail指针没必要初始化,从前往后计算会覆盖上一次的结果 
int getFail(){
    queue<int>q; int u;
    f[0] = 0;
    for(int c=0;c<4;++c){
        u = ch[0][c];
        if(u)  { f[u]=0; q.push(u);}
    }
    while(!q.empty()){
        int r=q.front(); q.pop();
        for(int c=0;c<4;++c){
            u=ch[r][c];
            if(!u){
                ch[r][c]=ch[f[r]][c];    //移花接木,因为是从前往后计算的,如果当前位置没有节点,
        //而前面有这条边,则将最近的一个边的出节点复制过来,方便后续寻找fail指针的简化,只要找一次就能得到fail指针
        //因为是将前面的节点移过来,所以不必再对这个节点继续操作了 
                continue;
            }
            q.push(u);
            f[u] = ch[f[r]][c];            //可以直接这样得益于上面移花接木的操作 
            val[u]|=val[ch[f[r]][c]];    //如果该节点的fail指针是单词结尾,这个节点也不能取 
        /*只要算出后缀含有病毒的点即可,因为矩阵是通过相互到达传递的,
        其后的点只有这个危险点能到达,危险点的行和列全是0,则其后的点也不会参与运算。
        可以这样说,0行里危险点的列和其后的列从来都是0,因为不能到达。*/ 
        }
    }
}
struct mat {
    ll matrix[111][111];
    mat() {
        memset(matrix,0,sizeof(matrix));
    }
};
mat operator*(const mat &m1,const mat &m2){
    mat m;
    for(int i=0; i<=sz; ++i){
        for(int j=0; j<=sz; ++j){
            for(int k=0; k<=sz; ++k){
                m.matrix[i][j]+=m1.matrix[i][k]*m2.matrix[k][j];
                m.matrix[i][j]%=100000;
            }
        }
    }
    return m;
}
char str[11];
int m,n;
int main(){
    idx['A']=0; idx['C']=1; idx['T']=2; idx['G']=3;
    while(~scanf("%d%d",&m,&n)) {
        Trie trie;
        while(m--){
            scanf("%s",str);
            trie.insert(str);
        }
        getFail();
        mat res,a;
        for(int i=0;i<=sz;++i)    res.matrix[i][i]=1;
        for(int i=0;i<=sz;++i) {
            if(val[i])    continue;
            for(int j=0;j<4;++j) {
                if(val[ch[i][j]])    continue;
                ++a.matrix[i][ch[i][j]];
            }
        }
        for(int i=0;i<=sz;++i) {//打印矩阵
            for(int j=0;j<=sz;++j) {
                printf("%d ",a.matrix[i][j]);
            }
            puts("");
        } 
        while(n) {
            if(n&1)    res=res*a;
            a=a*a;
            n>>=1;
        }
        for(int i=0;i<=sz;++i) {//打印矩阵
            for(int j=0;j<=sz;++j) {
                printf("%d ",res.matrix[i][j]);
            }
            puts("");
        } 
        ll ans=0;
        for(int i=0;i<=sz;++i)
            ans=(ans+res.matrix[0][i])%100000;
//所有串都是从根节点开始的 
        printf("%lld\n",ans);
    }
}

无注释代码:

#include<cstdio>
#include<cstring>
#include<iostream> 
#include<queue>
#define ll long long
using namespace std;
int ch[111][4],f[111],sz;
int idx[128];
bool val[111];
struct Trie{
    Trie(){ sz = 0; memset(ch,0,sizeof(ch)); memset(val,0,sizeof val);};
    void insert(char *s){
        int u=0;
        for(int i=0;s[i];++i){
            int c=idx[s[i]];
            if(!ch[u][c]) ch[u][c] = ++sz;
            u=ch[u][c];
        }
        val[u]=1;
    }
};
int getFail(){
    queue<int>q; int u;
    f[0] = 0;
    for(int c=0;c<4;++c){
        u = ch[0][c];
        if(u)  { f[u]=0; q.push(u);}
    }
    while(!q.empty()){
        int r=q.front(); q.pop();
        for(int c=0;c<4;++c){
            u=ch[r][c];
            if(!u){
                ch[r][c]=ch[f[r]][c];
                continue;
            }
            q.push(u);
            f[u] = ch[f[r]][c];
            val[u]|=val[ch[f[r]][c]];
        }
    }
}
struct mat {
    ll matrix[111][111];
    mat() {
        memset(matrix,0,sizeof(matrix));
    }
};
mat operator*(const mat &m1,const mat &m2){
    mat m;
    for(int i=0; i<=sz; ++i){
        for(int j=0; j<=sz; ++j){
            for(int k=0; k<=sz; ++k){
                m.matrix[i][j]+=m1.matrix[i][k]*m2.matrix[k][j];
                m.matrix[i][j]%=100000;
            }
        }
    }
    return m;
}
char str[11];
int m,n;
int main(){
    idx['A']=0; idx['C']=1; idx['T']=2; idx['G']=3;
    while(~scanf("%d%d",&m,&n)) {
        Trie trie;
        while(m--){
            scanf("%s",str);
            trie.insert(str);
        }
        getFail();
        mat res,a;
        for(int i=0;i<=sz;++i)    res.matrix[i][i]=1;
        for(int i=0;i<=sz;++i) {
            if(val[i])    continue;
            for(int j=0;j<4;++j) {
                if(val[ch[i][j]]) continue;
                ++a.matrix[i][ch[i][j]];
            }
        }
        while(n) {
            if(n&1)    res=res*a;
            a=a*a;
            n>>=1;
        }
        ll ans=0;
        for(int i=0;i<=sz;++i)
            ans=(ans+res.matrix[0][i])%100000;
        printf("%lld\n",ans);
    }
}