J - 病毒侵袭持续中 HDU - 3065

小t非常感谢大家帮忙解决了他的上一个问题。然而病毒侵袭持续中。在小t的不懈努力下，他发现了网路中的“万恶之源”。这是一个庞大的病毒网站，他有着好多好多的病毒，但是这个网站包含的病毒很奇怪，这些病毒的特征码很短，而且只包含“英文大写字符”。当然小t好想好想为民除害，但是小t从来不打没有准备的战争。知己知彼，百战不殆，小t首先要做的是知道这个病毒网站特征：包含多少不同的病毒，每种病毒出现了多少次。大家能再帮帮他吗？

Input

第一行，一个整数N（1<=N<=1000），表示病毒特征码的个数。
接下来N行，每行表示一个病毒特征码，特征码字符串长度在1—50之间，并且只包含“英文大写字符”。任意两个病毒特征码，不会完全相同。
在这之后一行，表示“万恶之源”网站源码，源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符（不包括回车）。

Output

按以下格式每行一个，输出每个病毒出现次数。未出现的病毒不需要输出。
病毒特征码: 出现次数
冒号后有一个空格，按病毒特征码的输入顺序进行输出。

Sample Input

3
AA
BB
CC
ooxxCC%dAAAoen....END

Sample Output

AA: 2
CC: 1

Hint

Hit：
题目描述中没有被提及的所有情况都应该进行考虑。比如两个病毒特征码可能有相互包含或者有重叠的特征码段。
计数策略也可一定程度上从Sample中推测。

        
 AC自动机模板题

只有一个文本串进行匹配，题目要求记录文本串中出现多少个病毒特征码（注意不是多少种），那么在遍历后缀时

不用做标记，直接遍历到底即可。

#include<stdio.h>
#include<string.h>
#include<algorithm>
#include<math.h>
#include<queue>
#include<iostream>
using namespace std;
const int maxn=5e4+7;
const int branch=27;
queue<int> mmp;
int val[1010];//存放病毒特征码出现的次数
class AcTireNode
{
public:
    int next[branch];
    int id,flag;//0为初始值  num记录该病毒编号   flag记录该节点被flag编号的文本遍历了
    int fail;
    void clear()
    {
        fail=0;
        for(int i=0; i<branch; ++i)
            next[i]=-1;
        id=flag=0;
    }
};
class AcTire
{
private:
    AcTireNode *node;
    int top;
public:
    AcTire()
    {
        node=new AcTireNode[maxn];
        node[0].clear();
        top=0;
    }
    int hash_letter(char c)
    {
        if(c>='A'&&c<='Z')
         return c-'A';
        return 26;
    }
    void insert(char *s,int num)
    {
        int now=0;
        while(*s)
        {
            int i=hash_letter(*s);
            if(node[now].next[i]==-1)
            {
                node[now].next[i]=++top;
                node[top].clear();
            }
            now=node[now].next[i];
            ++s;
        }
        node[now].id=num;
    }
    void Bulid_fail()//作用实现：找到每个节点所代表字符串的最大匹配
    {
        int now,to;
        for(int i=0; i<branch; ++i)
        {
            if(node[0].next[i]!=-1)
                mmp.push(node[0].next[i]);
        }
        while(!mmp.empty())
        {
            now=mmp.front();
            mmp.pop();
            for(int i=0; i<branch; ++i)
            {
                if(node[now].next[i]!=-1)
                {
                    mmp.push(node[now].next[i]);
                    to=node[now].fail;
                    while(to>0&&node[to].next[i]==-1)
                        to=node[to].fail;
                    if(node[to].next[i]!=-1)
                        to=node[to].next[i];
                    node[node[now].next[i]].fail=to;
                }
            }
        }
    }
    void Find_tx(char *tx)//计算文本串中所有病毒特征码出现的次数
    {
        int now=0;
        int to;
        while(*tx)
        {
            int i=hash_letter(*tx);
            while(now>0&&node[now].next[i]==-1)
                now=node[now].fail;
            if(node[now].next[i]!=-1)//有匹配的后缀
            {
                now=node[now].next[i];
                to=now;//开始找所有后缀匹配
                while(to>0)//这个节点 曾经是否被这个字符串 遍历过
                {
                    if(node[to].id)
                        val[node[to].id]++;
                    to=node[to].fail;
                }
            }
            ++tx;
        }
    }
    void init()
    {
        top=0;
        node[0].clear();
    }
    ~AcTire()
    {
        delete []node;
    }
};
char tx[2001000],str[1010][60];
int main()
{
    AcTire dch;
    int n;
    while(~scanf("%d",&n))
    {
        dch.init();
        for(int i=1; i<=n; ++i)
        {
            scanf("%s",str[i]);
            dch.insert(str[i],i);
        }
        dch.Bulid_fail();
        scanf("%s",tx);
        memset(val,0,sizeof(val));
        dch.Find_tx(tx);
        for(int i=1;i<=n;++i)
        {
            if(val[i])
                printf("%s: %d\n",str[i],val[i]);
        }
    }
    return 0;
}