##[$P3796$ 【模板】$AC$自动机(加强版)](https://www.luogu.com.cn/problem/P3796) 作为模板$2$,这道题的解法也是十分的经典。 我们先来分析一下题目:输入和模板$1$一样 ### 对比简单版 **$P3808$ 【模板】$AC$自动机(简单版)** > 给定 $n$ 个模式串 $s_i$ 和一个文本串 $t$,求有多少个不同的模式串在文本串里出现过。两个模式串不同当且仅当他们编号不同。 **$P3796$ 【模板】$AC$ 自动机(加强版)** > 有 $N$ 个由小写字母组成的模式串以及一个文本串 $T$。每个模式串可能会在文本串中出现多次。你需要找出哪些模式串在文本串 $T$ 中出现的次数最多。 我们发现,加强版有两个要求: * **求出现次数最多的次数** * **求出现次数最多的模式串** 明显,我们如果 **统计出每一个模式串在文本串出现的次数**,那么这道题就变得十分简单了,那么问题就变成了如何统计每个模式串出现的次数。 --- ### $AC$自动机 首先题目统计的是 **出现次数最多的字符串,所以有重复的字符串是没有关系的。(因为后面的会覆盖前面的,统计的答案也是一样的)** 那么我们就将标记模式串的$flag$设为当前是第几个模式串。就是下面插入$insert$时的变化: ```cpp {.line-numbers} cnt[p]++; 变为 id[p] = x;//x表示该字符串是第x个输入的 ``` 求$Fail$指针没有变化,原先怎么求就怎么求。 ### 查询 我们开一个数组$cnt$,表示第$i$个字符串出现的次数。 因为是重复计算,所以不能标记为$-1$了。 我们每经过一个点,如果有 **模式串标记号**,就将$cnt[$模式串标记号$]++$。然后继续跳$ne$,原因上面说过了。 这样我们就可以将每个模式串的出现次数统计出来。剩下的大家应该都会! ### 实现代码 ```cpp {.line-numbers} #include #include #include #include using namespace std; const int N = 1000010; char s[150 + 10][70 + 10]; //模式串,第一维是多少个,第二维是具体的字符 char T[N]; //文本串 ,长度最大10^6 int n; //模式串数量 int cnt[N]; //每个模式串出现的次数 int tr[N][26], idx; // Trie树 int id[N]; // 节点号-mapping->模式串 void insert(char *s, int x) { int p = 0; for (int i = 0; s[i]; i++) { int t = s[i] - 'a'; if (!tr[p][t]) tr[p][t] = ++idx; p = tr[p][t]; } id[p] = x; //记录:节点号-mapping->模式串 } //构建AC自动机 int q[N], ne[N]; void bfs() { int hh = 0, tt = -1; for (int i = 0; i < 26; i++) if (tr[0][i]) q[++tt] = tr[0][i]; while (hh <= tt) { int p = q[hh++]; for (int i = 0; i < 26; i++) { int t = tr[p][i]; if (!t) tr[p][i] = tr[ne[p]][i]; else { ne[t] = tr[ne[p]][i]; q[++tt] = t; } } } } //查询字符串s在AC自动机中出现的次数 void query(char *s) { int p = 0; for (int i = 0; s[i]; i++) { p = tr[p][s[i] - 'a']; for (int j = p; j; j = ne[j]) if (id[j]) cnt[id[j]]++; //如果有模式串标记,更新出现次数 } } int main() { //加快读入 ios::sync_with_stdio(false), cin.tie(0); while (cin >> n && n) { //每次清空 memset(tr, 0, sizeof tr); memset(cnt, 0, sizeof cnt); memset(ne, 0, sizeof ne); memset(id, 0, sizeof id); idx = 0; for (int i = 1; i <= n; i++) { cin >> s[i]; insert(s[i], i); } bfs(); cin >> T; query(T); int Max = 0; for (int i = 1; i <= n; i++) Max = max(cnt[i], Max); //最后统计答案 printf("%d\n", Max); //最大值可能很多个模式串匹配到,需要在获取完最大值后,再次循环输出符合最大值条件的所有模式串 for (int i = 1; i <= n; i++) if (cnt[i] == Max) printf("%s\n", s[i]); } return 0; } ```