You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

59 lines
3.4 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

#include <bits/stdc++.h>
using namespace std;
const int N = 100010; //模板串最大长度限制
const int M = 1000010; //模式串最大长度限制
int n; //模板串长度
int m; //模式串长度
int ne[N]; //next数组
char s[M]; //模式串
char p[N]; //模板串
/**
KMP的思想
1、先考虑一下暴力怎么做
2、因为暴力作法在对比多次后失败后需要回到头才能跟目标串的下一个字符开始匹配效率太差需要优化。
3、优化的思路受暴力作法的启发试图在匹配过程中找到一些可以重复利用的特征加快匹配的速度即不想完全从头再次对比了能少退就少退。
4、经画图可以发现如果我们能整理出一套模板串前缀与后缀的公共子中的最大长度发生不匹配的时候不用跳到头按最大前后匹配子串长度
跳最省时间。如果这时再发生对比不匹配问题,就再次尝试较小一点的前后缀相同字符,依此类推,直到退无可退,那就从头开始对比。
KMP匹配过程对于模板串我们先提前预处里出ne数组然后在匹配的时候如果当前位置的模式串和模板串匹配那么指针向后移动
如果当前位置的模式串和模板串不匹配,我们就要将模板串的指针移动到 ne[j] 的位置继续匹配,
当j移动到模板串最后的位置(等于模板串的长度),就说明匹配成功,模板串是模式串的字串。
最长相等前后缀-(最长公共前后缀)
*/
int main() {
cin >> n >> (p + 1) >> m >> (s + 1);
//一、求ne数组
//i:当前试图进行匹配的S串字符j+1是模板串当前试图与S串i位置进行匹配的字符
//j:退无可退,无需再退
//i:是从2开始的因为ne[1]=0,表示第1个不匹配只能重头开始不用算
for (int i = 2, j = 0; i <= n; i++) {
while (j && p[i] != p[j + 1]) j = ne[j];
//如果是匹配情况发生了那么j移动到下一个位置
if (p[i] == p[j + 1]) j++;
//记录j到ne数组中
ne[i] = j;
}
/**
KMP算法对蛮力算法的修改就两点第一点是失配时i不动j不再回到模式串开头而是回到ne[j]
另外当j = ne[j] = 0表示模式串退到了通配符哨兵此时文本串指针i应该右移一位
j也应该从头比对同样是i++j++,与匹配时的动作一致。
*/
//二、匹配字符串
//i:当前试图进行对比的S串位置
//j:最后一个已完成匹配的P串位置那么当前试图与S串当前位置i进行尝试对比匹配的位置是j+1
for (int i = 1, j = 0; i <= m; i++) {
while (j && s[i] != p[j + 1]) j = ne[j];//不行就退吧,当j==0时表示退无可退无需再退
//如果是匹配情况发生了那么j移动到下一个位置
if (s[i] == p[j + 1]) j++; //匹配则指针前行i不用++因为它在自己的for循环中自带++
if (j == n) { //如果匹配到最大长度,说明完成了所有位置匹配
printf("%d ", i - n); //输出开始匹配位置
j = ne[j]; //回退,尝试继续进行匹配,看看还有没有其它可以匹配的位置
}
}
return 0;
}