KMP模式匹配算法中next和nextval的求解 kmp next

KMP算法是模式匹配专用算法。

它是在已知模式串的next或nextval数组的基础上执行的。如果不知道它们二者之一,就没法使用KMP算法,因此我们需要计算它们。

KMP算法由两部分组成:

第一部分,计算模式串的next或nextval数组。

第二部分,利用计算好的模式串的nextval数组,进行模式匹配。

KMP算法中有next数组和nextval数组之分。他们代表的意义和作用完全一样,完全可以混用。唯一不同的是,next数组在一些情况下有些缺陷,而nextval是为了弥补这个缺陷而产生的。

一、求解next

步骤:next数组值的程序设计求解方法:首先可以肯定的是第一位的next值为0,第二位的next值为1,后面求解每一位的next值时,根据前一位进行比较。首先将前一位与其next值对应的内容进行比较,如果相等,则该位的next值就是前一位的next值加上1;如果不等,向前继续寻找next值对应的内容来与前一位进行比较,直到找到某个位上内容的next值对应的内容与前一位相等为止,则这个位对应的值加上1即为需求的next值;如果找到第一位都没有找到与前一位相等的内容,那么需求的位上的next值即为1。

举例:
模式串 a ba a bc a c
next值 0 11 2 23 1 2
1.前两位必为0,1。
2.计算第三位的时候,看第二位b的next值,为1,则把b和1对应的a进行比较,不同,则第三位a的next的值为1,因为一直比到最前一位,都没有发生比较相同的现象。
3.计算第四位的时候,看第三位a的next值,为1,则把a和1对应的a进行比较,相同,则第四位a的next的值为第三位a的next值加上1,为2。因为是在第三位实现了其next值对应
的值与第三位的值相同。
4.计算第五位的时候,看第四位a的next值,为2,则把a和2对应的b进行比较,不同,则再将b对应的next值1对应的a与第四位的a进行比较,相同,则第五位的next值为第二位b的
next值加上1,为2。因为是在第二位实现了其next值对应的值与第四位的值相同。
5.计算第六位的时候,看第五位b的next值,为2,则把b和2对应的b进行比较,相同,则第六位c的next值为第五位b的next值加上1,为3,因为是在第五位实现了其next值对应的
值与第五位相
6.计算第七位的时候,看第六位c的next值,为3,则把c和3对应的a进行比较,不同,则再把第3位a的next值1对应的a与第六位c比较,仍然不同,则第七位的next值为1。
7.计算第八位的时候,看第七位a的next值,为1,则把a和1对应的a进行比较,相同,则第八位c的next值为第七位a的next值加上1,为2,因为是在第七位和实现了其next值对应的值与第七位相同。

二、求解nextval:

 求nextval数组值有两种方法,一种是不依赖next数组值直接用观察法求得,一种方法是根据next数组值进行推理,两种方法均可使用,视更喜欢哪种方法而定。
  本文主要分析nextval数组值的第二种方法:
  模式串 a b a a b c a c
  next值 0 1 1 2 2 3 1 2
  nextval值 0 1 0 2 1 3 0 2

  1.第一位的nextval值必定为0,第二位如果于第一位相同则为0,如果不同则为1。
  2.第三位的next值为1,那么将第三位和第一位进行比较,均为a,相同,则,第三位的nextval值为0。
  3.第四位的next值为2,那么将第四位和第二位进行比较,不同,则第四位的nextval值为其next值,为2。
  4.第五位的next值为2,那么将第五位和第二位进行比较,相同,第二位的next值为1,则继续将第二位与第一位进行比较,不同,则第五位的nextval值为第二位的next值,为1。
  5.第六位的next值为3,那么将第六位和第三位进行比较,不同,则第六位的nextval值为其next值,为3。
  6.第七位的next值为1,那么将第七位和第一位进行比较,相同,则第七位的nextval值为0。
  7.第八位的next值为2,那么将第八位和第二位进行比较,不同,则第八位的nextval值为其next值,为2。

三、next和nextval比较

Next数组的缺陷举例如下:

比如主串是“aab…..”省略号代表后面还有字符。

模式串“aac”

通过计算aac的next数组为012(另外,任何字符串的第二位字符的next总是1,因此你可以认为他固定为1)

当模式串在字符c上失配时,会跳到第2个字符,然后再和主串当前失配的字符重新比较,即此处用模式串的第二个a和主串的b比较

即aabaac

显然a也不等于b。然后会跳到1,接着比,然后又失配,直到最后才使主串后移一位。

而“aac”的nextval数组为002当在c失配时会跳到2,若还失配就直接跳到0,比next数组少比较了1次。

在如果模式串很长的话,那可以省去很多比较,因此你应该使用nextval数组。

四、严蔚敏

上:http://v.youku.com/v_show/id_XODYxNjExODQ=.html第 34分钟开始

下:http://www.56.com/u28/v_NjAwMzA0ODA.html

五、代码实现:
public static void main(String [] args) throws IOException{//main函数,输入主串和模式串
System.out.print("请输入主串:");
KMP模式匹配算法中next和nextval的求解 kmp next
Scanner sn1 = new Scanner(System.in);
String s1 = sn1.next();
System.out.print("请输入模式串:");
Scanner sn2 = new Scanner(System.in);
String s2 = sn2.next();
char [] s3 = s1.toCharArray();
char [] s4 = s2.toCharArray();
System.out.print(KMP_test(s3,s4));
}

public static int KMP_test(char [] s, char [] t){// 主串顺序匹配
int [] next = next(t);
int i = 0, j = 0;
while(i
if(j == -1 || s[i] == t[j]){
++i;
++j;
}else{
j = next[j];
}
}
System.out.println(i);
if(j
return 0;
}else{
return i-t.length;
}
}

public static int [] next(char [] t){// next函数求解
int i = 0, j = -1;
int [] next = new int[t.length];
next[0] = -1;
while(i
if(j == -1 || t[i] == t[j]){
++i;
++j;
next[i] = j;
}
else
j = next[j];
}
System.out.println(Arrays.toString(next));
return next;
}
对于改进的KMP算法,只需要把next函数换为nextval函数就行了
public static int [] next(char [] t){
int i = 0, j = -1;
int [] next = new int[t.length];
next[0] = -1;
while(i
if(j == -1 || t[i] == t[j]){
++i;
++j;
if (t[i] != t[j]) {
next[i] = j;
} else {
next[i] = next[j];
}
}
else
j = next[j];
}
System.out.println(Arrays.toString(next));
return next;
}

  

爱华网本文地址 » http://www.aihuau.com/a/25101011/96932.html

更多阅读

RAM和ROM的区别 手机中ram和rom的区别

RAM和ROM的区别——简介RAM、ROM 一直是困扰不少用户的两个概念。很多手机用户不知道 RAM 和 ROM 到底有什么区别,总是一知半解,云雾缭绕。如今,小编为您解答,告诉您到底 RAM 和 ROM 有哪些区别。RAM和ROM的区别——RAM和ROM的区别RAM

定语从句中which和that的区别 as引导的定语从句

-----------------------------------------------------------只能用that的情况:<1>关系代词在定语从句中作表语,不管是人或物只能用that。He is not the man that he was when I first sawhim.【他现在不是我第一次见他时那样的。

vector 在c++中resize 和reserve的区别 resize和reserve

一、 resize和reservehttp://www.diybl.com/course/3_program/c/c_js/2007109/77298.htmlresize就是重新分配大小,reserve就是预留一定的空间。这两个接口即存在差别,也有共同点。下面就它们的细节进行分析。为实现resize的语义,resiz

癌症治疗中化疗和放疗的区别 癌症为什么不要放化疗

什么叫放疗?放疗是癌症三大治疗手段之一.是用各种不同能量的射 线照射癌症.以抑制和杀灭癌细胞的一种治疗方法.放疗可单 独使用.也可与手术.化疗等配合.作为综合治疗的一部分.以 提高癌症的治愈率.在手术前先作一段放疗使癌症体积缩

声明:《KMP模式匹配算法中next和nextval的求解 kmp next》为网友动我媳妇者死分享!如侵犯到您的合法权益请联系我们删除