模式匹配的kmp算法Word格式文档下载.docx

上传人:b****2 文档编号:13312712 上传时间:2022-10-09 格式:DOCX 页数:7 大小:13.21KB
下载 相关 举报
模式匹配的kmp算法Word格式文档下载.docx_第1页
第1页 / 共7页
模式匹配的kmp算法Word格式文档下载.docx_第2页
第2页 / 共7页
模式匹配的kmp算法Word格式文档下载.docx_第3页
第3页 / 共7页
模式匹配的kmp算法Word格式文档下载.docx_第4页
第4页 / 共7页
模式匹配的kmp算法Word格式文档下载.docx_第5页
第5页 / 共7页
点击查看更多>>
下载资源
资源描述

模式匹配的kmp算法Word格式文档下载.docx

《模式匹配的kmp算法Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《模式匹配的kmp算法Word格式文档下载.docx(7页珍藏版)》请在冰豆网上搜索。

模式匹配的kmp算法Word格式文档下载.docx

若不等,则算法仍然把模式串P整体向后移动一个字符,此时字符串T与P之间的关系如下

Tp0,p1,p2,…pk-1,pk,…tn-2,tn-1,…tm-2,tm-1

Pp0,…pk-3,pk-2,…,pn-1(第三次比较)

算法依照同样的次序,首先对P中字符p0与T中字符p2进行比较,若相等,则顺序比较后续的字母;

若不等,则把字符串P整体向后移动一个字符。

仔细考虑上述过程,可能会发现:

在第二轮比较开始是,首先进行比较的字符是p0和p1,其次进行的是p1和p2;

在第三轮比较开始时,首先进行比较的是p0与p2,其次进行的是p1和p3。

而p0,p1,p2,p3全部是字符串P中的字符,它们之间的关系可以在调用字符串匹配算法前就确定下来。

KMP算法正式利用这种思想,算法在对字符串进行匹配前,先计算出,模式串P中个字符的关系,然后再依据此关系对模式串与目标串T进行匹配。

在上述过程中,记录字符串P中各个字符之间关系的函数成为字符串P的失效函数。

下面是失效函数获取的办法(对于P=“caatcat”):

首先确定函数的定义域,失效函数自变量j的取值范围是模式串在失配前匹配的字符个数,那么它的定义域为j{0,1,2,3,4,5},由此可见失效函数的定义域是0-len(p)-1。

接着是获取失效函数值域的办法,失效函数的取值k定义如下

K{k|0<

=k<

j}

其中,k是满足条件p0p1…pk=pj-kpj-k+1…pj的最大正整数。

这样的k有可能并不存在,此时规定失效函数的取值为-1。

下面是利用上述规则求字符串P的失效函数值域的过程:

当j=0时,由于0<

0,所以满足条件的k并不存在,此时失效函数的取值为-1,即f(0)=-1.

当j=1时,k可能的取值为0,由于p0≠p1,所以k不能取0,此时满足条件的失效函数的值仍为-1,即f

(1)=-1。

当j=2时,k的可能取值为0,1。

由于p0≠p2且p0p1≠p1p2,所以满足条件的k不存在,即f

(2)=-1。

当j=3时,k可能的取值为0,1,2。

由于p0≠p3,p0p1≠p2p3且p0p1p2≠p1p2p3。

所以满足条件的k不存在,即f(3)=-1。

当j=4时,k可能的取值为0,1,2,3。

由于p0=p4,p0p1≠p3p4,p0p1p2≠p2p3p4且p0p1p2p3≠p1p2p3p4。

所以满足条件的k为0,此时f(4)=0。

当j=5时,k可能的取值为0,1,2,3,4。

由于p0≠p5,p0p1=p4p5,p0p1p2

≠p3p4p5,p0p1p2p3≠p2p3p4p5且p0p1p2p3p4≠p1p2p3p4p5,所以f(5)=1;

同理可求当j=6时,f(6)=-1。

求完模式串p的失效函数后,就可以应用KMP算法对它进行匹配。

具体的匹配过程分为两种情况。

假设在进行某一轮比较时,失配的情况发生在模式p的第j位,那么如果j=0,则让目标的指针前进一位,模式串的起始比较地址回到P0处。

否则,在进行下一轮的比较时,目标指针不发生回溯,仍指向失配的位置,而模式串的起始比较地址为Pf(j-1)+1.由失效函数的计算过程可见,函数f(j)仅与字符串P有关,而与目标串无关。

所以只需给定模式字符串P,无论目标字符串T的取值是什么,均可应用同一个失配函数对它匹配。

例子

模式串P=”caatcat”,目标串T=”ctcaatcacaatcat”。

第一次比较:

Tctcaatcacaatcat

Pcaatcat

第二轮比较:

Pcaatcat

第三轮比较:

Pcaatcat

第四轮比较:

第一轮比较,模式串与目标串在第二个字符处发生匹配。

算法检测到失陪后结束本轮比较,并且指针不发生回溯,仍指向失配位置。

由于失配发生在第二个字符处,此时j=1,所以模式匹配P在下一轮匹配时的起始比较地址是Pf(1-1)+1,即p0。

第二轮比较中,由于模式字符串P所在的第一个字符处发生失配,此时j=0,所以让目标的指针前进一位,模式的其实比较位置回到p0。

接着进行第三轮比较。

模式串P中的第7个字符发生失配,此时j=6。

可知下一轮匹配的起始比较位置为Pf(6-1)+1,即p2。

目标指针不发生回溯,仍指向失配位置。

接着进行第四轮匹配,第四轮匹配成功。

Tctcaatcacaatcat

Pcaatcat(成功)

#include<

stdio.h>

string.h>

charstr[1000],st[1000];

intnext[1000];

voidgetf()

{

intj=0,k=-1,m;

next[0]=-1;

m=strlen(st);

while(j<

m)

{

if(k==-1||st[j]==st[k])

{

j++;

k++;

if(st[j]!

=st[k])

next[j]=k;

elsenext[j]=next[k];

}

elsek=next[k];

}

for(j=0;

j<

m;

j++)

printf("

%d"

next[j]);

}

intKMP()

inti=0,j=0;

memset(next,0,sizeof(next));

getf();

intm=strlen(str);

intn=strlen(st);

while(i<

m&

&

n)

if(j==-1||str[i]==st[j])

i++;

j++;

elsej=next[j];

if(j>

=n)

return(i-n);

elsereturn-1;

intmain()

gets(str);

gets(st);

intk=KMP();

%d\n"

k);

return0;

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 小升初

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1