算法与数据结构考研试题精析第二版第4章串答案Word格式文档下载.docx
《算法与数据结构考研试题精析第二版第4章串答案Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《算法与数据结构考研试题精析第二版第4章串答案Word格式文档下载.docx(17页珍藏版)》请在冰豆网上搜索。
=j<
=t.len)。
算法思想是对每个i(1<
=s.len,即程序中第一个WHILE循环),来求从i开始的连续字符串与从j(1<
=t.len,即程序中第二个WHILE循环)开始的连续字符串的最大匹配。
程序中第三个(即最内层)的WHILE循环,是当s中某字符(s[i])与t中某字符(t[j])相等时,求出局部公共子串。
若该子串长度大于已求出的最长公共子串(初始为0),则最长公共子串的长度要修改。
程序(a):
(1)(i+k<
=s.len)AND(j+k<
=t.len)AND(s[i+k]=t[j+k])
//如果在s和t的长度内,对应字符相等,则指针k后移(加1)。
(2)con:
=false//s和t对应字符不等时置标记退出
(3)j:
=j+k//在t串中,从第j+k字符再与s[i]比较
(4)j:
=j+1//t串取下一字符
(5)i:
=i+1//s串指针i后移(加1)。
程序(b):
(1)i+k<
=s.len&
&
j+k<
=t.len&
s[i+k]==t[j+k]//所有注释同上(a)
(2)con=0(3)j+=k(4)j++(5)i++
15.
(1)0
(2)next[k]
16.
(1)i:
=i+1
(2)j:
=j+1(3)i:
=i-j+2(4)j:
=1;
(5)i-mt(或i:
=i-j+1)(6)0
17.程序中递归调用
(1)ch1<
>
midch//当读入不是分隔符&
和输入结束符$时,继续读入字符
(2)ch1=ch2//读入分隔符&
后,判ch1是否等于ch2,得出真假结论。
(3)answer:
=true
(4)answer:
=false
(5)read(ch)
(6)ch=endch
18.
(1)initstack(s)//栈s初始化为空栈。
(2)setnull(exp)//串exp初始化为空串。
(3)chinopset//判取出字符是否是操作符。
(4)push(s,ch)//如ch是运算符,则入运算符栈s。
(5)sempty(s)//判栈s是否为空。
(6)succ:
=false//若读出ch是操作数且栈为空,则按出错处理。
(7)exp(8)ch//若ch是操作数且栈非空,则形成部分中缀表达式。
(9)exp(10)gettop(s)//取栈顶操作符。
(11)pop(s)//操作符取出后,退栈。
(12)sempty(s) //将pre的最后一个字符(操作数)加入到中缀式exp的最后。
四.应用题
1.串是零个至多个字符组成的有限序列。
从数据结构角度讲,串属于线性结构。
与线性表的特殊性在于串的元素是字符。
2.空格是一个字符,其ASCII码值是32。
空格串是由空格组成的串,其长度等于空格的个数。
空串是不含任何字符的串,即空串的长度是零。
3.最优的T(m,n)是O(n)。
串S2是串S1的子串,且在S1中的位置是1。
开始求出最大公共子串的长度恰是串S2的长度,一般情况下,T(m,n)=O(m*n)。
4.朴素的模式匹配(Brute-Force)时间复杂度是O(m*n),KMP算法有一定改进,时间复杂度达到O(m+n)。
本题也可采用从后面匹配的方法,即从右向左扫描,比较6次成功。
另一种匹配方式是从左往右扫描,但是先比较模式串的最后一个字符,若不等,则模式串后移;
若相等,再比较模式串的第一个字符,若第一个字符也相等,则从模式串的第二个字符开始,向右比较,直至相等或失败。
若失败,模式串后移,再重复以上过程。
按这种方法,本题比较18次成功。
5.KMP算法主要优点是主串指针不回溯。
当主串很大不能一次读入内存且经常发生部分匹配时,KMP算法的优点更为突出.
6.模式串的next函数定义如下:
next[j]=
根据此定义,可求解模式串t的next和nextval值如下:
j
123456789101112
t串
abcaabbabcab
next[j]
011122312345
nextval[j]
011021301105
7.解法同上题6,其next和nextval值分别为0112123422和0102010422。
8.解法同题6,t串的next和nextval函数值分别为0111232和0110132。
9.解法同题6,其next和nextval值分别为011123121231和011013020131。
10.p1的next和nextval值分别为:
0112234和0102102;
p2的next和nextval值分别为:
0121123和0021002。
11.next数组值为011234567改进后的next数组信息值为010101017。
12.011122312。
13.next定义见题上面6和下面题20。
串p的next函数值为:
01212345634。
14.
(1)S的next与nextval值分别为012123456789和002002002009,p的next与nextval值分别为012123和002003。
(2)利用BF算法的匹配过程:
利用KMP算法的匹配过程:
第一趟匹配:
aabaabaabaac第一趟匹配:
aabaabaabaac
aabaac(i=6,j=6)aabaac(i=6,j=6)
第二趟匹配:
aabaabaabaac第二趟匹配:
aa(i=3,j=2)(aa)baac
第三趟匹配:
aabaabaabaac第三趟匹配:
a(i=3,j=1)(成功)(aa)baac
第四趟匹配:
aabaabaabaac
aabaac(i=9,j=6)
第五趟匹配:
aa(i=6,j=2)
第六趟匹配:
a(i=6,j=1)
第七趟匹配:
(成功)aabaac(i=13,j=7)
15.
(1)p的nextval函数值为0110132。
(p的next函数值为0111232)。
(2)利用KMP(改进的nextval)算法,每趟匹配过程如下:
abcaabbabcabaacbacba
abcab(i=5,j=5)
abc(i=7,j=3)
a(i=7,j=1)
第四趟匹配:
abcaabbabcabaacbacba
(成功)abcabaa(i=15,j=8)
16.KMP算法的时间复杂性是O(m+n)。
p的next和nextval值分别为01112212321和01102201320。
17.
(1)p的nextval函数值为01010。
(next函数值为01123)
(2)利用所得nextval数值,手工模拟对s的匹配过程,与上面16题类似,为节省篇幅,故略去。
18.模式串T的next和nextval值分别为0121123和0021002。
19.第4行的p[J]=p[K]语句是测试模式串的第J个字符是否等于第K个字符,如是,则指针J和K均增加1,继续比较。
第6行的p[J]=p[K]语句的意义是,当第J个字符在模式匹配中失配时,若第K个字符和第J个字符不等,则下个与主串匹配的字符是第K个字符;
否则,若第K个字符和第J个字符相等,则下个与主串匹配的字符是第K个字符失配时的下一个(即NEXTVAL[K])。
该算法在最坏情况下的时间复杂度O(m2)。
20.
(1)当模式串中第一个字符与主串中某字符比较不等(失配)时,next[1]=0表示模式串中已没有字符可与主串中当前字符s[i]比较,主串当前指针应后移至下一字符,再和模式串中第一字符进行比较。
(2)当主串第i个字符与模式串中第j个字符失配时,若主串i不回溯,则假定模式串第k个字符与主串第i个字符比较,k值应满足条件1<
k<
j并且‘p1…pk-1’=‘pj-k+1…pj-1’,即k为模式串向后移动的距离,k值有多个,为了不使向右移动丢失可能的匹配,k要取大,由于max{k}表示移动的最大距离,所以取max{k},k的最大值为j-1。
(3)在上面两种情况外,发生失配时,主串指针i不回溯,在最坏情况下,模式串从第1个字符开始与主串第i个字符比较,以便不致丢失可能的匹配。
21.这里失败函数f,即是通常讲的模式串的next函数,其定义见本章应用题的第6题。
进行模式匹配时,若主串第i个字符与模式串第j个字符发生失配,主串指针i不回溯,和主串第i个字符进行比较的是模式串的第next[j]个字符。
模式串的next函数值,只依赖于模式串,和主串无关,可以预先求出。
该算法的技术特点是主串指针i不回溯。
在经常发生“部分匹配”和主串很大不能一次调入内存时,优点特别突出。
22.失败函数(即next)的值只取决于模式串自身,若第j个字符与主串第i个字符失配时,假定主串不回溯,模式串用第k(即next[j])个字符与第i个相比,有‘p1…pk-1’=‘pj-k+1…pj-1’,为了不因模式串右移与主串第i个字符比较而丢失可能的匹配,对于上式中存在的多个k值,应取其中最大的一个。
这样,因j-k最小,即模式串向右滑动的位数最小,避免因右移造成的可能匹配的丢失。
23.仅从两串含有相等的字符,不能判定两串是否相等,两串相等的充分必要条件是两串长度相等且对应位置上的字符相同(即两串串值相等)。
24.
(1)s1和s2均为空串;
(2)两串之一为空串;
(3)两串串值相等(即两串长度相等且对应位置上的字符相同)。
(4)两串中一个串长是另一个串长(包括串长为1仅有一个字符的情况)的数倍,而且长串就好象是由数个短串经过连接操作得到的。
25、题中所给操作的含义如下:
//:
连接函数,将两个串连接成一个串
substr(s,i,j):
取子串函数,从串s的第i个字符开始,取连续j个字符形成子串
replace(s1,i,j,s2):
置换函数,用s2串替换s1串中从第i个字符开始的连续j个字符
本题有多种解法,下面是其中的一种:
(1)s1=substr(s,3,1)//取出字符:
‘y’
(2)s2=substr(s,6,1)//取出字符:
‘+’
(3)s3=substr(s,1,5)//取出子串:
‘(xyz)’
(4)s4=substr(s,7,1)//取出字符:
‘*’
(5)s5=replace(s3,3,1,s2)//形成部分串:
‘(x+z)’
(6)s=s5//s4//s1//形成串t即‘(x+z)*y’
五、算法设计
1、[题目分析]判断字符串t是否是字符串s的子串,称为串的模式匹配,其基本思想是对串s和t各设一个指针i和j,i的值域是0..m-n,j的值域是0..n-1。
初始值i和j均为0。
模式匹配从s0和t0开始,若s0=t0,则i和j指针增加1,若在某个位置si!
=tj,则主串指针i回溯到i=i-j+1,j仍从0开始,进行下一轮的比较,直到匹配成功(j>
n-1),返回子串在主串的位置(i-j)。
否则,当i>
m-n则为匹配失败。
intindex(chars[],t[],intm,n)
//字符串s和t用一维数组存储,其长度分别为m和n。
本算法求字符串t在字符串s中的第一次出现,如是,输出子串在s中的位置,否则输出0。
{inti=0,j=0;
while(i<
=m-n&
j<
=n-1)
if(s[i]==t[j]){i++;
j++;
}//对应字符相等,指针后移。
else{i=i-j+1;
j=0;
}//对应字符不相等,I回溯,j仍为0。
if(i<
j==n){printf(“t在s串中位置是%d”,i-n+1);
return(i-n+1);
}//匹配成功
elsereturn(0);
//匹配失败
}//算法index结束
main()//主函数
{chars[],t[];
intm,n,i;
scanf(“%d%d”,&
m,&
n);
//输入两字符串的长度
scanf(“%s”,s);
//输入主串
scanf(“%s”,t);
//输入子串
i=index(s,t,m,n);
}//程序结束
[程序讨论]因用C语言实现,一维数组的下标从0开始,m-1是主串最后一个字符的下标,n-1是t串的最后一个字符的下标。
若匹配成功,最佳情况是s串的第0到第n-1个字符与t匹配,时间复杂度为o(n);
匹配成功的最差情况是,每次均在t的最后一个字符才失败,直到s串的第m-n个字符成功,其时间复杂度为o((m-n)*n),即o(m*n)。
失败的情况是s串的第m-n个字符比t串某字符比较失败,时间复杂度为o(m*n)。
之所以串s的指针i最大到m-n,是因为在m-n之后,所剩子串长度已经小于子串长度n,故不必再去比较。
算法中未讨论输入错误(如s串长小于t串长)。
另外,根据子串的定义,返回值i-n+1是子串在主串中的位置,子串在主串中的下标是i-n。
2.[问题分析]在一个字符串内,统计含多少整数的问题,核心是如何将数从字符串中分离出来。
从左到右扫描字符串,初次碰到数字字符时,作为一个整数的开始。
然后进行拼数,即将连续出现的数字字符拼成一个整数,直到碰到非数字字符为止,一个整数拼完,存入数组,再准备下一整数,如此下去,直至整个字符串扫描到结束。
intCountInt()
//从键盘输入字符串,连续的数字字符算作一个整数,统计其中整数的个数。
{inti=0,a[];
//整数存储到数组a,i记整数个数
scanf(“%c”,&
ch);
//从左到右读入字符串
while(ch!
=‘#’)//‘#’是字符串结束标记
if(isdigit(ch))//是数字字符
{num=0;
//数初始化
while(isdigit(ch)&
ch!
=‘#’)//拼数
{num=num*10+‘ch’-‘0’;
scanf(“%c”,&
}
a[i]=num;
i++;
if(ch!
=‘#’)scanf(“%c”,&
//若拼数中输入了‘#’,则不再输入
}//结束while(ch!
=‘#’)
printf(“共有%d个整数,它们是:
”i);
for(j=0;
j<
i;
j++)
{printf(“%6d”,a[j]);
if((j+1)%10==0)printf(“\n”);
}//每10个数输出在一行上
}//算法结束
[算法讨论]假定字符串中的数均不超过32767,否则,需用长整型数组及变量。
3、[题目分析]设以字符数组s表示串,重复子串的含义是由一个或多个连续相等的字符组成的子串,其长度用max表示,初始长度为0,将每个局部重复子串的长度与max相比,若比max大,则需要更新max,并用index记住其开始位置。
intLongestString(chars[],intn)
//串用一维数组s存储,长度为n,本算法求最长重复子串,返回其长度。
{intindex=0,max=0;
//index记最长的串在s串中的开始位置,max记其长度
intlength=1,i=0,start=0;
//length记局部重复子串长度,i为字符数组下标
while(i<
n-1)
if(s[i]==s[i+1]){i++;
length++;
}
else//上一个重复子串结束
{if(max<
length){max=length;
index=start;
}//当前重复子串长度大,则更新max
i++;
start=i;
length=1;
//初始化下一重复子串的起始位置和长度
printf(“最长重复子串的长度为%d,在串中的位置%d\n”,max,index);
return(max);
}//算法结束
[算法讨论]算法中用i<
n-1来控制循环次数,因C数组下标从0开始,故长度为n的串,其最后一个字符下标是n-1,当i最大为n-2时,条件语句中s[i+1]正好是s[n-1],即最后一个字符。
子串长度的初值数为1,表示一个字符自然等于其身。
算法的时间复杂度为O(n),每个字符与其后继比较一次。
4、[题目分析]教材中介绍的串置换有两种形式:
第一种形式是replace(s,i,j,t),含义是将s串中从第i个字符开始的j个字符用t串替换,第二种形式是replace(s,t,v),含义是将s串中所有非重叠的t串用v代替。
我们先讨论第一种形式的替换。
因为已经给定顺序存储结构,我们可将s串从第(i+j-1)到串尾(即s.curlen)移动t.curlen-j绝对值个位置(以便将t串插入):
若j>
t.curlen,则向左移;
若j<
t.curlen,则向右移动;
若j=t.curlen,则不必移动。
最后将t串复制到s串的合适位置上。
当然,应考虑置换后的溢出问题。
intreplace(strtps,t,inti,j)
//s和t是用一维数组存储的串,本算法将s串从第i个字符开始的连续j个字符用t串置换,操作成功返回1,否则返回0表示失败。
{if(i<
1||j<
0||t.curlen+s.curlen-j>
maxlen)
{printf(“参数错误\n”);
exit(0);
}//检查参数及置换后的长度的合法性。
if(j<
t.curlen)//若s串被替换的子串长度小于t串长度,则s串部分右移,
for(k=s.curlen-1;
k>
=i+j-1;
k--)s.ch[k+t.curlen-j]=s.ch[k];
elseif(j>
t.curlen)//s串中被替换子串的长度小于t串的长度。
for(k=i-1+j;
=s.curlen-1;
k++)s.ch[k-(j-t.curlen)]=s.ch[k];
for(k=0;
t.curlen;
k++)s.ch[i-1+k]=t.ch[k];
//将t串复制到s串的适当位置
if(j>
t.curlen)s.curlen=s.curlen-(j-t.curlen);
elses.curlen=s.curlen+(t.curlen-j);
[算法讨论]若允许使用另一数组,在检查合法性后,可将s的第i个(不包括i)之前的子串复制到另一子串如s1中,再将t串接到s1串后面,然后将s的第i+j直到尾的部分加到s1之后。
最后将s1串复制到s。
主要语句有:
for(k=0;
i;
k++)s1.ch[k]=s.ch[k];
//将s1第i个字符前的子串复制到s1,这时k=i-1
k++)s1.ch[i+k]=t.ch[k]//将t串接到s1的尾部
l=s.curlen+t.curlen-j-1;
for(k=s.curlen-1;
i-1+j;
k--);
//将子串第i+j-1个字符以后的子串复制到s1
s1.ch[l--]=s.ch[k]
s.curlen+t.curlen-j;
k++)s.ch[k]=s1.ch[k];
//将结果串放入s。
下面讨论replace(s,t,v)的算法。
该操作的意义是用串v替换所有在串s中出现的和非空串t相等的不重叠的子串。
本算法不指定存储结构,只使用串的基本运算。
voidreplace(strings,t,v)
//本算法是串的置换操作,将串s中所有非空串t相等且不重复的子串用v代替。
{i=index(s,t);
//判断s是否有和t相等的子串
if(i!
=0)//串s中包含和t相等的子串
{creat(temp,”);
//creat操作是将串常量(此处为空串)赋值给temp。
m=length(t);
n=length(s);
//求串t和s的长度
while(i!
=0)
{assign(temp,concat(temp,substr(s,1,i-1),v));
//用串v替换t形成部分结果
assign(s,substr(s,i+m,n-i-m+1));
//将串s中串后的部分形成新的s串
n=n-(i-1)-m;
//求串s的长度
i=index(s,t);
//在新s串中再找串t的位置
assign(s,contact(temp,s));
//将串temp和剩余的串s连接后再赋值给s
}//if结束
5、[题目分析]本题是字符串的插入问题,要求在字符串s的pos位置,插入字符串t。
首先应查找字符串s的pos位置,将第pos个字符到字符串s尾的子串向后移动字符串t的长度,然后将字符串t复制到字符串s的第pos位置后。
对插入位置pos要验证其合法性,小于1或大于串s的长度均为非法,因题目假设给字符串s的空间足够大,故对插入不必判溢出。
voidinsert(char*s,char*t,intpos)
//将字符串t插入字符串s的第pos个位置。
{inti=1,x=0;
char*p=s,*q=t;
//p,q分别为字符串s和t的工作指针
if(pos<
1){printf(“pos参数位置非法\n”);
while(*p!
=’\0’&
i<
pos){p++;
i++;
}//查pos位置
//若pos小于串s长度,则查到p