1、算法与数据结构考研试题精析第二版第4章 串答案第四章 串 一、选择题 1.B2.E3.C4.A5.C6.A7.1D7.2F8.B注9.D10.B 注:子串的定义是:串中任意个连续的字符组成的子序列,并规定空串是任意串的子串,任意串是其自身的子串。若字符串长度为n(n0),长为n的子串有1个,长为n-1的子串有2个,长为n-2的子串有3个,长为1的子串有n个。由于空串是任何串的子串,所以本题的答案为:8*(8+1)/2+1=37。故选B。但某些教科书上认为“空串是任意串的子串”无意义,所以认为选C。为避免考试中的二意性,编者认为第9题出得好。二、判断题1.2.3.三填空题1(1) 由空格字符(A
2、SCII值32)所组成的字符串 (2)空格个数 2字符3任意个连续的字符组成的子序列 45 5.O(m+n)601122312 701010421 8(1)模式匹配 (2)模式串9(1)其数据元素都是字符(2)顺序存储(3)和链式存储(4)串的长度相等且两串中对应位置的字符也相等10两串的长度相等且两串中对应位置的字符也相等。11xyxyxywwy 12*s+=*t+ 或(*s+=*t+)!=013(1)char s (2) j+ (3) i = j14题目分析本题算法采用顺序存储结构求串s和串t的最大公共子串。串s用i指针(1=i=s.len)。t串用j指针(1=j=t.len)。算法思想是
3、对每个i(1=i=s.len,即程序中第一个WHILE循环),来求从i开始的连续字符串与从j(1=j=t.len,即程序中第二个HILE循环)开始的连续字符串的最大匹配。程序中第三个(即最内层)的WHILE循环,是当s中某字符(si)与t中某字符(tj)相等时,求出局部公共子串。若该子串长度大于已求出的最长公共子串(初始为),则最长公共子串的长度要修改。程序(a):(1)(i+k=s.len)AND(j+k=t.len) AND(si+k=tj+k) /如果在s和t的长度内,对应字符相等,则指针k 后移(加1)。 (2)con:=false /s和t对应字符不等时置标记退出 (3)j:=j+k
4、 /在t串中,从第j+k字符再与si比较 (4)j:=j+1 /t串取下一字符(5)i:=i+1 /s串指针i后移(加1)。程序(b):(1) i+k=s.len & j+k=t.len & si+k=tj+k /所有注释同上(a) (2) con=0 (3) j+=k (4) j+ (5) i+15(1)0 (2)nextk16(1)i:=i+1 (2)j:=j+1 (3)i:=i-j+2 (4)j:=1; (5)i-mt(或i:=i-j+1) (6)017.程序中递归调用 (1)ch1midch /当读入不是分隔符&和输入结束符$时,继续读入字符 (2)ch1=ch2 /读入分隔符&后,判
5、ch1是否等于ch2,得出真假结论。 (3)answer:=true (4)answer:=false (5)read(ch) (6)ch=endch18(1)initstack(s) /栈s初始化为空栈。 (2) setnull (exp) /串exp初始化为空串。 (3) ch in opset /判取出字符是否是操作符。 (4) push (s,ch) /如ch是运算符,则入运算符栈s。 (5) sempty (s) /判栈s是否为空。 (6) succ := false /若读出ch是操作数且栈为空,则按出错处理。 (7) exp (8)ch /若ch是操作数且栈非空,则形成部分中缀表
6、达式。 (9) exp (10) gettop(s) /取栈顶操作符。 (11) pop(s) /操作符取出后,退栈。(12) sempty(s) /将pre的最后一个字符(操作数)加入到中缀式exp的最后。四应用题串是零个至多个字符组成的有限序列。从数据结构角度讲,串属于线性结构。与线性表的特殊性在于串的元素是字符。空格是一个字符,其ASCII码值是32。空格串是由空格组成的串,其长度等于空格的个数。空串是不含任何字符的串,即空串的长度是零。最优的T(m,n)是O(n)。串S2是串S1的子串,且在S1中的位置是1。开始求出最大公共子串的长度恰是串S2的长度,一般情况下,T(m,n) =O(m
7、*n)。朴素的模式匹配(BruteForce)时间复杂度是(mn),KMP算法有一定改进,时间复杂度达到(mn)。本题也可采用从后面匹配的方法,即从右向左扫描,比较次成功。另一种匹配方式是从左往右扫描,但是先比较模式串的最后一个字符,若不等,则模式串后移;若相等,再比较模式串的第一个字符,若第一个字符也相等,则从模式串的第二个字符开始,向右比较,直至相等或失败。若失败,模式串后移,再重复以上过程。按这种方法,本题比较18次成功。KMP算法主要优点是主串指针不回溯。当主串很大不能一次读入内存且经常发生部分匹配时,KMP算法的优点更为突出模式串的next函数定义如下: nextj= 根据此定义,可
8、求解模式串t的next和nextval值如下:j1 2 3 4 5 6 7 8 9 10 11 12 t串a b c a a b b a b c a bnextj0 1 1 1 2 2 3 1 2 3 4 5nextvalj0 1 1 0 2 1 3 0 1 1 0 57解法同上题6,其next和nextval值分别为0112123422和010*。8解法同题6,t串的next和nextval函数值分别为0111232和0110132。9解法同题6,其next和nextval 值分别为011123121231和011013020131。10p1的next和nextval值分别为:0112234
9、和0102102;p2的next和nextval值分别为:0121123和0021002。11next数组值为011234567 改进后的next数组信息值为010101017。12011122312。13next定义见题上面6和下面题20。串p的next函数值为:01212345634。14(1)S的next与nextval值分别为012123456789和002002002009,p的next与nextval值分别为012123和002003。 (2)利用BF算法的匹配过程: 利用KMP算法的匹配过程: 第一趟匹配: aabaabaabaac 第一趟匹配:aabaabaabaac aaba
10、ac(i=6,j=6) aabaac(i=6,j=6) 第二趟匹配: aabaabaabaac 第二趟匹配:aabaabaabaac aa(i=3,j=2) (aa)baac 第三趟匹配: aabaabaabaac 第三趟匹配:aabaabaabaac a(i=3,j=1) (成功) (aa)baac第四趟匹配: aabaabaabaac aabaac(i=9,j=6)第五趟匹配: aabaabaabaac aa(i=6,j=2)第六趟匹配: aabaabaabaac a(i=6,j=1)第七趟匹配: aabaabaabaac(成功) aabaac(i=13,j=7) 15(1)p的nextv
11、al函数值为0110132。(p的next函数值为0111232)。(2)利用KMP(改进的nextval)算法,每趟匹配过程如下: 第一趟匹配: abcaabbabcabaacbacba abcab(i=5,j=5) 第二趟匹配: abcaabbabcabaacbacba abc(i=7,j=3) 第三趟匹配: abcaabbabcabaacbacba a(i=7,j=1) 第四趟匹配: abcaabbabcabaac bacba (成功) abcabaa(i=15,j=8)16KMP算法的时间复杂性是O(m+n)。p的next和nextval值分别为01112212321和01102201
12、320。17(1)p的nextval函数值为01010。(next函数值为01123) (2)利用所得nextval数值,手工模拟对s的匹配过程,与上面16题类似,为节省篇幅,故略去。18模式串T的next和nextval值分别为0121123和0021002。19第4行的pJ=pK语句是测试模式串的第J个字符是否等于第K个字符,如是,则指针J和K均增加1,继续比较。第6行的pJ=pK语句的意义是,当第J个字符在模式匹配中失配时,若第K个字符和第J个字符不等,则下个与主串匹配的字符是第K个字符;否则,若第K个字符和第J个字符相等,则下个与主串匹配的字符是第K个字符失配时的下一个(即NEXTVA
13、LK)。 该算法在最坏情况下的时间复杂度O(m2)。20(1)当模式串中第一个字符与主串中某字符比较不等(失配)时,next1=0表示模式串中已没有字符可与主串中当前字符si比较,主串当前指针应后移至下一字符,再和模式串中第一字符进行比较。 (2)当主串第i个字符与模式串中第j个字符失配时,若主串i不回溯,则假定模式串第k个字符与主串第i个字符比较,k值应满足条件1kn-1),返回子串在主串的位置(i-j)。否则,当im-n则为匹配失败。int index(char s,t,int m,n)/字符串s和t用一维数组存储,其长度分别为m和n。本算法求字符串t在字符串s中的第一次出现,如是,输出子
14、串在s中的位置,否则输出0。int i=0,j=0; while (i=m-n & j=n-1) if (si=tj)i+;j+; /对应字符相等,指针后移。 else i=i-j+1;j=0; /对应字符不相等,I回溯,j仍为0。 if(i=m-n & j=n) printf(“t在s串中位置是%d”,i-n+1);return(i-n+1);/匹配成功else return(0); /匹配失败/算法index结束main ()/主函数char s,t; int m,n,i; scanf(“%d%d”,&m,&n); /输入两字符串的长度 scanf(“%s”,s); /输入主串 scanf
15、(“%s”,t); /输入子串 i=index(s,t,m,n);/程序结束程序讨论因用C语言实现,一维数组的下标从0开始,m-1是主串最后一个字符的下标,n-1是t串的最后一个字符的下标。若匹配成功,最佳情况是s串的第0到第n-1个字符与t匹配,时间复杂度为o(n);匹配成功的最差情况是,每次均在t的最后一个字符才失败,直到s串的第m-n个字符成功,其时间复杂度为o(m-n)*n),即o(m*n)。失败的情况是s串的第m-n个字符比t串某字符比较失败,时间复杂度为o(m*n)。之所以串s的指针i最大到m-n,是因为在m-n之后,所剩子串长度已经小于子串长度n,故不必再去比较。算法中未讨论输入
16、错误(如s串长小于t串长)。另外,根据子串的定义,返回值i-n+1是子串在主串中的位置,子串在主串中的下标是i-n。2.问题分析在一个字符串内,统计含多少整数的问题,核心是如何将数从字符串中分离出来。从左到右扫描字符串,初次碰到数字字符时,作为一个整数的开始。然后进行拼数,即将连续出现的数字字符拼成一个整数,直到碰到非数字字符为止,一个整数拼完,存入数组,再准备下一整数,如此下去,直至整个字符串扫描到结束。int CountInt()/ 从键盘输入字符串,连续的数字字符算作一个整数,统计其中整数的个数。int i=0,a; / 整数存储到数组a,i记整数个数scanf(“c”,&ch);/ 从
17、左到右读入字符串while(ch!=#) /#是字符串结束标记if(isdigit(ch)/ 是数字字符num=; / 数初始化while(isdigit(ch)& ch!=#)/ 拼数num=num10+ch-;scanf(“c”,&ch); ai=num;i+;if(ch!=#)scanf(“%c”,&ch); / 若拼数中输入了#,则不再输入 / 结束while(ch!#)printf(“共有%d个整数,它们是:”i);for(j=;ji;j+)printf(“%6d”,aj); if(j+1)10=0)printf(“n”); / 每10个数输出在一行上/ 算法结束算法讨论假定字符串中
18、的数均不超过32767,否则,需用长整型数组及变量。3、题目分析设以字符数组s表示串,重复子串的含义是由一个或多个连续相等的字符组成的子串,其长度用max表示,初始长度为0,将每个局部重复子串的长度与max相比,若比max大,则需要更新max,并用index记住其开始位置。int LongestString(char s,int n)/串用一维数组s存储,长度为n,本算法求最长重复子串,返回其长度。int index=0,max=0; /index记最长的串在s串中的开始位置,max记其长度 int length=1,i=0,start=0; /length记局部重复子串长度,i为字符数组下标
19、 while(in-1) if(si=si+1) i+; length+; else /上一个重复子串结束 if(maxlength) max=length; index=start; /当前重复子串长度大,则更新max i+;start=i;length=1; /初始化下一重复子串的起始位置和长度printf(“最长重复子串的长度为%d,在串中的位置%dn”,max,index);return(max);/算法结束算法讨论算法中用it.curlen,则向左移;若jt.curlen,则向右移动;若j=t.curlen,则不必移动。最后将t串复制到s串的合适位置上。当然,应考虑置换后的溢出问题。
20、int replace(strtp s,t,int i,j)/s和t是用一维数组存储的串,本算法将s串从第i个字符开始的连续j个字符用t串置换,操作成功返回1,否则返回0表示失败。if(i1 | jmaxlen) printf(“参数错误n”);exit(0); /检查参数及置换后的长度的合法性。if(j=i+j-1;k-) s.chk+t.curlen-j=s.chk; else if (jt.curlen) /s串中被替换子串的长度小于t串的长度。 for(k=i-1+j;k=s.curlen-1;k+) s.chk-(j-t.curlen)=s.chk; for(k=0;kt.curle
21、n) s.curlen=s.curlen-(j-t.curlen);else s.curlen=s.curlen+(t.curlen-j);/算法结束算法讨论若允许使用另一数组,在检查合法性后,可将s的第i个(不包括i)之前的子串复制到另一子串如s1中,再将t串接到s1串后面,然后将s的第i+j直到尾的部分加到s1之后。最后将s1串复制到s。主要语句有:for(k=0;ki;k+) s1.chk=s.chk; /将s1第i个字符前的子串复制到s1,这时k=i-1for(k=0;ki-1+j;k-);/将子串第i+j-1个字符以后的子串复制到s1 s1.chl-=s.chkfor(k=0;ks.
22、curlen+t.curlen-j;k+) s.chk=s1.chk;/将结果串放入s。下面讨论replace(s,t,v)的算法。该操作的意义是用串v替换所有在串s中出现的和非空串t相等的不重叠的子串。本算法不指定存储结构,只使用串的基本运算。void replace(string s,t,v)/本算法是串的置换操作,将串s中所有非空串t相等且不重复的子串用v代替。i=index(s,t);/判断s是否有和t相等的子串 if(i!=0)/串s中包含和t相等的子串 creat(temp,”); /creat操作是将串常量(此处为空串)赋值给temp。 m=length(t);n=length(
23、s); /求串t和s的长度 while(i!=0) assign(temp,concat(temp,substr(s,1,i-1),v);/用串v替换t形成部分结果 assign(s,substr(s,i+m,n-i-m+1); /将串s中串后的部分形成新的s串 n=n-(i-1)-m; /求串s的长度 i=index(s,t); /在新s串中再找串t的位置assign(s,contact(temp,s); /将串temp和剩余的串s连接后再赋值给s/if结束/算法结束5、题目分析本题是字符串的插入问题,要求在字符串s的pos位置,插入字符串t。首先应查找字符串s的pos位置,将第pos个字符到字符串s尾的子串向后移动字符串t的长度,然后将字符串t复制到字符串s的第pos位置后。 对插入位置pos要验证其合法性,小于1或大于串s的长度均为非法,因题目假设给字符串s的空间足够大,故对插入不必判溢出。void insert(char *s,char *t,int pos)/将字符串t插入字符串s的第pos个位置。int i=1,x=0; char *p=s,*q=t; /p,q分别为字符串s和t的工作指针 if(pos1) printf(“pos参数位置非法n”);exit(0);while(*p!=0&ipos) p+;i+; /查pos位置 /若pos小于串s长度,则查到
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1