串习题.docx
《串习题.docx》由会员分享,可在线阅读,更多相关《串习题.docx(14页珍藏版)》请在冰豆网上搜索。
串习题
第四章串
一、选择题
1.下面关于串的的叙述中,哪一个是不正确的()(2分)
A.串是字符的有限序列B.空串是由空格构成的串
C.模式匹配是串的一种重要运算D.串既可以采用顺序存储,也可以采用链式存储
2若串S=‘ABCDEFG’,S2=‘9898’,S3=‘###’,S4=‘012345’,执行
concat(replace(S1,substr(S1,length(S2),length(S3)),S3),substr(S4,index(S2,‘8’),length(S2)))其结果为()(7分)
A.ABC###G0123B.ABCD###2345C.ABC###G2345D.ABC###2345
E.ABC###G1234F.ABCD###1234G.ABC###01234
3.设有两个串p和q,其中q是p的子串,求q在p中首次出现的位置的算法称为()
A.求子串B.联接C.匹配D.求串长(2分)
4.已知串S=‘aaab’,其Next数组值为()。
(2分)
A.0123B.1123C.1231D.1211
5.串‘ababaaababaa’的next数组为()。
A.0B.012121111212C.0D.0
6.字符串‘ababaabab’的nextval为()
A.(0,1,0,1,04,1,0,1)B.(0,1,0,1,0,2,1,0,1)
C.(0,1,0,1,0,0,0,1,1)D.(0,1,0,1,0,1,0,1,1)(2分)
7.模式串t=‘abcaabbcabcaabdab’,该模式串的next数组的值为(),nextval数组的值为()。
A.01112211123456712B.01112121123456112
C.01110013101100701D.01112231123456712
E.01100111011001701F.01102131011021701
(2分)
8.若串S=’software’,其子串的数目是()。
(2分)
A.8B.37C.36D.9
9.设S为一个长度为n的字符串,其中的字符各不相同,则S中的互异的非平凡子串(非空且不同于S本身)的个数为()。
A.2n-1B.n2C.(n2/2)+(n/2)D.(n2/2)+(n/2)-1E.(n2/2)-(n/2)-1F.其他情况
10.串的长度是指()(3分)
A.串中所含不同字母的个数B.串中所含字符的个数
C.串中所含不同字符的个数D.串中所含非空格字符的个数
二、判断题
1.KMP算法的特点是在模式匹配时指示主串的指针不会变小。
()(1分)
2.设模式串的长度为m,目标串的长度为n,当n≈m且处理只匹配一次的模式时,朴素的匹配(即子串定位函数)算法所花的时间代价可能会更为节省。
()(1分)
3.串是一种数据对象和操作都特殊的线性表。
()(1分)
二、填空题
1.空格串是指__
(1)__,其长度等于___
(2)__。
(2分)
2.组成串的数据元素只能是________。
(1分)
3.一个字符串中________称为该串的子串。
(1分)
4.INDEX(‘DATASTRUCTURE’,‘STR’)=________。
(2分)
5.设正文串长度为n,模式串长度为m,则串匹配的KMP算法的时间复杂度为________。
6.模式串P=‘abaabcac’的next函数值序列为________。
(2分)
7.字符串’ababaaab’的nextval函数值为________。
(2分)
8.设T和P是两个给定的串,在T中寻找等于P的子串的过程称为__
(1)__,又称P为__
(2)__。
(16/6分)
9.串是一种特殊的线性表,其特殊性表现在__
(1)__;串的两种最基本的存储方式是__
(2)__、__(3)__;两个串相等的充分必要条件是__(4)__。
(4分)
10.两个字符串相等的充分必要条件是_______。
(2分)
11.知U=‘xyxyxyxxyxy’;t=‘xxy’;
ASSIGN(S,U);
ASSIGN(V,SUBSTR(S,INDEX(s,t),LEN(t)+1));
ASSIGN(m,‘ww’)
求REPLACE(S,V,m)=________。
(5分)
12.实现字符串拷贝的函数strcpy为:
voidstrcpy(char*s,char*t)/*copyttos*/
{while(________)
}(3分)
13.下列程序判断字符串s是否对称,对称则返回1,否则返回0;如f("abba")返回1,f("abab")返回0;
intf(
(1)________)
{inti=0,j=0;
while(s[j])
(2)________;
for(j--;ireturn((3)_______)
}(3分)
14.下列算法实现求采用顺序结构存储的串s和串t的一个最长公共子串。
程序(a)
PROCEDUREmaxcomstr(VARs,t:
orderstring;VARindex,length:
integer);
VARi,j,k,length1:
integer;con:
boolean;
BEGIN
index:
=0;length:
=0;i:
=1;
WHILE(i<=DO
[j:
=1;
WHILE(j<=DO
[IF(s[i]=t[j])THEN
[k:
=1;length1:
=1;con:
=true;
WHILEconDO
IF
(1)__THEN[length1:
=length1+1;k:
=k+1;]ELSE
(2)_;
IF(length1>length)THEN[index:
=i;length:
=length1;]
(3)____;
]
ELSE(4)____;
]
(5)___;
]
END;
程序(b)
voidmaxcomstr(orderstring*s,*t;intindex,length)
{inti,j,k,length1,con;
index=0;length=0;i=1;
while(i<=
{j=1;
while(j<=
{if(s[i]==t[j])
{k=1;length1=1;con=1;
while(con)
if
(1)_{length1=length1+1;k=k+1;}else
(2)__;
if(length1>length){index=i;length=length1;}
(3)____;
}
else(4)___;
}
(5)__
}}(10分)
15.完善算法:
求KMP算法中next数组。
PROCget_next(t:
string,VARnext:
ARRAY[1..]OFinteger);
BEGIN
j:
=1;k:
=
(1)__;next[1]:
=0;
WHILEjIFk=0OR[j]=[k]THENBEGINj:
=j+1;k:
=k+1;next[j]:
=k;END
ELSEk:
=
(2)___;
END;(4分)
16.下面函数index用于求t是否为s的子串,若是返回t第一次出现在s中的序号(从1开始计),否则返回0。
例如:
s=‘abcdefcdek’,t=‘cde’,则indse(s,t)=3,index(s,’aaa’)=0。
已知t,s的串长分别是mt,ms
FUNCindex(s,t,ms,mt);
i:
=1;j:
=1;
WHILE(iIFs[i]=t[j]THEN[
(1)__;
(2)__]
ELSE[(3)___;(4)_]
IFj>mtTHENreturn(5)____;ELSEreturn(6)__
ENDF;(6分)
17.阅读下列程序说明和pascal程序,把应填入其中的()处的字句写在答题纸上。
程序说明:
本程序用于判别输入的字符串是否为如下形式的字符串:
W&M$其中,子字符串M是子字符串W的字符反向排列,在此假定W不含有字符&和字符$,字符&用作W与M的分隔符,字符$用作字符串的输入结束符。
例如,对输入字符串ab&ba$、11&12$、ab&dd$、&$,程序将分别输出Ok.(是),No.(不是)。
程序
PROGRAMaccept(input,output);
CONSTmidch=’&’;endch=’$’;
VARan:
boolean;ch:
char;
PROCEDUREmatch(VARanswer:
boolean);
VARch1,ch2:
char;f:
boolean;
BEGIN
read(ch1);
IFch1<>endch
THENIF
(1)__
THENBEGINmatch(f);
IFfTHENBEGINread(ch2);answer:
=
(2)_ENDELSEanswer:
=false
END
ELSE(3)___
ELSE(4)___
END;
BEGIN
writeln(‘EnterString:
’);
match(an);
IFanTHENBEGIN
(5)__IF(6)_THENwriteln(‘Ok.’)ELSEwriteln(‘No.’)
END
ELSEwriteln(‘No.’)
END.(15分)
18.试利用下列栈和串的基本操作完成下述填空题。
initstack(s)置s为空栈;
push(s,x)元素x入栈;
pop(s)出栈操作;
gettop(s)返回栈顶元素;
sempty(s)判栈空函数;
setnull(st)置串st为空串;
length(st)返回串st的长度;
equal(s1,s2)判串s1和s2是否相等的函数;
concat(s1,s2)返回联接s1和s2之后的串;
sub(s,i,1)返回s中第i个字符;
empty(st)判串空函数
FUNCinvert(pre:
string;VARexp:
string):
boolean;
{若给定的表达式的前缀式pre正确,本过程求得和它相应的表达式exp并返回“true”,否则exp为空串,并返回“false”。
已知原表达式中不包含括弧,opset为运算符的集合。
}
VARs:
stack;i,n:
integer;succ:
boolean;ch:
char;
BEGIN
i:
=1;n:
=length(pre);succ:
=true;
(1)__;
(2)__;
WHILE(iBEGINch:
=sub(pre,i,l);
IF(3)_THEN(4)__
ELSEIF(5)__THEN(6)_
ELSEBEGIN
exp:
=concat((7)___,(8)____);
exp:
=concat((9)___,(10)___);
(11)__;
END;
i:
=i+1
END;
IF(12)___THEN
BEGINexp:
=concat(exp,sub(pre,n,1));invert:
=trueEND
ELSEBEGINsetnull(exp);invert:
=falseEND
END;
注意:
每个空格只填一个语句。
四、应用题
1.名词解释:
串(3分)
2.描述以下概念的区别:
空格串与空串。
(2分)
3.两个字符串S1和S2的长度分别为m和n。
求这两个字符串最大共同子串算法的时间复杂度为T(m,n)。
估算最优的T(m,n),并简要说明理由。
(6分)
4.设主串S=‘xxyxxxyxxxxyxyx’,模式串T=‘xxyxy’。
请问:
如何用最少的比较次数找到T在S中出现的位置相应的比较次数是多少(8分)
5.KMP算法(字符串匹配算法)较Brute(朴素的字符串匹配)算法有哪些改进((2分)
6.已知模式串t=‘abcaabbabcab’写出用KMP法求得的每个字符对应的next和nextval函数值。
(10分)
7.给出字符串‘abacabaaad’在KMP算法中的next和nextval数组。
(5分)
8.令t=‘abcabaa’,求其next函数值和nextval函数值。
(6分)
9.已知字符串‘cddcdececdea’,计算每个字符的next和nextval函数的值。
10.试利用KMP算法和改进算法分别求p1=‘abaabaa’和p2=‘aabbaab’的next函数和nextval函数。
(8分)
11.已知KMP串匹配算法中子串为babababaa,写出next数组改进后的next数组信息值(要求写出数组下标起点)。
12.求模式串T=‘abcaabbac'的失败函数Next(j)值。
(5分)
13.字符串的模式匹配KMP算法中,失败函数(NEXT)是如何定义的计算模式串p=‘aabaabaaabc’中各字符的失败函数值.(10分)
14.设字符串S=‘aabaabaabaac',P=‘aabaac'
(1)给出S和P的next值和nextval值;
(2)若S作主串,P作模式串,试给出利用BF算法和KMP算法的匹配过程。
(15分)
15.设目标为t=‘abcaabbabcabaacbacba’,模式为p=‘abcabaa’
(1)计算模式p的naxtval函数值;(5分)
(2)不写出算法,只画出利用KMP算法进行模式匹配时每一趟的匹配过程。
(10分)
16.模式匹配算法是在主串中快速寻找模式的一种有效的方法,如果设主串的长度为m,模式的长度为n,则在主串中寻找模式的KMP算法的时间复杂性是多少如果,某一模式P=’abcaacabaca’,请给出它的NEXT函数值及NEXT函数的修正值NEXTVAL之值。
(5分)
17.设目标为S=‘abcaabbcaaabababaabca’,模式为P=‘babab’,
(1)手工计算模式P的nextval数组的值;(5分)
(2)写出利用求得的nextval数组,按KMP算法对目标S进行模式匹配的过程。
(10分)
18.用无回溯的模式匹配法(KMP法)及快速的无回溯的模式匹配法求模式串T的next[j]值,添入下面表中:
kmp法求得的next[j]值
快速无回溯法求得的next[j]值(25/4分)
19.在改进了的(无回溯)字符串模式匹配中,要先求next数组的值。
下面是求nextval值的算法。
TYPESAR=ARRAY[1..m]OFINTEGER;
PTY=ARRAY[1..m]OFCHAR;
PROCEDUREnext2(P:
PTY;VARNEXTVAL:
SAR);
{在模式P中求nextval数组的值}
11BEGIN
22J:
=1;NEXTVAL[1]:
=0;K:
=0
33REPEAT
44IF(K=0)OR(P[J]=P[K])
55THEN[J:
=J+1;K:
=K+1;
66IFP[J]=P[K]
77THENNEXTVAL[J]:
=NEXTVAL[K]
88ELSENEXTVAL[J]:
=K]
99ELSEK:
=NEXTVAL[K]
1010UNTILJ=m
1111END;
算法中第4行有P[J]=P[K],第六行中也有P[J]=P[K]。
两处比较语句相同。
请分析说明此两处比较语句的含义是什么分析此算法在最坏情况下的时间复杂度是多少(6分)
20.在字符串模式匹配的KMP算法中,求模式的next数组值的定义如下:
请问:
(1)当j=1时,为什么要取next[1]=0
(2)为什么要取max{K},K最大是多少
(3)其它情况是什么情况,为什么取next[j]=1(8分)
21.给出KMP算法中失败函数f的定义,并说明利用f进行串模式匹配的规则,该算法的技术特点是什么(8分)
22.在模试匹配KMP算法中所用失败函数f的定义中,为何要求pp……p为pp……p两头匹配的真子串且为最大真子串(7分)
23.如果两个串含有相等的字符,能否说它们相等(5分)
24.设S1,S2为串,请给出使S1maxlen]OFchar;
curlen:
0..maxlen
END;
5.函数voidinsert(char*s,char*t,intpos)将字符串t插入到字符串s中,插入位置为pos。
请用c语言实现该函数。
假设分配给字符串s的空间足够让字符串t插入。
(说明:
不得使用任何库函数)(10分)
6.设计一个二分检索的算法,在一组字符串中找出给定的字符串,假设所有字符串的长度为4。
(1)简述算法的主要思想;(3分)
(2)用PASCAL语言分别对算法中用到的类型和变量作出说明;(3分)
(3)用类PASCAL语言或自然语言写算法的非递归过程;(8分)
(4)分析该算法的最大检索长度;(3分)
(5)必要处加上中文注释。
(3分)
7.设计一PASCAL或C语言的函数atoi(x).其中X为字符串,由0--9十个数字符和表示正负数的‘-’组成,返回值为整型数值。
(7分)
8.已知字符串S1中存放一段英文,写出算法format(s1,s2,s3,n),将其按给定的长度n格式化成两端对齐的字符串S2,其多余的字符送S3。
(15分)
9.串以静态存储结构存储,结构如下所述,试实现串操作equal算法.
CONSTmaxlen=串被确认的最大长度
TYPEstrtp=RECORD
ch:
ARRAY[1..maxlen]OFchar;
curlen:
0..maxlen
END;
(以一维数组存放串值,并设指示器curlen指示当前串长)(12分)
10.编写程序,统计在输入字符串中各个不同字符出现的频度并将结果存入文件(字符串中的合法字符为A-Z这26个字母和0-9这10个数字)。
(10分)
11.写一个递归算法来实现字符串逆序存储,要求不另设串存储空间。
12.已知三个字符串分别为s=’ab…abcaabcbca…a’,s’=’caab’,s’’=’bcb’。
利用所学字符串基本运算的函数得到结果串为:
s’’’=’caabcbca…aca…a’,要求写出得到上结果串S’’’所用的函数及执行算法。
(10分)
13.S=“S1S2…Sn”是一个长为N的字符串,存放在一个数组中,编程序将S改造之后输出:
(1)将S的所有第偶数个字符按照其原来的下标从大到小的次序放在S的后半部分;
(2)将S的所有第奇数个字符按照其原来的下标从小到大的次序放在S的前半部分;
例如:
S=‘ABCDEFGHIJKL’,则改造后的S为‘ACEGIKLJHFDB’。
14.编一程序,对输入的一表达式(字符串),输出其TOKEN表示。
表达式由变量A,B,C,常数(数字)0,1,…,9,运算符+,*和括号“(”,“)”组成。
首先定义符号的类码:
其次定义符号的TOKEN表示:
其中NAMEL是变量名表(不允许有相同名),CONST是常量表(不允许有相同数)。
例如,假设有表达式(A+A*2)+2*B*3#,则将生成如下TOKENL:
(20分)