最长公共子序列CS.docx
《最长公共子序列CS.docx》由会员分享,可在线阅读,更多相关《最长公共子序列CS.docx(11页珍藏版)》请在冰豆网上搜索。
![最长公共子序列CS.docx](https://file1.bdocx.com/fileroot1/2023-2/10/130ab0dc-589b-48cc-a7d0-dee34354da1d/130ab0dc-589b-48cc-a7d0-dee34354da1d1.gif)
最长公共子序列CS
最长公共子序列CS
————————————————————————————————作者:
————————————————————————————————日期:
求解所有最长公共子序列
一、问题分析
该部分思路同课件
二、算法设计思路
根据问题分析的结果,具体的算法设计思路如下:
1)申明两个数组,用于保存比较的两个字符串;由于事先不知字符串大小,故动态的实现,这里用C++的容器。
2)申明全局变量,二维数组B和数组C。
数组C用于保存计算Xi和Yi的LCS值;数组B保存当前的C是从哪个子问题得来的。
为此,定义一个枚举类型,用于标识不同的方向,分别为对角线、向上、向左和向左向上四个方向。
3)根据动态规划,实现一个函数LCS_LENGTH,完成的功能是计算数组B和C。
具体过程是:
先是动态申请二维数组B和C,他们的行列长度都增加1,目的就是方便计算。
将C的第0行和第0列都赋上0,即初始化。
开始计算C[i][j],以行为主,一次计算C的每一个元素,即将两个数组逐一比较。
比较时就有两种情况,分别是若相等时,就将C[i][j]设置成C[i-1][j-1],同时将B[i][j]设置成DIAGONAL。
若不相等时,比较C[i-1][j]和C[i][j-1]的值,又有三种情况:
一是C[i-1][j]与C[i][j-1]相等,就随便把某一个赋给C[i][j],比如C[i-1][j],B[i][j]设置为UP_LEFT;二是若C[i-1][j]大于C[i][j-1],则将C[i-1][j]赋给C[i][j],并且将B[i][j]设置成UP;最后是若C[i-1][j]小于C[i][j-1],则将C[i][j-1]赋给C[i][j],并且将B[i][j]设置成LEFT。
4)根据第3)步骤的结果,就可以找出所有LCS了。
这里会用到回溯方法,具体实现可以用栈,也可以用递归。
本人使用的是递归,代码简单、易懂。
具体实现方法是:
申请一个数组用于保存一个LCS,这个数组会反复使用,因此,一旦找到一个就会立即将它输出。
再设置一个变量curpos标识当前的数组下标,一个变量len保存当前LCS数组的元素个数。
扫描二维数组B,从最后一个开始,判断B的值,有四种情况:
当B的值是UP时,就向上递归;当B的值是LEFT时,就向左递归;当B的值是向上或是向左时,这是存在两个选择,先左后上,或是先上后左;当B的值是对角线的时,此时LCS数组才保存当前的字符,len加1,继续沿对角线递归,递归完之后,len减1,回溯。
若len为LCS的长度时,就输出。
三、算法流程图
1.功能函数LCS_LENGTH的流程图
图1
2.功能函数Print_LCS的流程图
3.
图2
四、测试结果
测试用例保存在LCS.in的文件中,如下图3:
图3
从图3中可以看出,有三组测试用例。
本程序运行的结果如图4所示:
图4
五、分析结果
从实验的三组测试用例可以看出:
第一组是课本上的例子,结果正确;第二组是个反例,没有公共子序列,结果也正确;第三组是生物的应用,即从某种生物上摘取的DNA序列,结果出现三个重复的序列。
其实算法是正确的,但是原比较的字符串中重复的字符比较多,如果对每个重复的字符标记不一样,那么所求的结果中不会出现相同的LCS。
这也是本实验中的不足——没有检验LCS重复性。
故实验中可以加入检测有无重复的LCS程序,但这并不是本实验的重点。
六、附录(源代码)
#include
#include
#include
#include
#include
usingnamespacestd;
int**C,**B;//C保存计算Xi和Yi的LCS值;B保存当前的C是从哪个子问题得来的
char*LCS;//保存一个最长公共子序列
intlen=0;//回溯时用到的统计保存LCS数组当前长度
enum{DIAGONAL,UP,LEFT,UP_LEFT};
//定义方向,分别是:
对角线、向上、向左和向左向上
/*LCS_LENGTH函数,求出数组C和B*/
voidLCS_LENGTH(vectorX,vectorY,intm,intn)//计算C
{
C=newint*[m];//动态分配二维数组
B=newint*[m];
for(inti=0;i{
C[i]=newint[n];
B[i]=newint[n];
}
for(i=1;iC[i][0]=0;
for(intj=0;jC[0][j]=0;
for(i=1;i{
for(j=1;j{
if(X.at(i-1)==Y.at(j-1))//此下标与数组的下标差1,相等时
{
C[i][j]=C[i-1][j-1]+1;//左上角的LCS+1
B[i][j]=DIAGONAL;
}
else//不相等
{
if(C[i-1][j]==C[i][j-1])//up和left
{
C[i][j]=C[i-1][j];
B[i][j]=UP_LEFT;
}
elseif(C[i-1][j]>C[i][j-1])//up
{
C[i][j]=C[i-1][j];
B[i][j]=UP;
}
else//left
{
C[i][j]=C[i][j-1];
B[i][j]=LEFT;
}
}
}
}
}
/*Print_LCS函数,打印出所有的LCS*/
voidPrint_LCS(int**B,vectorX,inti,intj,intcurpos,intmaxLCS,ostream&out)
{
if(i>=0&&j>=0)
{
if(len==maxLCS)//已经找到一个LCS,则输出
{
for(intk=len-1;k>=0;k--)
out<out<}
else
{
if(B[i][j]==DIAGONAL)//对角线
{
LCS[curpos]=X.at(i-1);
len++;
Print_LCS(B,X,i-1,j-1,curpos+1,maxLCS,out);
len--;//回溯
}
elseif(B[i][j]==UP)//向上
{
Print_LCS(B,X,i-1,j,curpos,maxLCS,out);
}
elseif(B[i][j]==LEFT)//向左
{
Print_LCS(B,X,i,j-1,curpos,maxLCS,out);
}
else//向上或向左
{
Print_LCS(B,X,i-1,j,curpos,maxLCS,out);//向上
Print_LCS(B,X,i,j-1,curpos,maxLCS,out);//向左
}
}
}
}
/*输出字符串*/
voidout(vector:
:
iteratorbeg,vector:
:
iteratorend)
{
while(beg!
=end)
cout<<*beg++;
cout<}
intmain()
{
chars;
vectorX,Y;
ifstreamfin("LCS.in");//输入文件
//charX[MAXSIZE],Y[MAXSIZE];
intcount=0;//实验的测试组数
cout<<"ReadingthefileLCS.in..."<if(fin==NULL)
{
cout<<"Readingfailed!
"<cout<<"Thereisnoinputfile!
"<cout<<"PleasemakeaiuputfileusenameLCS.inandinputstrings."<}
else
{
cout<<"Readingsucceed!
"<fin>>count;
fin.get(s);//过滤一个换行符
cout<<"Theseare"<"<for(intz=1;z<=count;z++)
{
while(fin.get(s)&&s!
='\n')
X.push_back(s);
while(fin.get(s)&&s!
='\n')
Y.push_back(s);
cout<<"Thegroup"<"<out(X.begin(),X.end());
out(Y.begin(),Y.end());
intm=X.size()+1;
intn=Y.size()+1;
LCS_LENGTH(X,Y,m,n);
intmax=C[m-1][n-1];//保存LCS的长度
if(0==max)//没有最长公共子序列
{
cout<<"ThereisnoLongestCommonSubsequence!
\n"<}
else
{
LCS=newchar[max];
cout<<"AlltheLongestCommonSubsequenceare:
"<Print_LCS(B,X,m-1,n-1,0,max,cout);
cout<for(inti=0;i{
delete[]B[i];
delete[]C[i];
}
delete[]B;
delete[]C;
delete[]LCS;
}
X.clear();
Y.clear();
}//for
}
return0;
}