根据快速排序的思想,可以在平均时间复杂度为O(n)的时间内找出一个数列的中位数。
然后再用O(n)的时间检查它是否是主元素。
五、问题实例及算法运算步骤
首先运行程序,按照提示输入数据;其次求出在数组T[0:
n]中出现次数最多的元素x出现的次数k;然后用select方法线性时间选择,找到第(n+1)/2大的数;用QuickSort进行快速排序;用Partition方法进行数组划分,用swap将小于x的元素移到x左边,大于x的元素移到x右边;然后就可以得到时候存在主元素,输出到屏幕上。
从屏幕得到数组001108111后,可以得到出现次数最多的元素为1,其次数为5,第(n+1)/2大的数字为0,可以判断存在主元素,然后进行快排,移动元素得到数组为000111118,此时就可以得到主元素为1。
六、算法运行截图
七、 算法复杂度分析
根据快速排序的思想,可以在平均时间复杂度为O(n)的时间内找出一个数列的中位数。
然后再用O(n)的时间检查它是否是主元素,时间复杂度分析master()中求中位数可以在平均时间复杂度为O(n)的时间内完成,检查中位数是否是主元素耗时O(n),所以时间复杂度为O(n)。
第三章字符串问题
一、算法问题描述
设A和B是两个字符串,要用最少的字符操作将字符串A转换为字符串B
字符串操作包括,
1)删除一个字符
2)插入一个字符
3)将一个字符改为另一个字符
将字符串A变换成字符串B所用的最少字符操作数称为字符串A到B的编辑距离,记为d(A,B)。
试着设计一个有效算法,对任意给出的俩个字符串A和B,计算出他们的编辑距离d(A,B)。
二、算法问题形式化表示
定义一个二维数组D[][]存储中间结果,如下图所示,为已经初始化后的情况。
然后从D[1,1]开始从左到右,从上到下依次按填表,表的最后一个元素D[m,n]就是要求的最终结果。
0
1
2
3
4
5
6
0
0
1
2
3
4
5
6
1
1
2
2
3
3
4
4
5
5
6
6
三、期望输入与输出
输入:
由文件input.txt提供输入数据,文件的第一行是字符串A,文件的第二行是文件B。
输出:
程序运结束时,将编辑距离d(A,B),输出到文件output.txt的第一行中。
四、算法分析与步骤描述
注意:
报告中不附加程序代码,主要程序要描述程序流程
设所给的两个字符串为A[1:
m]和B[1:
n]。
定义D[i][j]=d(A[1:
i],B[1,j])。
单字符a,b间的距离定义为:
d(a,b)=0(a=b)
d(a,b)=1(a!
=b)
考察从字符串A[1:
i]到字符串B[1:
j]的变换。
可分成以下几种情况:
(1)字符A[i]改为字符B[j];需要d(A[i],B[j])次操作。
(2)删除字符A[i];需要1次操作。
(3)插入字符B[j];需要1次操作。
因此,D[i][j]可递归地计算如下。
D[i][j]=min{D[i-1][j-1]+d(A[i],B[j]),D[i-1][j]+1,D[i][j-1]+1}。
五、问题实例及算法运算步骤
例子:
下面实际解决一下从srcStr="bd" 到dstStr="abcd"的过程,上面这三种情况分别是初始化的时候要做的,首先用一维数组表示两位数组,纵向i=0->m+1,d[i*(n+1)]=i
横向i=0->n+1,d[i]=I,即:
如下图是初始化之后的表格信息,纵向是b,d 横向是a,b,c,d
步骤:
for(i=1->2) // 2为“bd"的长度
for(j=1->4) //4为”abcd"的长度
为了确定d[i][j]的大小,需要比较
a)从d[i-1][j-1]修改字符srcStr[i-1],使之变为dstStr[j-1],如果srcStr[i-1]==dstStr[j-1]则这一步可以免去
b)从d[i-1][j]在srcStr的[i-1]处添加一个字符,使字符srcStr[i-1]变为dstStr[j-1]
c)从d[i][j-1]在dstStr的[j-1]处删除一个字符,使字符dstStr[j-1]变为srcStr[i-1],三者之间的最小值赋给d[i][j]
六、算法运行截图
七、 算法复杂度分析
从上面算法可以看出,该算法时间复杂性为0(m*n),空间复杂性为O(m*n)。
同时可以看出,当对第i行进行填表时,只需要用到第i-1行的数据,因此可以用一个一维数组dis[0…n]代替二维数组D[0…m,0…n],因此空间复杂性降为O(n)。
第四章磁带存储问题
一、算法问题描述
设有n个程序{1,2,……n}要存放在长度为L的磁带上。
程序i存放在磁带上的长度是li,1<=i<=n。
这n个程序的读取概率分别为p1,p2,……pn,且Σpi=1(i=1,2,….n)。
如果将这n个程序按i1,i2,……in的次序存放,则读取程序所需的时间tr=cΣpiklik(k=1,2,….r)(可假定c为1)。
这n个程序的平均读取时间为t
(1)+t
(2)+...+t(r)。
磁带最优存储问题要求确定这n个程序在磁带上的一个存储次序,使平均读取时间达到最小。
二、算法问题形式化表示
对于给定的N个程序存放在磁带上的长度,计算磁带上最多可以存储的程序数和占用磁带的长度
三、期望输入与输出
输入:
input.txt给出输入数据。
第1行是正整数n,表示文件个数。
接下来的n行中,每行有2个正整数a和b,分别表示程序存放在磁带上的长度和读取概率。
实际上第k个程序的读取概率为ak/Σai。
对所有输入的均假定c=1。
输出:
将编程计算出的最小平均读取时间输出到文件output.txt。
输入文件示例输出文件示例
iput.txtoutput.txt
615
3549783
四、算法分析与步骤描述
因为长度和检索该程序的时间成正比,输入程序后,先按程序长度由小到大排序,即程序短的放在前面,则由题意的检索方法可知该方法检索时间最短。
1.输入n和L[1],L[2],...L[n];
2.将L数组从小到大排序;
3.计算出个个程序的从头查到的检索时间T[i];
4.计算出最有存储的平均检索时间ST。
五、问题实例及算法运算步骤
最多数量是最优先解决的问题,然后再数量最大的前提下让利用率站到最大,
所以按照贪心策略先将占用的长度从小到大进行排序,以此输入到磁带中,
6 24
8 3 12 7 9 7
排序之后3,7,7,8,9,12 ,最佳组合应为 3912,先按照数量最多的前提下可存放3个程序377,然后进行第2策略让利用率最大,3+7+7=1724-17=7表明还剩下7个空间,从3,7,7最后一个数开始使其尽可能的大3,7,12=22,此时磁带还剩下空间2,再从倒数第二个数开始使其尽可能的大,但是最大上限不能超过12,3,8,12=23磁带还剩下1空间,然后在分析比8大的数9则3+9+12是24,再从倒数第三个数开始重复上述操作,但是比3大一位是7,如果采用7,9,12已经超过磁带最大上限所以停止查找,既此时最大个数3最大利用率24。
六、算法运行截图
七、 算法复杂度分析
时间复杂度为O(n)
第五章电路板问题
一、算法问题描述
最小长度电路板排列问题是大规模电子系统设计中提出的实际问题。
该问题的提法是,将n块电路板以最佳排列方案插入带有n个插槽的机箱中。
n块电路板的不同的排列方式对应于不同的电路板插入方案。
设B={1,2,…,n}是n块电路板的集合。
集合L={N1,N2,…,Nm}是n块电路板的m个连接块。
其中每个连接块Ni是B的一个子集,且Ni中的电路板用同一根导线连接在一起。
二、算法问题形式化表示
在最小长度电路板排列问题中,连接块的长度是指该连接块中第1块电路板到最后1块电路板之间的距离。
例如在图示的电路板排列中,连接块N4的第1块电路板在插槽3中,它的最后1块电路板在插槽6中,因此N4的长度为3。
同理N2的长度为2。
图中连接块最大长度为3。
试设计一个分支限界法找出所给n个电路板的最佳排列,使得m个连接块中最大长度达到最小。
对于给定的电路板连接块,设计一个队列式分支限界法,找出所给n个电路板的最佳排列,使得m个连接块中最大长度达到最小。
这8块电路板的一个可能的排列如图所示:
三、期望输入与输出
输入:
第一行有2个正整数n和m(1≤m,n≤20)。
接下来的n行中,每行有m个数。
第k行的第j个数为0表示电路板k不在连接块j中,1表示电路板k在连接块j中。
输出:
将计算出的电路板排列最小长度及其最佳排列输出。
第1行是最小长度;接下来的1行是最佳排列。
Input:
output:
8 5