大数据结构各种排序算法地时间性能Word文件下载.docx
《大数据结构各种排序算法地时间性能Word文件下载.docx》由会员分享,可在线阅读,更多相关《大数据结构各种排序算法地时间性能Word文件下载.docx(21页珍藏版)》请在冰豆网上搜索。
1.抽象数据类型
ADTList
数据对象D={ai|ai∈ElemSet,i=1,2,...,n,n≥0}
数据关系R1={<
ai-1,ai>
|ai-1,ai∈D,i=2,...,n}
基本操作virtualvoidclear()=0;
boolinsert(constElem&
)=0;
boolappend(constElem&
lboolremove(Elem&
voidsetStart()=0;
voidsetEnd()=0;
voidprev()=0;
voidnext()=0;
intleftLength()const=0;
intrightLength()const=0;
boolsetPos(intpos)=0;
boolgetValue(Elem&
)const=0;
voidprint()const=0;
2.程序的流程
(1)输入模块:
输入要排序的数的数量n
(2)处理模块:
系统产生n个随机数,对随机数进行排序
(3)输出模块:
将排序的结果输出
3.算法的基本思想
1、随机数的产生:
利用srand()产生随机数。
2、快速排序:
选定一记录R,将所有其他记录关键字k’与记录R的关键字k比较,若k’<
k则将记录换至R之前,若k’>
k则将记录换至R之后,继续对R前后两部分记录进行快速排序,直至排序范围为1
3、插入排序:
逐个处理待排序的记录,每个新记录与前面已排序的子序列进行比较,将它插入到子序列中正确的位置
4、冒泡排序:
比较并交换相邻的元素对,直到所有元素都被放到正确的地方为止。
5、归并排序:
将两个或者多个有序表归并成一个有序表
6、堆排序:
首先将数组转化为一个满足堆定义的序列,然后将堆顶的最大元素取出,再将剩下的数排成堆,再取堆顶数值,…。
如此下去,直到堆为空。
到最后结束时,就排出了一个由小到大排列的数组。
三、详细设计
(1)产生随机数:
直接调用函数srand(),以时间作为随机种子进行选择,并把随机数装入数组中
unsignedlongint*Sort:
:
setRan(unsignedlongintnum){
unsignedlongint*ra;
ra=(unsignedlongint*)malloc(num*sizeof(unsignedlongint));
srand(time(NULL));
for(unsignedlongintm=0;
m<
num;
m++){
ra[m]=rand();
}
cout<
<
endl;
returnra;
}
(2)快速排序:
要实现快速排序首先选择一个轴值,这里选取数组第一个为轴值。
定义两个标识low,high。
high标识最后一个元素的位置,从后向前,将关键字与轴值比较,直至遇到小于轴值的关键字,前移,low标识在第二个元素的位置,从前向后,将关键字与轴值比较,直至遇到大于轴值的关键字,后移。
当low,high相遇后第一趟排序结束。
调整数列,轴值左边的为比轴值小的,右边为比轴值大的。
对轴值左边(即low到pivotkey-1的数)和右边的子列(pivotkey+1到high的数)分别进行上述递归快速排序,直到范围为1结束。
intpartition(inta[],intlow,inthigh){//快速排序中的一趟
intpivotkey;
//作为枢轴来使用
pivotkey=a[low];
while(low<
high){
high&
&
a[high]>
=pivotkey)
--high;
a[low]=a[high];
a[low]<
++low;
a[high]=a[low];
a[low]=pivotkey;
returnlow;
voidqsort(inta[],intlow,inthigh){//快速排序的递归形式
intpivotloc;
if(low<
pivotloc=partition(a,low,high);
//一趟排序结果的调用
qsort(a,low,pivotloc-1);
qsort(a,pivotloc+1,high);
(3)插入排序:
插入排序的思想是将一组无序的元素分别插入一个已经有序的的数组里,并保证插入后的数组也是有序的。
当所有无序组的元素都插入完毕时,一个有序数组构造完成。
数组n[1…r]为初始的一个无序数组(为了直观起见,我们这里设定数组从1开始,而不是0),则n[1]默认为只有一个元素的有序数组,n[2]插入只有n[1]构成的有序数组中,则此时有序数组的元素数量变为2。
以此类推,到第i个元素时,前i-1个元素已经是有序的,此时只需将第i个元素插入到有序数组中并使之保持有序。
如此直至最后一个元素插入完毕,整个插入排序完成。
voidSort:
insertSort(unsignedlongint*s){
this->
setNum();
LARGE_INTEGERFreg;
LARGE_INTEGERCount1,Count2;
QueryPerformanceFrequency(&
Freg);
QueryPerformanceCounter(&
Count1);
//获取时间Count1
doubled;
inttemp,j;
for(unsignedlonginti=0;
i<
this->
getRanNum();
i++)
{
j=i;
temp=s[i];
while(j>
=1&
temp<
s[j-1])
{s[j]=s[j-1];
j--;
this->
SortNum++;
}
if(j>
1)
this->
s[j]=temp;
Count2);
//获取时间Count2
d=(double)(Count2.QuadPart-Count1.QuadPart)/(double)Freg.QuadPart*1000.0;
//计算时间差,d的单位为ms.
"
插入排序算法对"
RanNum<
个随机数排序时间为为"
d<
ms."
个随机数交换次数为"
SortNum<
次。
(4)冒泡排序(bubblesort):
将被排序的记录数组R[1..n]垂直排列,每个记录R[i]看作是重量为R[i].key的气泡。
根据轻气泡不能在重气泡之下的原则,从下往上扫描数组R:
凡扫描到违反本原则的轻气泡,就使其向上"
飘浮"
。
如此反复进行,直到最后任何两个气泡都是轻者在上,重者在下为止。
从无序区底部向上依次比较相邻的两个气泡的重量,若发现轻者在下、重者在上,则交换二者的位置。
即依次比较(R[n],R[n-1]),(R[n-1],R[n-2]),…,(R[2],R[1]);
对于每对气泡(R[j+1],R[j]),若R[j+1].key<
R[j].key,则交换R[j+1]和R[j]的内容。
第一趟扫描完毕时,"
最轻"
的气泡就飘浮到该区间的顶部,即关键字最小的记录被放在最高位置R[1]上。
扫描R[2..n]。
扫描完毕时,"
次轻"
的气泡飘浮到R[2]的位置上……最后,经过n-1
趟扫描可得到有序区R[1..n]
bubbleSort(unsignedlongint*s){
unsignedlonginttemp;
for(unsignedlonginti=0;
(this->
RanNum);
i++){
for(intj=i+1;
j<
j++){
if(s[i]>
s[j]){
temp=s[i];
s[i]=s[j];
s[j]=temp;
this->
}
冒泡排序算法对"
个随机数排序时间为"
(5)堆排序:
堆排序与其他排序算法最大的区别是它依靠一种特殊的数据结构——堆来进行排序。
堆是一种完全二叉树,并且根节点不大于左右子树中的所有节点,n[i]<
=n[2*i]&
n[i]<
=n[2*i+1]。
因此堆排序算法首先要将给出的无序数组构造成一个堆,然后输出根节点(最小元素),将剩余元素重新恢复成堆,再次输出根节点。
依次类推,直至最后一个节点输出,此时堆排序完成。
heapRestor(unsignedlongint*s,inti,intm){
intma;
if((i<
=m/2)&
(s[i]>
min(s[2*i],s[2*i+1])))
if(s[2*i]<
s[2*i+1])
{
ma=s[i];
s[i]=s[2*i];
s[2*i]=ma;
heapRestor(s,2*i,m);
else
s[i]=s[2*i+1];
s[2*i+1]=ma;
heapRestor(s,2*i+1,m);
SortNum=this->
SortNum+2;
elseif(i<
=m/2)
heapCreat(unsignedlongint*s,intm)
{
intnum;
for(num=m/2;
num>
=1;
num--)
heapRestor(s,num,m);
heapSort(unsignedlongint*s1,unsignedlongint*s2)
inti,num;
num=this->
RanNum;
heapCreat(s1,this->
for(i=0;
s2[i]=s1[1];
s1[1]=s1[num];
heapRestor(s1,1,--num);
堆排序算法对"
(6)合并排序:
这里的合并排序和下边要描述的快速排序都采用了分而治之的思想,但两者仍然有很大差异。
合并排序是将一个无序数组n[1…r]分成两个数组n[1…r/2]与n[r/2+1…r],分别对这两个小数组进行合并排序,然后再将这两个数组合并成一个大数组。
由此我们看出合并排序时一个递归过程(非递归合并排序这里不做讨论)。
合并排序的主要工作便是“合并”,两个小规模数组合并成大的,两个大的再合并成更大的,当然元素比较式在合并的过程中进行的。
mergeSort(unsignedlongint*s,intleft,intright){
inti;
if(left<
right){
i=(left+right)/2;
mergeSort(s,left,i);
mergeSort(s,i+1,right);
Merge(s,left,i,right);
intSort:
partition(unsignedlongint*s,intlow,inthigh){
intkey,i,p,r;
p=low;
r=high;
key=s[p];
while(p<
r)
for(i=r;
i>
p;
i--)
if(s[i]<
=key)
{
s[p]=s[r];
p++;
break;
}
r--;
for(i=p;
r;
key)
s[r]=s[p];
r--;
p++;
s[p]=key;
returnp;
(7)基本操作
AList(intsize=DefaultListSize){
maxSize=size;
listSize=fence=0;
listArray=newElem[maxSize];
~AList(){delete[]listArray;
1>
清空。
释放数组,将数组大小和栅栏置0.
voidclear(){
delete[]listArray;
2>
将栅栏赋初值0,放在开头。
voidsetStart(){fence=0;
3>
将栅栏指向数组最后。
voidsetEnd(){fence=listSize;
4>
获得当前的位置。
用栅栏的指向即可直接获得。
voidprev(){if(fence!
=0)fence--;
5>
获得最大值的大小,由栅栏可直接获得。
voidnext(){if(fence<
=listSize)
fence++;
6>
返回当前位置左边的长度。
直接返回栅栏的值获得。
intleftLength()const{returnfence;
7>
返回当前位置右边的长度。
用最大长度减去当前栅栏的值。
intrightLength()const
{returnlistSize-fence;
8>
设置当前位置,将值直接赋予栅栏。
boolsetPos(intpos){
if((pos>
=0)&
(pos<
=listSize))
fence=pos;
return(pos>
=listSize);
9>
返回当前的值。
boolgetValue(Elem&
it)const{
if(rightLength()==0)returnfalse;
else{
it=listArray[fence];
returntrue;
(4)算法的时空分析
插入排序:
直接插入排序算法必须进行n-1趟。
最好情况下,即初始序列有序,执行n-1趟,但每一趟只比较一次,移动元素两次,总的比较次数是(n-1),移动元素次数是2(n-1)。
因此最好情况下的时间复杂度就是O(n)。
最坏情况(非递增)下,最多比较i次,因此需要的比较次数是:
所以,时间复杂度为O(n2)。
冒泡排序:
当原始数据正向有序时,冒泡排序出现最好情况。
此时,只需进行一趟排序,作n-1次关键字比较,因此最好情况下的时间复杂度是O(n)。
当原始数据反向有序时,冒泡排序出现最坏情况。
此时,需进行n-1趟排序,第i趟作(n-i)次关键字间的比较,并且需执行(n-i)次元素交换,所以,比较次数为:
因此,最坏情况下的时间复杂度为O(n2)
快速排序:
如果每一次分划操作后,左、右两个子序列的长度基本相等,则快速排序的效率最高,其最好情况时间复杂度为O(nlog2n);
反之,如果每次分划操作所产生的两个子序列,其中之一为空序列,此时,快速排序效率最低,其最坏情况时间复杂度为O(n2)。
如果选择左边第一个元素为主元,则快速排序的最坏情况发生在原始序列正向有序或反向有序时。
快速排序的平均情况时间复杂度为O(nlog2n)。
堆排序:
堆排序的时间,主要由建立初始堆和反复重建堆这两部分的时间开销构成,它们均是通过调用Heapify实现的。
堆排序的最坏时间复杂度为O(nlogn)。
堆排序的平均性能较接近于最坏性能。
由于建初始堆所需的比较次数较多,所以堆排序不适宜于记录数较少的文件。
堆排序是不稳定的,算法时间复杂度O(nlogn)。
归并排序:
在最佳、平均、最差情况下,时间复杂度为(nlogn),不足的就是需要两倍的空间代价,当输入的待排序数据存储在链表中时,归并排序是一个很好的选择.
(5)函数的调用关系图
用户输入排序的元素个数n
产生n个随机数
主程序
对随机数进行排序
输出
(6)输入和输出的格式
输入请输入排序规模:
//提示输入
等待输入
输出插入排序算法对n个随机数排序时间为
插入排序算法对n个随机数交换次数为
冒泡排序算法对n个随机数排序时间为
冒泡排序算法对n个随机数交换次数为
堆排序算法对n个随机数排序时间为
堆排序算法对n个随机数交换次数为
合并排序算法对n个随机数排序时间为
合并排序算法对n个随机数交换次数为
快速排序算法对n个随机数排序时间为
快速排序算法对n个随机数交换次数为
排序后,前50个有序元素为:
四、用户使用说明(可选)
1、本程序的运行环境为DOS操作系统,执行文件为conversion.exe
2、运行程序时
五:
实现
图1控制台程序
实验结果:
实验分别实现插入排序、冒泡排序、堆排序、合并排序、快速排序,以不同规模(100,1000,2000,5000,10000,100000个数据)的随机数作为测试数据集,实验结果截图如下:
排序规模为100
排序规模为:
1000
2000
5000
10000
100000
(六)算法性能分析
在程序中我们根据数据规模的不同产生不同的随机整型数组,然后分别让不同的排序算法来进行从小到大的排序。
这里需要注意的是:
每种排序算法在相同的输入规模中原始无序数据都是一样的。
例如五种排序算法要对长度为100的无序数组进行排序,它们所要排序的无序数组都是一样的,我们以此来保证实验的公正性。
在这里我们认为比较次数是排序算法的主要