mpi冒泡排序并行化.docx

资源描述

mpi冒泡排序并行化.docx

《mpi冒泡排序并行化.docx》由会员分享，可在线阅读，更多相关《mpi冒泡排序并行化.docx（15页珍藏版）》请在冰豆网上搜索。

mpi冒泡排序并行化.docx

mpi冒泡排序并行化

北京科技大学计算机与通信工程学院

实验报告

实验名称:

冒泡排序的并行化　

学生姓名：

　　朱帅　　　　

专　业:

　计算机科学与技术

班　级:

　　　计１２0３　　

学　　号:

指导教师:

　　李建江　　

实验成绩：

实验地点:

　机电楼３０1

实验时间：

　2015年4月８日

一、实验目的与实验要求

１、实验目的

（1）学会将串行程序改为并行程序．

（2）学会mｐｉcｈ2的使用。

（3）学会oｐenmp的配置。

（４）mpi与openmp之间的比较。

２、实验要求

（1）将串行冒泡程序局部并行化,以降低时间消耗。

（2）　理论上求出时间复杂度之比，根据结果得出时间消耗之比，进行比对分析.

二、实验设备（环境）及要求

Vs20１3，mpiｃｈ2

三、实验内容与步骤

1、实验一mpi并行

（1）实验内容

1、写出一个冒泡排序程序,求出其时间复杂度,并运行得到相应的时间消耗．

2、将冒泡程序改为mｐi并行程序:

将全部需要排序的数分成4等份,分给四个进程一起冒泡，最后将所得的结果归到一个进程，进行归并排序,得到结果,得到时间消耗。

算出时间复杂度。

3、对得出的结果进行讨论与分析。

（2）主要步骤

1、串行冒泡程序

时间复杂度:

取所要排序的数的个数为ｎ个,时间复杂度为n*n/2。

代码实现：

／/maopao.cpp：

　定义控制台应用程序的入口点。

#iｎｃluｄe"sｔdafx。

ｈ"

＃inclｕｄe”stdlｉb.ｈ"

#include"tｉme。

h”

coｎstiｎtAＲＲＡY_SIZE　=120０00；

int　main（intargｃ,char＊arｇv［]）

{

iｎt　zｏngｓhｕ[ARRAY_ＳIZE]；

ｓｒａnd（１００８6）;

time_ｔｎoｗ_ｔｉme,　eｎd_tｉｍｅ;

ﻩｆor　（iｎｔi＝０；　i　〈ＡRＲAＹ_SＩZＥ；ｉ++）｛

ﻩzongｓhｕ[i]=rａｎd（）;

}

ｎｏw_timｅ=time（ＮＵLL）；

for　（ｉｎti=　０;i＜ARRAY_ＳIＺE;i++）

｛

for　（ｉnt　j＝　ARRＡＹ_SIＺE-1；　j〉　ｉ;ｊ-—）

ﻩﻩ｛

ﻩﻩif（zongshu［j]　<＝zongshu［j—　1]）

ﻩ{

ﻩﻩﻩｉnｔz=zｏｎgshu[ｊ—　１]；

ﻩﻩｚongsｈu［j－1]=zongｓhu[j］；

ﻩzongsｈu[j]=　z;

ﻩﻩ｝

}

ｅnｄ_time=timｅ（NUＬL）;

ﻩloｎｇｓｈijian　=　ｅnd_timｅ　-now＿tｉｍe；

ﻩfor（inｔi　=０；ｉ＜AＲＲAY＿ＳIZＥ;i＋+）{

　　　pｒintf（”％ｄ"，zｏngsｈu［i]）；

ﻩ}

ﻩｐriｎtf（”所用时间：

％ld”,sｈｉｊiaｎ）；

ﻩwｈiｌe（ｔrue）;

}

2、并行程序

时间复杂度:

取所要排序的数的个数为ｎ个,进程数为m个.时间复杂度：

（（n/ｍ）*（n/m）/2）+n＋4*n。

代码实现:

//　MＰＩTｅｓt.cpp　：

定义控制台应用程序的入口点.

/／

＃ｉncｌｕde＂sｔｄａfx.h"

#inｃlude"mpi。

#iｎcluｄe〈stdiｏ．h〉

#ｉnclude〈mａｔh。

ｈ＞

#ｉｎcluｄe　”sｔdlib。

h”

#defiｎｅSＩＺE4//进程数

cｏnstintARRAY_SIZE=3０00０；/／每个进程分配的个数

ｉnｔ　shuzu[SＩZE］[ARRAY＿SIＺE］；

intzonghanｓhu［SIZE][ARRAＹ_SＩZＥ］；

douｂlｅenｄｗtime;

voidＳcaｔtｅr＿1（int）；

intｍａin（intａrgc,cｈar＊ａrgｖ[]）｛

iｎtｍｙiｄ;

MＰI_Iｎit（＆arｇc,&argｖ）;

ＭＰI＿Ｃomm＿rank（MＰI_ＣOMM_WＯＲＬD，　＆mｙｉd）;

Sｃatｔer_1（myid）；

ﻩMPI＿Finalize（）；

}

void　Ｓcatter_1（intｍyiｄ）｛

iｎtnumtasks；

ﻩsrand（１００86）；

for（inti=0;ｉ

ﻩｆor（ｉntj　=０;　j〈AＲRＡY_SＩＺE;j++）{

ﻩshuzｕ［i］[ｊ］=raｎd（）；

ﻩ}

}

ﻩ//随机生成数组

ﻩiｎtｘiaopaｉｘｕ［ARRAY_SIZE］；

ﻩdoｕble　stａｒｔｗtｉmｅ=　MPI_Wtime（）；

ﻩMPI＿Cｏｍｍ＿size（ＭPＩ_ＣOＭM_ＷOＲＬD，&ｎuｍtaｓks）;

ﻩif　（ｎumtａｓｋs＝=ＳIZE）｛

ﻩMＰI_Scａｔｔer（sｈuzu,ARRＡY_SＩZE,　MPI_INT，　xｉaoｐaixu，ＡＲＲAY_ＳIZＥ,ＭPI_INT,0，　ＭPＩ＿COMM＿WＯRLD）;

ﻩﻩfｏr　（ｉnｔi=0;i　〈ARRAY_ＳIZＥ;ｉ++）{

ﻩﻩfor（iｎｔ　ｊ=ARRAＹ_SIＺE—　１;j〉i;　j-—）｛

ﻩiｆ（ｘiａopaｉｘu［j］　<=ｘiａopaｉxu[j—1]）{

ﻩﻩｉntz＝　ｘｉaopaixu［j-1];

xiaｏｐaixu［j-　1］=ｘiaoｐaiｘu［j］;

ﻩxiaopａixu［j]=z;

｝

ﻩﻩﻩ}

ﻩ}//每个进程里的冒泡排序

ﻩMPI_Gather（xiaopaｉｘu,　ARＲAY_SIＺE,ＭPI_ＩNＴ，ｚonｇhａnsｈu,AＲRAY_SIZE，ＭPI_ＩＮＴ,0，MＰI＿COMM＿ＷORLD）;

ﻩint　ｔime［SIZＥ］；

ﻩｆｏr（int　i=0;i〈SIＺE;i++）{

ﻩｔiｍe［i]=0；

｝

ﻩintａ[SIZE];

ﻩintzongｐaiｘu2［ARRAY_SIZE＊SIZE];

ﻩｆｏr（inｔj=　ＡRＲAY＿SIZE*SIZE—1；　ｊ〉=0；　ｊ-—）{

ﻩﻩfor　（ｉntk=0;k

ﻩﻩﻩｉf（time[k］>=　ARRAY_ＳIZE）{

ﻩﻩa［k］=0;

ﻩﻩﻩﻩ}

ﻩﻩeｌse

ﻩﻩ{

ﻩﻩﻩa[k］＝　zonghaｎshｕ[k]［ARRＡY_SIZE-time[k］-1]；

ﻩ｝

ﻩﻩﻩ}

ﻩﻩ

ﻩﻩﻩｉnｔ　x=a[0];

for　（int　i　＝1;i

ﻩﻩif（a[i］>x）{

ﻩx　＝a[i];

ﻩﻩ｝

ﻩﻩﻩ｝

ﻩﻩｆor（int　ｎ=0；n<　SIZE；n++）{

ﻩﻩif（x　==a［n]）{

ﻩﻩtiｍe[ｎ］=　ｔime[n］+1;

ﻩﻩbreａk;

ﻩﻩ}

ﻩﻩ｝

ﻩ

ﻩﻩzoｎgpaixu2[j]=x；

}

ﻩendwtiｍe　=MPI_Wtime（）;

ﻩif（myiｄ）;

ﻩeｌsｅ

ﻩﻩfor　（ｉｎｔi=0;ｉ　〈ＳIZE＊ARRＡY_ＳIZE;i++）{

ﻩﻩﻩprintf（”％ｄ”,ｚongpaixu2[i］）;

ﻩ｝

}

ﻩif（ｍyiｄ）；

ﻩelse

ﻩｐrintf（＂ｗallｃlocｋｔime=％　ｆ＼ｎ”，　endwtｉme—ｓtａrtwtime）；

｝

２、实验２

在实验一的基础上将程序改为opｅnmp。

　代码实现:

（水平不高,写的程序通用性不好，只写了四线程的）

　//　Opeｎｍｐ。

cｐｐ:

定义控制台应用程序的入口点。

#inｃlude"sｔdafx。

h”

#ｉncｌuｄe

h〉

#inｃluｄe　<ｍath。

h＞

＃incluｄe”stdlｉb.h＂

＃ｉnclude”time．h"

#ｉncｌude

#deｆine　SIZE４

conｓｔ　inｔ　ＡＲRＡＹ＿SIZE＝12０0０;

ｉntshuzu[SIZE][ＡＲRAY＿ＳIZE]；

intxiａｏpａixｕ1[ARＲAY_SIＺE］;

iｎtｘiaｏpaixu2[ＡRRＡY_SＩZＥ］；

iｎｔｘiaｏｐaixｕ３［ARRAY_ＳIZE];

iｎt　xiａｏｐaiｘu4[ＡＲRAY_ＳIＺE];

ｉnt　zoｎgｈanｓｈｕ[SIZＥ］[ARＲAY_SIＺE];

iｎtｚongｐａｉxu［ARRAY_SIZE*ＳＩZE］;

voiｄxiaohａnsu（iｎt　＊Ａ,　intｌ，ｉnt　u）{

for（inｔ　i=l;i

ﻩfor　（ｉｎｔj＝ｕ-　1;ｊ>ｉ；　j—-）{

if（A[j]〈=　Ａ［j—1]）{

ﻩﻩintｚ　=　Ａ［ｊ－１］；

ﻩﻩﻩA[j-　1]　=A[j］;

ﻩﻩA[ｊ］=z;

ﻩ}

}

｝

／/每个线程排序

intmａin（inｔargc，ｃｈar*aｒgｖ［]）

{

ﻩｉnt　ｔ1，ｔ2；

inｔi;

ｉntid；

ﻩｃloｃｋ_tnow_time，　enｄ_time;

ﻩｓraｎｄ（10086）；

for（iｎｔi=　0;i　

ﻩｆｏr　（ｉｎｔj=0；ｊ〈ARRAY_SＩZE；j++）{

ﻩﻩｓhuｚu[i］［j]=rand（）;

ﻩ}

}

/／随机生成数组

now＿time　=ｃｌock（）;

#pragmaｏmp　paｒaｌｌel　deｆaulｔ（none）sｈareｄ（sｈuzu，xｉaｏpaｉxu1，xiａopaiｘｕ２,xiａopaixu3，ｘiａｏpaixu4，ARＲAY_SIＺE）　private（i）

｛

#prａgma　omｐｆoｒ

ﻩﻩfｏr（i＝0；i

ﻩ｛

ﻩﻩｘｉaopaixｕ１[ｉ］=ｓｈuzｕ[０］［i］;

ﻩﻩxiaopａｉxｕ2[i]=　shuzu[1］[i]；

ﻩﻩxiaoｐaｉxu3[i]＝　shｕｚｕ[2］［i]；

ﻩﻩxｉaoｐaｉxu４[i］=shuzu［3][i];

ﻩﻩ}

}

#prａgmaｏmｐparａｌlｅl　defａult（none）　shａｒｅd（xiａｏpaｉxu１,ｘｉaoｐaｉxｕ2,xiaopaixｕ3,xiaｏpaiｘu4,ＡRRAY＿ＳＩZE）

ﻩ{

＃pragmaompparａllelｓectionｓ　

ﻩﻩ｛

＃pｒaｇmaomp　ｓecｔion

ﻩﻩﻩxｉaohansｕ（xｉａｏｐaixｕ１，　0,ARRＡY_SIZE-１）;//排序

#pragmaomp　secｔion　

ﻩﻩﻩｘiaｏｈansu（xiaｏpaixｕ2,0,ARRＡY＿SIＺＥ）；

#pragｍaomp　seｃtiｏn

xiaohaｎsu（xiaｏpａｉxｕ3,0，　ＡRRAY_SIＺE）;

＃pragmａ　oｍpsectｉｏn

ﻩxiaｏhansｕ（xiaopaixu4，　0，ARRＡY＿SIＺE）;ﻩ

}

ﻩ｝

fｏr（ｉ=0;　i

ﻩ{

ﻩzonghａｎshｕ［0][ｉ]=xiaopａｉxu1[i］;

ﻩzｏnｇhanｓhu［１］[i]=xiaopａｉｘu２［i];

ﻩｚonｇhaｎshu[2][i］=xiａopａixｕ3[i];

ﻩﻩzonｇｈaｎshu[3][i］=xｉａｏpaｉｘｕ4[i］;

ﻩ｝

iｎｔtime[ＳＩZE];

for（inti　=0；i　

ﻩtime［i]=0;

}

inta［SIZE];

ﻩｆor（intj＝AＲＲAY＿SＩＺE*SIZE-1；j　〉=　0；　j--）｛

ﻩfoｒ　（inｔk=０;k　〈SIZＥ；k++）{

ﻩﻩｉｆ（ｔime[k］>=　ＡＲRＡＹ＿SＩZE）{

ﻩﻩﻩａ[ｋ]　=0;

ﻩ}

ﻩﻩeｌｓe

ﻩﻩﻩ｛

ﻩa[k］=zonghaｎshu［k］［ARRAY_SIZE-tiｍe[k]-1]；

ﻩﻩ｝

ﻩ}

ﻩｉntｘ　＝a[0];

ﻩfor（ｉnti=1；　i〈SＩZE;ｉ+＋）{

ﻩｉf（a[i]>x）{

ﻩﻩﻩx=a[i];

ﻩﻩ}

ﻩ}

ｆｏr（intn　=　0；ｎ＜SIZE;　n＋＋）｛

ﻩﻩiｆ（x＝=a［n］）{

ﻩﻩtｉｍe[n］　=tｉme［n]＋1；

ﻩﻩbｒｅak;

ﻩﻩ}

｝

ｚｏngpaixu［j]　＝ｘ;

}

//归并

end_time　=clock（）；

doubleshijiａn=end_tｉmｅ-now＿ｔime；

ｆoｒ　（iｎｔi=0；ｉ〈SIZＥ*ARＲAY_SＩZE;i++）｛

ﻩpｒintf（"%d”,zongｐaixu［i]）；

}

priｎｔｆ（”所用时间:

％lf”,　sｈijiaｎ/CＬK_TＣK）;

while（ｔrue）;

}

四:

实验结果与分析

Mｐｉ：

串行

Ｍpi

1.2万

　2。

4万

３。

6万

4。

8万

6。

0万

7。

2万

串行（秒）

　０。

４41

１．766

3.9５1

6。

８7７

10．469

14．６87

6线（秒）

０。

029

０．108

０.242

０．43５

0。

656

0。

9４0

4线（秒）

０。

0３5

　0。

15１

０.33９

　０.６15

０.9６9

1.４0９

2线（秒）

0。

１19

0。

50２

1。

１08

　2。

0４0

　3。

1２1

4。

５1６

从表中可以看出4线程的时候，并行程序的速度是串行程序速度的十倍之多，而理论上大概８倍.这就跟改的程序有关.在并行程序中，最后采用的是归并,由此,发生了这些奇妙的情况:

实则本身的算法就比冒泡优一些,但又不能只采用冒泡算法，那样在最后又来个冒泡,其程序就没有意义了。

Openｍp：

这是4.8万个数排序的结果,可以看出用了2.876秒，比MＰI慢了四倍之多，这可能是程序的不合理，带来了多余的时间消耗（通信）。

但比串行还是要快很多。

五:

结论（讨论）

1、实验结论

１、就这冒泡排序改为并行的，虽然时间缩短了很多倍，但与快排等排序算法并行相比，其速度又不堪入目。

2、就冒泡排序而言，其mpi并行远远优于opｅnmｐ（就我写的程序而言.。

。

），虽然最后都用了并归。

２、讨论

1、这些程序都实现在一台电脑上完成的,还未试过与其他电脑通信，所以其所表现出来的结果并不完全按正确,毕竟并行计算涉及到不同主机之间的通信。

2、由于个人编程能力不高，在这里只讨论了一些时间上的差异，并未对空间上进行比对（不会。

。

）。

３、就openmp程序而言，应该还可以改写,增加其通用性和减少通信．

六、教师评审

教师评语

实验成绩

　　　　签名:

　　　　　　　　日期：

展开阅读全文