ImageVerifierCode 换一换
格式:DOCX , 页数:16 ,大小:164.82KB ,
资源ID:8985727      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/8985727.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(矩阵乘法MPI并行程序报告.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

矩阵乘法MPI并行程序报告.docx

1、矩阵乘法MPI并行程序报告1.实验目的1.1掌握集群的使用方法。1.2掌握以并行的方式分析问题、设计并行程序的方法。1.3掌握如何对并行程序进行简单的性能分析2.实验要求122.1使用MPI、OpenMp等并行程序设计方法设计矩阵乘法的并行程序。2.2随机产生所需的矩阵元素,数据项不得少于1000*1000。2.3尽量设计较高的加速比3.实验环境1233.1硬件环境:两个集群节点blade13、blade15。3.2软件环境:Linux、gcc、Win7、VC+6.0。3.3连接方式:Xmanager Enterprise 4.0远程桌面连接211.69.198.203。4.实验程序12344

2、.1随机算法产生矩阵:srand(unsigned int)time(NULL); for (i=0; iN; i+) for (j=0; jN; j+) Aij = rand() % 10; Bij = rand() % 10; Cik = 0; 4.2串行程序设计 time(&start); for (i=0; iM; i+) for (k=0; kM; k+) Cik = 0; for (j=0; jM; j+) Cik += Aij*Bjk; time(&end);4.3并行程序设计MPI_Init(&argc,&argv)和MPI_Finalize()MPI_Init用来初始化MPI

3、执行环境,建立多个MPI进程之间的联系,为后续通信做准备。而MPI_Finalize则是结束MPI执行环境。这两个函数就是定义MPI程序的并行区的,除了检测是否初始化的函数之外,不应该在这两个函数定义的区域外调用其它MPI函数。这两个函数都返回整型值,标识函数是否调用成功。int MPI_Comm_rank(MPI_Comm comm, int *rank) MPI_Comm_rank函数用来标识各个MPI进程,获取调用该函数进程的进程号,将自身与其他进程区分。MPI_Comm_rank返回整型的错误值,需要提供两个参数:MPI_Comm类型的通信域,标识参与计算的MPI进程组。上面例子中使用

4、的是MPI_COMM_WORLD,这个进程组是MPI实现预先定义好的进程组,指的是所有MPI进程所在的进程组。如果想要申请自己的特殊的进程组,则需要通过MPI_Comm定义并通过其它MPI函数生成。&rank返回调用进程中的标识号。int MPI_Comm_size( MPI_Comm comm, int *size) MPI_Comm_size函数用来获取指定通信域的进程个数,确定自身需要完成的任务数。 MPI_Comm类型的通信域,标识参与计算的MPI进程组。上面的例子中用的是MPI_COMM_WORLD。&size返回相应进程组中的进程数。int MPI_Send(void *buf,

5、int count, MPI_Datatype datatype, int dest, int tag, MPI_Comm comm)MPI_Send 函数用于发送一个消息到目标进程。通信域中的dest进程发送数据,数据存放在buf中,类型是datatype,个数是count,这个消息的标志是tag,用以和本进程向同一目的进程发送的其它消息区别开来。int MPI_Recv(void *buf, int count, MPI_Datatype datatype, int source, int tag, MPI_Comm comm, MPI_Status *status)MPI_Recv 函数

6、用于从指定进程接收一个消息。它的含义是进程从comm域中source进程接收标签号为tag的数据,并保存到buf中。接收缓冲区buf的大小不能小于发送过来的消息的长度。否则会由于数组越界导致程序出错。主进程 if(process_id = 0) row_aver = N / slave_num; remainder = N % slave_num; offset = 0; for(dest=1; dest=slave_num; dest+) rows = (dest = remainder) ? row_aver+1 : row_aver; printf(sending %d rows to

7、process %dn, rows, dest); MPI_Send(&offset,1,MPI_INT,dest,FROM_MASTER, MPI_COMM_WORLD); MPI_Send(&rows,1,MPI_INT,dest,FROM_MASTER, MPI_COMM_WORLD);MPI_Send(&Aoffset0,rows*N,MPI_INT,dest,FROM_MASTER, MPI_COMM_WORLD); MPI_Send(&B,N*N,MPI_INT,dest,FROM_MASTER,MPI_COMM_WORLD); offset += rows; start_time

8、 = MPI_Wtime(); for(source=1; source 0) MPI_Recv(&offset,1,MPI_INT,0,FROM_MASTER,MPI_COMM_WORLD,&status); MPI_Recv(&rows,1,MPI_INT,0,FROM_MASTER,MPI_COMM_WORLD,&status); MPI_Recv(&A,rows*N,MPI_INT,0,FROM_MASTER,MPI_COMM_WORLD,&status); MPI_Recv(&B,N*N,MPI_INT,0,FROM_MASTER,MPI_COMM_WORLD,&status); /

9、矩阵乘法 for(i=0; irows; i+) for (k=0; kN; k+) int tmp = Aik; for (j=0; jN; j+) Cij += tmp*Bkj; /利用 MPI_Send(&offset,1,MPI_INT,0,FROM_SLAVE,MPI_COMM_WORLD); MPI_Send(&rows,1,MPI_INT,0, FROM_SLAVE, MPI_COMM_WORLD); MPI_Send(&C,rows*N,MPI_UNSIGNED_LONG_LONG,0,FROM_SLAVE, MPI_COMM_WORLD); MPI_Finalize(); r

10、eturn 0;5.性能分析分析公式:加速比=串行执行时间/并行执行时间效率=加速比/节点数123455.1串行程序的执行时间(秒) 矩阵规模实验结果1000200030004000第1次11.00099.000372.000799.000第2次11.00098.000376.000799.000第3次11.00099.000373.000802.000平均值11.00098.667373.667800.000图1. 不同矩阵规模下串行程序的执行时间5.2八个节点时,不同矩阵规模并行程序的执行时间(秒) 矩阵规模实验结果1000200030004000第1次0.8296.83323.37255

11、.422第2次0.8326.83823.31555.786第3次0.8376.82023.56055.732平均值0.8336.83023.41655.647加速比13.20514.44615.95814.376效率1.6511.8061.9951.797图2. 八个节点时,不同矩阵规模下并行程序的执行时间图3. 八个节点时,不同矩阵规模下并行程序的加速比图4. 八个节点时,不同矩阵规模下并行程序的效率分析随着矩阵规模的增加执行时间程序的执行时间急剧增加。加速比程序的加速比基本保持不变。效率程序的效率基本保持不变。5.3矩阵规模为1000*1000时,不同节点数下并行程序的执行时间(秒) 节点

12、个数实验结果2345678第1次5.7922.9171.9451.4551.1700.9730.829第2次5.7932.8991.9441.4741.1670.9710.832第3次5.8382.9151.9351.4531.1690.9750.837平均值5.8082.9101.9411.4611.1690.9730.833加速比1.984 3.780 5.667 7.259 9.410 11.305 13.205 效率0.992 1.260 1.417 1.452 1.568 1.615 1.651 图5.矩阵规模1000*1000时,不同节点下的并行程序的执行时间图6.矩阵规模1000

13、*1000时,不同节点下的并行程序的加速比图7.矩阵规模1000*1000时,不同节点下的并行程序的效率分析随着计算节点数的增加,执行时间程序的执行时间迅速减少,然后趋于平稳。加速比程序的加速比基本呈线性增长,公式趋y=1.8374x+0.022。效率程序的效率逐步增长,然后趋于平缓。6.用户手册1234566.1连接:ssh pppusr211.69.168.203 密码:*6.2登陆:sudo ssh blade13或者blade156.3切换至工作目录: cd /home/pppusr/*6.4编译:mpicc -o matrix matrix_multi.c6.5运行:mpirun -

14、np 8 ./matrix#include #include #include #define N 1000 #define FROM_MASTER 1#define FROM_SLAVE 2int ANN, BNN;unsigned long long CNN;MPI_Status status;/消息接收状态变量,存储也是分布的 int main(int argc, char *argv) int process_num; /进程数,该变量为各处理器中的同名变量, 存储是分布的 int process_id; int slave_num; int dest; /目的进程标识号 int so

15、urce; /发送数据进程的标识号 int rows; int row_aver; int remainder; int offset;/行偏移量 int i, j, k; double start_time, end_time; srand(unsigned int)time(NULL); for (i=0; iN; i+) for (j=0; jN; j+) Aij = rand() % 10; Bij = rand() % 10; Cik = 0; MPI_Init(&argc, &argv);/初始化MPI /*该函数被各进程各调用一次,得到各自的进程id值*/ MPI_Comm_ra

16、nk(MPI_COMM_WORLD, &process_id); /*该函数被各进程各调用一次,得到进程数*/ MPI_Comm_size(MPI_COMM_WORLD, &process_num); slave_num = process_num - 1; if(process_id = 0) row_aver = N / slave_num; remainder = N % slave_num; offset = 0; /有的程序是将时间函数放在这个for循环的两边 for(dest=1; dest=slave_num; dest+) rows = (dest = remainder) ?

17、 row_aver+1 : row_aver; printf(sending %d rows to process %dn, rows, dest); MPI_Send(&offset, 1, MPI_INT, dest, FROM_MASTER, MPI_COMM_WORLD); MPI_Send(&rows, 1, MPI_INT, dest, FROM_MASTER, MPI_COMM_WORLD); MPI_Send(&Aoffset0, rows*N, MPI_INT, dest, FROM_MASTER, MPI_COMM_WORLD); MPI_Send(&B, N*N, MPI

18、_INT, dest, FROM_MASTER, MPI_COMM_WORLD); offset += rows; start_time = MPI_Wtime(); for(source=1; source 0) MPI_Recv(&offset, 1, MPI_INT, 0, FROM_MASTER, MPI_COMM_WORLD, &status); MPI_Recv(&rows, 1, MPI_INT, 0, FROM_MASTER, MPI_COMM_WORLD, &status); MPI_Recv(&A, rows*N, MPI_INT, 0, FROM_MASTER, MPI_

19、COMM_WORLD, &status); MPI_Recv(&B, N*N, MPI_INT, 0, FROM_MASTER, MPI_COMM_WORLD, &status); for(i=0; irows; i+) for (k=0; kN; k+) int tmp = Aik; for (j=0; jN; j+) Cij += tmp*Bkj; MPI_Send(&offset, 1, MPI_INT, 0, FROM_SLAVE, MPI_COMM_WORLD); /将行偏移量发回主进程 MPI_Send(&rows, 1, MPI_INT, 0, FROM_SLAVE, MPI_COMM_WORLD); /将行数发回主进程 MPI_Send(&C, rows*N, MPI_UNSIGNED_LONG_LONG, 0, FROM_SLAVE, MPI_COMM_WORLD); /将计算得到的值发回主进程 /*关闭MPI,标志并行代码段的结束*/ MPI_Finalize(); return 0; (注:可编辑下载,若有不当之处,请指正,谢谢!)

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1