并行处理与体系结构实验报告.docx

资源描述

并行处理与体系结构实验报告.docx

《并行处理与体系结构实验报告.docx》由会员分享，可在线阅读，更多相关《并行处理与体系结构实验报告.docx（10页珍藏版）》请在冰豆网上搜索。

并行处理与体系结构实验报告.docx

并行处理与体系结构实验报告

并行处理及体系结构实验报告

ParallelComputingandarchitectureExperimentReport

班级：

计算机科学与技术

学号：

姓名：

指导教师：

信息学院

2013年11月

实验一

1.实验题目：

MPI安装与程序编译、运行和调试

2.实验目的：

搭建MPI并行编程环境，开发并行程序；学习并行程序的编写、编译、运行步骤，了解系统结构对编程模式和环境工具的影响。

3.实验内容：

通过查找资料，在Ubuntu下安装MPI平台。

1）MPI安装

进入终端，选择一个自己的目录，安装MPICH2，运行命令：

sudoapt-getinstallmpich2

2）安装配置文件并且进行设置：

运行命令1：

touchmpd.conf

运行命令2：

chmod600mpd.conf

在mpd.conf文件中输入以下文本内容并保存：

MPD_SECRETWORD=mr.chen

3）程序编译与运行

编译：

mpicc[filename.c]–o[newname]

运行：

mpirun–np[number]./[filename]

运行\实验代码\MPI运行程序\文件夹下面的hello.c、who.c、message.c、isend.c和mtpi.c程序实例，体会MPI中获取进程标识、消息传递及非阻塞通信等工作模式。

4.实验结果与分析：

通过MPI平台编译“实验代码\MPI运行程序\”文件夹下面的hello.c、who.c、message.c、isend.c和mtpi.c程序实例。

并利用MPI选择线程数量并运行相应可执行程序。

相应MPI运行结果如图1.1，图1.2，图1.3，图1.4，图1.5。

图1.1hello.c编译与运行结果

分析：

hello.c是非常简单的MPI程序，只用到了MPI中的两个函数，MPI_INIT：

启动MPI环境；MPI_FINALIZE：

结束MPI环境。

编译时确定进程数后，即可显示每个进程的结果。

图1.2who.c编译与运行结果

分析：

who.c中除了用到了MPI_INIT和MPI_FINALIZE之外，还用到了MPI_Comm_rank：

确定自己的进程标识符；MPI_Comm_size：

确定进程数。

在编译运行时就可以另每个进程标识自己了。

图1.3mpti.c编译与运行结果

分析：

mpti.c同样用到了MPI_Init、MPI_Finalize（）、MPI_Comm_rank、MPI_Comm_size。

并在who.c的基础上添加了计算圆周率的功能，

图1.4message.c编译与运行结果

分析：

message.c在前面几个程序的基础上使用了函数MPI_Recv：

接收其它进程消息；MPI_Send：

发送一条消息。

因此，这个程序实现了进程间的消息传递。

图1.5isend.c编译与运行结果

分析：

isend.c较为复杂，同样实现的进程间消息的传递。

消息传递模型中各个进程只能直接访问其局部内存空间，而对其他进程的局部内存空间的访问只能通过消息传递来实现。

阻塞和非阻塞通信的主要区别在于返回后的资源可用性。

阻塞通信返回的条件：

1通信操作已经完成，及消息已经发送或接收。

2调用的缓冲区可用。

若是发送操作，则该缓冲区可以被其它的操作更新；若是接收操作，该缓冲区的数据已经完整，可以被正确引用。

非阻塞通信返回后并不意味着通信操作的完成。

实验二

1.实验题目：

共享存储模型与消息传递模型的比较

2.实验目的：

比较共享存储模型与消息传递模型之间的区别。

了解多线程并行和消息传递并行的工作机制。

3.实验内容：

首先进行Linux下编译器GCC的安装与程序的编译运行。

1）编译器GCC安装

sudoapt-getinstallbuild-essential

2）GCC编译与运行OMP程序

编译：

gcc–fopenmp[sousefile]–o[destinationfile]

运行：

./[destinationfile]

MPI平台的安装与程序的编译运行见实验一。

统计10000个随机数中3出现的次数。

OPENMP线程数可为1、2、4等。

MPI程序进程数可为1、2、4等。

分别利用Ubuntu系统下的GCC，MPI编译运行。

4.实验结果与分析：

利用GCC编译运行共享存储模型程序代码，运行结果如图2.1。

图2.1共享存储模型程序运行结果

从图2.1中可能看出，共享存储模型程序1线程下运行时间为0.000488秒，2线程下运行时间为0.004853秒，4线程下运行时间为0.005289秒。

三类不同线程状态下统计出的随机数的数量均为959个。

openMP可以实现拆分循环，每个线程平均负责一部分随机数出现次数的计算，从而加快了计算速度。

利用MPI编译运行消息传递模型程序代码，结果如图2.2所示。

图2.2消息传递模型程序运行结果

从图2.2看出消息传递模型统计出的随机数个数并不相同，1线程下随机数个数为959，2线程下随机数个数为968，4线程下随机数个数为1028。

此MPI程序利用到MPI_Recv、MPI_Send函数进行消息的传递与接收，并通过MPI_Reduce函数进行归约，从而达到计算随机数个数的目的。

消息传递模型程序见附录。

共享存储模型利用共享变量实现并行进程间的通信。

消息传递模型中，驻留在不同节点上的进程可以通过传递消息互相通信。

两者各有利弊，一个适合用单线程操作于密集的数据结构，一个在异步多线程条件下更有优势。

实验三

实验题目：

八皇后问题

实验目的：

（1）八皇后问题是计算机中经典智能搜索问题。

掌握在MPI虚拟机上进行八皇后问题求解算法及其程序设计、运行。

（2）在分析八皇后的并行算法和MPI源程序基础上。

查找相关参考资料，对于一般的n皇后问题，设计其并行算法及其程序，并运行结果。

实验内容：

在单机或多机上完成8、12、16、32等n皇后问题求解，并比较运行时间，计算加速比。

本实验以11皇后为例，利用MPI编译与运行，通过比较不同线程下的运行时间，计算加速比。

实验结果与分析：

在各个不同线程下求得11皇后的分布结果与用时如图3.1，图3.2，图3.3，图3.4所示。

图3.1单线程下11皇后的分布结果与用时

单线程下11皇后运行时间为0.64秒，结果为2680个。

图3.2双线程下11皇后的分布结果与用时

双线程下11皇后的运行时间为0.36，结果不变，可得加速比为：

0.64/0.36=1.778。

图3.3四线程下11皇后的分布结果与用时

双线程下11皇后的运行时间为0.37，结果不变。

可得加速比为：

0.64/0.37=1.740。

图3.4八线程下11皇后的分布结果与用时

八线程下11皇后的运行时间为0.37，结果不变。

可得加速比为：

0.64/0.37=1.740。

从运行时间与加速比可以看出，多线程下确实加快的求解的速度，但一味的增加线程数量并不是总能提高求解速度，反而会增加并行开销，使求解时间变长。

此实验条件下双线程下求解效果最好。

展开阅读全文