南开20秋学期《并行程序设计》在线作业答案0118Word文档格式.docx
《南开20秋学期《并行程序设计》在线作业答案0118Word文档格式.docx》由会员分享,可在线阅读,更多相关《南开20秋学期《并行程序设计》在线作业答案0118Word文档格式.docx(19页珍藏版)》请在冰豆网上搜索。
A
(单选题)4:
对这样的循环for(i=0;
i1
可能随着处理器数量增大趋向于0
B
(单选题)11:
SSEintrinsics_mm_store_sd命令的功能是____。
对齐向量存单精度浮点数
未对齐向量存单精度浮点数
对齐标量存双精度浮点数
未对齐标量存双精度浮点数
C
(单选题)12:
和一对多广播对应的组通信操作是____。
多对一收集
多对多收集
多对一归约
多对多归约
(单选题)13:
对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。
声明语句
条件分支语句
循环语句
输入输出语句
(单选题)14:
若SIMD并行化时遇到对齐问题,下列说法正确的是____。
只能使用不对齐访存指令
不能进行SIMD并行化
对齐开销可能完全抵消SIMD并行收益
以上皆错
(单选题)15:
使用____无法直接实现“主线程唤醒4个从线程去执行任务”。
1个信号量
障碍
1个互斥量
4个互斥量
(单选题)16:
在使用条件变量时,还需配套使用一个____。
互斥量
信号量
自旋锁
(单选题)17:
OpenMP中指定单线程执行的指令是____。
ompatomic
omponly
ompstatic
ompsingle
(单选题)18:
在条件成立时使用pthread_cond_signal____。
唤醒等待线程
解锁互斥量
加锁互斥量
唤醒等待线程,该线程重新加锁互斥量
(单选题)19:
MPI收发各一条消息的API是_____。
MPI_Sendrecv
MPI_Send
MPI_Recv
MPI_Replace
(单选题)20:
OpenMP循环划分策略不包括____。
static
fixed
dynamic
guided
(单选题)21:
第一款桌面多核CPU是____发布的。
Intel
AMD
IBM
SUN
(单选题)22:
pthread_join的作用是____。
强制终止指定线程
检测指定线程是否结束
等待指定线程结束才返回
向指定线程发送数据
(单选题)23:
静态线程编程模式的缺点是____。
线程管理开销高
系统资源利用率低
线程负载不均
线程通信开销高
(单选题)24:
控制流语句进行SIMD并行化很困难的原因是控制流语句导致____。
连续数据执行不同指令
连续数据执行相同指令
同一数据执行不同指令
同一数据执行相同指令
(单选题)25:
OpenMP循环并行指令是____。
ompparallel
ompparallelfor
ompmaster
(单选题)26:
任务依赖图中顶点权重之和表示____。
任务数
任务难度
串行执行时间
并行执行时间
(单选题)27:
OpenMP主要是通过____来更高层抽象的多线程编程。
设计实现新的语言
为现有语言提供大量库函数
为现有语言扩展编译指示
新编译器实现自动并行化
(单选题)28:
MPI默认点对点通信模式是____。
阻塞的
非阻塞的
对等的
主从的
(单选题)29:
下面说法错误的是____。
不存在权威的并行体系结构
学习并行程序设计只关心软件即可
并行体系结构对性能有巨大影响
很多并行体系结构未来发展不明了
(单选题)30:
关于OpenMP程序中的并行结构,以下说法正确的是____。
其结束时需程序员人为添加同步
其结束时OpenMP已默认添加隐式障碍
其结束时完全不需要同步
其结束时必须进行同步
(单选题)31:
GPU相对于其他众核产品的优势不包括____。
平台普及
有CUDA这样易学的开发工具
性价比高
由英伟达公司一家把控
(单选题)32:
MPI的通信是____。
无类型传输
弱类型传输
强类型传输
(单选题)33:
对单精度浮点计算,MMX最高实现____路并行。
8
16
(单选题)34:
n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法____。
肯定不是代价最优
肯定是代价最优
不确定是否代价最优
(单选题)35:
OpenMP是___的一个常见替代。
SSE
MPI
Pthread
CUDA
(单选题)36:
n个节点的超立方构造成本为____。
O(logn)
O(sqrt(n))
O(n)
O(nlogn)
(单选题)37:
Pthread是_____线程接口标准。
Linux
POSIX
Windows
IOS
(单选题)38:
一个AVX寄存器最多存放____个整型数。
(单选题)39:
新一代GPU重点提供的新特性不包括____。
新型高速显存
GPU间直接高速互联
自动并行化
人工智能计算专门优化
(单选题)40:
编写矩阵乘法的SSE程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
(单选题)41:
在使用互斥量之后必须对其进行____。
初始化
加锁
解锁
销毁
(单选题)42:
对于多线程各自进行本地运算,然后由主线程汇总结果的模式,下面说法正确的是____。
在同构核心上,线程运行速度一样,主线程无需等待,直接汇总结果即可
线程运行速度可能不一致,必须采用同步保证主线程汇总正确结果
太多本地运算,不能体现并行效果,不是好的模式
主线程汇总结果在性能上必然不如多线程并行汇总结果
(单选题)43:
在下面问题中,SIMD并行最不适合____。
向量加法
向量中元素排序
矩阵向量乘法
矩阵加法
(单选题)44:
忙等待方法解决竞争条件的思路是____。
令CPU一直处于忙碌状态无法产生竞争条件
令存在数据依赖的内存操作充分并行
强制多线程进入临界区的顺序来将存在数据依赖内存操作串行化
(单选题)45:
OpenMP中多线程间是一种____关系。
主从
分组
对等
竞争
(单选题)46:
SSE的shuffle指令的8位二进制整数参数被划分为4个2位二进制整数imm8[0:
3],若imm8[1]=j则表示___。
将第一个源寄存器的第j个元素放在目标寄存器位置1
将第二个源寄存器的第j个元素放在目标寄存器位置1
将第一个源寄存器的第1个元素放在目标寄存器位置1
将第二个源寄存器的第1个元素放在目标寄存器位置1
(单选题)47:
采用划分子矩阵(大小b*b)的方法实现n*n矩阵乘法,一次乘—加运算涉及的子矩阵可全部放入cache,则整个计算过程中,两个输入矩阵的每个元素会产生____次访存。
n
t
n-t
n/t
(单选题)48:
多线程是____架构下的并行模式。
MIMD
共享内存
分布式内存
分离式地址空间
(单选题)49:
在对互斥量进行解锁时,还会执行____操作。
互斥量初始化
互斥量销毁
唤醒阻塞线程
(单选题)50:
全球500强超算越来越体现出依赖____提供强大计算能力的趋势。
单核CPU
多核CPU
FPGA
众核协处理器