奥鹏南开20春学期《并行程序设计》在线作业标准答案.docx
《奥鹏南开20春学期《并行程序设计》在线作业标准答案.docx》由会员分享,可在线阅读,更多相关《奥鹏南开20春学期《并行程序设计》在线作业标准答案.docx(13页珍藏版)》请在冰豆网上搜索。
奥鹏南开20春学期《并行程序设计》在线作业标准答案
南开大学
《并行程序设计》在线作业
参考答案
20春学期(1709、1803、1809、1903、1909、2003)《并行程序设计》在线作业
1.定期评选全球计算能力最强的超级计算机的国际组织是____。
【选项】:
Atop500
Bgreen500
Cgraph500
Dsuper500
【答案】:
A
2.Flynn分类法中,下面哪种体系结构在实际中几乎没有意义?
【选项】:
ASISD
BSIMD
CMISD
DMIMD
【答案】:
C
3.编写n个数求和的OpenMP程序,最高效的方法是____。
【选项】:
A多线程直接并发累加到共享变量
B将累加操作设置为临界区
C在累加操作前设置障碍
D采用归约指令
【答案】:
D
4.n个处理器、n个内存模块的交叉开关构造成本为____。
【选项】:
AO(logn)
BO(n)
CO(nlogn)
DO(n^2)
【答案】:
D
5.在共享内存架构编程中,线程间不能通过____进行通信
【选项】:
A全局变量
B局部变量
C静态变量
D全局堆中变量
【答案】:
B
6.每个AVX寄存器宽度为____位。
【选项】:
A32
B64
C128
D256
【答案】:
D
7.采用划分子矩阵方法实现矩阵乘法,在进行SSE并行化时,是对(由外至内数)第____层循环进行循环展开然后向量化。
【选项】:
A3
B4
C5
D6
【答案】:
D
8.OpenMP循环划分策略不包括____。
【选项】:
Astatic
Bfixed
Cdynamic
Dguided
【答案】:
B
9.对天气预报问题,将大气层划分为5*10^8个网格单元,每个时间步每个网格需200个浮点运算,时间间隔设置为10分钟,计算10天内大气运动,100MFlops计算能力的计算机需要多少天?
【选项】:
A1
B10
C100
D300
【答案】:
C
10.____不是SIMD架构。
【选项】:
ASSE
B超线程
CAltiVec
DNeon
【答案】:
B
11.AVX有____个专用寄存器。
【选项】:
A4
B8
C16
D34
【答案】:
C
12.在用pthread_mutex_lock对互斥量进行加锁时,若其已上锁,则线程进入____状态。
【选项】:
A初始化
B阻塞
C继续执行
D销毁
【答案】:
B
13.Neon是____平台的SIMD架构。
【选项】:
Ax86
BPOWER
CSPARC
DARM
【答案】:
D
14.一个SSE寄存器可容纳____个短整型数。
【选项】:
A2
B4
C8
D16
【答案】:
C
15.SSEintrinsics_mm_load_pd命令的功能是____。
【选项】:
A对齐向量读取单精度浮点数
B未对齐向量读取单精度浮点数
C对齐向量读取双精度浮点数
D未对齐向量读取双精度浮点数
【答案】:
C
16.对双精度浮点计算,AVX最高实现____路并行。
【选项】:
A2
B4
C8
D16
【答案】:
B
17.OpenMP并行模型是一种____模式。
【选项】:
A静态线程
B对等式多线程
C加锁-解锁
DFork-join
【答案】:
D
18.通常忙等待方法的性能要比互斥量方法的性能____。
【选项】:
A更高
B更低
C高低不确定
D以上皆错
【答案】:
B
19.在矩阵乘法的串行程序中,对____部分进行向量化收益最大。
【选项】:
A初始化
B第二个矩阵转置循环
C矩阵元素乘—加计算的循环
D结果输出
【答案】:
C
20.多对多广播/归约高效算法基于____。
【选项】:
A递归思想
B流水线思想
C分治思想
D贪心思想
【答案】:
B
21.对于向量化,以下说法错误的是____。
【选项】:
A总会有打包/解包开销
B若运算对象连续存储,可消除打包开销
C若运算结果连续存储,可消除解包开销
D打包/解包开销由数据存储决定
【答案】:
A
22.现代CPU中都具有指令乱序执行功能,其目的不包括____。
【选项】:
A消除指令依赖,更充分利用多流水线
B提高cache效率
C改变计算结果
D消除资源冲突
【答案】:
C
23.传统科学和工程实验相对于计算机并行仿真的劣势不包括____。
【选项】:
A成本太高
B结果不准确
C时间太长
D太危险
【答案】:
B
24.为了充分利用CPU内的多条流水线,程序应满足____。
【选项】:
A相邻指令无依赖性
B相邻指令相互依赖
C整段程序中指令无依赖性
D整段程序中指令相互依赖
【答案】:
A
25.pthread_create函数中设置一个参数为“线程函数参数”的原因是____。
【选项】:
A它调用线程函数时可直接传递,性能更优
B它需要预处理之后传递给线程函数
C线程函数不是用户程序调用,只能采用这种方式由系统代为传递参数
D没有特别用意
【答案】:
C
26.天河1号、天河2号、神威.太湖之光总体上都是____架构
【选项】:
A单核
B多核
C众核
D集群
【答案】:
D
27.如果运算结果要保存到独立无关的变量,则在向量运算之后需要进行的一个操作是____。
【选项】:
A对齐
B打包
C解包
D以上皆错
【答案】:
C
28.每个SSE寄存器宽度为____位。
【选项】:
A32
B64
C128
D256
【答案】:
C
29.pthread_sem_post是对信号量进行____操作。
【选项】:
A加锁
B解锁
C加1
D减1
【答案】:
D
30.一个Neon寄存器最多存放____个整型数。
【选项】:
A2
B4
C8
D16
【答案】:
B
31.在用pthread_mutex_trylock对互斥量进行加锁时,若其已上锁,则线程进入____状态。
【选项】:
A初始化
B阻塞
C继续执行
D销毁
【答案】:
C
32.当处理器数量不变时,随着问题规模增大,效率增大对____成立。
【选项】:
A部分并行算法
B所有并行算法
C所有并行算法都不
D以上皆错
【答案】:
A
33.实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是____。
【选项】:
Aompparallel
Bompbarrier
Compcritical
Dompreduce
【答案】:
C
34.动态任务划分相对于静态任务划分的缺点是____。
【选项】:
A可能导致负载不均
B通信开销高
C任务粒度粗
D计算复杂度高
【答案】:
B
35.pthread_join的第二个参数的作用是____。
【选项】:
A设置指定线程属性
B获取指定线程属性
C向指定线程传递参数
D获取指定线程函数返回结果
【答案】:
D
36.关于OpenMP循环并行程序的编写,下列说法中正确的是____。
【选项】:
A程序员需要编写线程创建和管理代码
B程序员需要编写循环划分代码
C程序员需要编写调度策略代码
D程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么
【答案】:
D
37.SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:
7],若imm8[j]=0则表示___。
【选项】:
A将第一个源寄存器的第j个元素放在目标寄存器位置0
B将第二个源寄存器的第j个元素放在目标寄存器位置0
C将第一个源寄存器的第j个元素放在目标寄存器位置j
D将第二个源寄存器的第j个元素放在目标寄存器位置j
【答案】:
C
38.对于条件变量,下列说法错误的是____。
【选项】:
A可以用互斥量实现相同功能
B不能用互斥量实现相同功能
C较之互斥量方案节省资源
D较之互斥量方案代码更简洁
【答案】:
B
39.在超市的顾客购买商品记录中统计一些商品组合的购买频率,将购买频率(商品组合)划分给不同进程,这是一种划分____的数据并行策略。
【选项】:
A输入数据
B中间结果
C输出数据
D临时数据
【答案】:
C
40.为持续提高CPU性能,以下说法正确的是____。
【选项】:
A只需不断增加器件集成密度
B只需不断提高频率
C必须利用并行技术
D只需提高功耗
【答案】:
C
41.对于搜索分解,下面哪个说法是错误的_____。
【选项】:
A所有子树搜索任务都必须全部完成
B工作量可能大于串行计算
C工作量可能小于串行计算
D可能产生超线性加速比
【答案】:
A
42.一个AVX寄存器最多存放____个短整型数。
【选项】:
A2
B4
C8
D16
【答案】:
D
43.在使用信号量之后必须对其进行____。
【选项】:
A初始化
B解锁
C减1
D销毁
【答案】:
D
44.起泡排序改为奇偶转置排序,消除了循环步间的数据依赖的原因是____。
【选项】:
A增大了元素比较距离
B减小了元素比较距离
C改为元素两两分组比较
D消除了元素比较
【答案】:
C
45.下面说法错误的是____。
【选项】:
A不存在权威的并行体系结构
B学习并行程序设计只关心软件即可
C并行体系结构对性能有巨大影响
D很多并行体系结构未来发展不明了
【答案】:
B
46.在条件不成立时,使用pthread_cond_wait____。
【选项】:
A令线程阻塞
B解锁互斥量
C解锁互斥量然后令线程阻塞
D加锁互斥量
【答案】:
C
47.关于MPI是什么,以下说法错误的是____。
【选项】:
A一种消息传递编程模型标准
B一种共享内存编程模型标准
C编程角度看是C++/Fortran等的库
D基于SPMD模型
【答案】:
B
48.使用一个信号量实现“主线程等待4个从线程完成任务”,信号量初始值应设置为____。
【选项】:
A0
B1
C2
D4
【答案】:
A
49.CUDA的优点不包括____。
【选项】:
A可移植性
B入门简单
C标准的SPMD模式
D不再需要图形API
【答案】:
A
50.将寄存器设置为4个给定单精度浮点数的SSEintrinsics指令是____。
【选项】:
A_mm_set_ps
B_mm_set1_ss
C_mm_setzero_ss
D_mm_setzero_ps
【答案】:
A