奥鹏南开20春学期《并行程序设计》在线作业标准答案.docx

上传人:b****5 文档编号:11873965 上传时间:2023-04-08 格式:DOCX 页数:13 大小:18.69KB
下载 相关 举报
奥鹏南开20春学期《并行程序设计》在线作业标准答案.docx_第1页
第1页 / 共13页
奥鹏南开20春学期《并行程序设计》在线作业标准答案.docx_第2页
第2页 / 共13页
奥鹏南开20春学期《并行程序设计》在线作业标准答案.docx_第3页
第3页 / 共13页
奥鹏南开20春学期《并行程序设计》在线作业标准答案.docx_第4页
第4页 / 共13页
奥鹏南开20春学期《并行程序设计》在线作业标准答案.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

奥鹏南开20春学期《并行程序设计》在线作业标准答案.docx

《奥鹏南开20春学期《并行程序设计》在线作业标准答案.docx》由会员分享,可在线阅读,更多相关《奥鹏南开20春学期《并行程序设计》在线作业标准答案.docx(13页珍藏版)》请在冰豆网上搜索。

奥鹏南开20春学期《并行程序设计》在线作业标准答案.docx

奥鹏南开20春学期《并行程序设计》在线作业标准答案

南开大学

《并行程序设计》在线作业

参考答案

20春学期(1709、1803、1809、1903、1909、2003)《并行程序设计》在线作业

1.定期评选全球计算能力最强的超级计算机的国际组织是____。

【选项】:

Atop500

Bgreen500

Cgraph500

Dsuper500

【答案】:

A

2.Flynn分类法中,下面哪种体系结构在实际中几乎没有意义?

【选项】:

ASISD

BSIMD

CMISD

DMIMD

【答案】:

C

3.编写n个数求和的OpenMP程序,最高效的方法是____。

【选项】:

A多线程直接并发累加到共享变量

B将累加操作设置为临界区

C在累加操作前设置障碍

D采用归约指令

【答案】:

D

4.n个处理器、n个内存模块的交叉开关构造成本为____。

【选项】:

AO(logn)

BO(n)

CO(nlogn)

DO(n^2)

【答案】:

D

5.在共享内存架构编程中,线程间不能通过____进行通信

【选项】:

A全局变量

B局部变量

C静态变量

D全局堆中变量

【答案】:

B

6.每个AVX寄存器宽度为____位。

【选项】:

A32

B64

C128

D256

【答案】:

D

7.采用划分子矩阵方法实现矩阵乘法,在进行SSE并行化时,是对(由外至内数)第____层循环进行循环展开然后向量化。

【选项】:

A3

B4

C5

D6

【答案】:

D

8.OpenMP循环划分策略不包括____。

【选项】:

Astatic

Bfixed

Cdynamic

Dguided

【答案】:

B

9.对天气预报问题,将大气层划分为5*10^8个网格单元,每个时间步每个网格需200个浮点运算,时间间隔设置为10分钟,计算10天内大气运动,100MFlops计算能力的计算机需要多少天?

【选项】:

A1

B10

C100

D300

【答案】:

C

10.____不是SIMD架构。

【选项】:

ASSE

B超线程

CAltiVec

DNeon

【答案】:

B

11.AVX有____个专用寄存器。

【选项】:

A4

B8

C16

D34

【答案】:

C

12.在用pthread_mutex_lock对互斥量进行加锁时,若其已上锁,则线程进入____状态。

【选项】:

A初始化

B阻塞

C继续执行

D销毁

【答案】:

B

13.Neon是____平台的SIMD架构。

【选项】:

Ax86

BPOWER

CSPARC

DARM

【答案】:

D

14.一个SSE寄存器可容纳____个短整型数。

【选项】:

A2

B4

C8

D16

【答案】:

C

15.SSEintrinsics_mm_load_pd命令的功能是____。

【选项】:

A对齐向量读取单精度浮点数

B未对齐向量读取单精度浮点数

C对齐向量读取双精度浮点数

D未对齐向量读取双精度浮点数

【答案】:

C

16.对双精度浮点计算,AVX最高实现____路并行。

【选项】:

A2

B4

C8

D16

【答案】:

B

17.OpenMP并行模型是一种____模式。

【选项】:

A静态线程

B对等式多线程

C加锁-解锁

DFork-join

【答案】:

D

18.通常忙等待方法的性能要比互斥量方法的性能____。

【选项】:

A更高

B更低

C高低不确定

D以上皆错

【答案】:

B

19.在矩阵乘法的串行程序中,对____部分进行向量化收益最大。

【选项】:

A初始化

B第二个矩阵转置循环

C矩阵元素乘—加计算的循环

D结果输出

【答案】:

C

20.多对多广播/归约高效算法基于____。

【选项】:

A递归思想

B流水线思想

C分治思想

D贪心思想

【答案】:

B

21.对于向量化,以下说法错误的是____。

【选项】:

A总会有打包/解包开销

B若运算对象连续存储,可消除打包开销

C若运算结果连续存储,可消除解包开销

D打包/解包开销由数据存储决定

【答案】:

A

22.现代CPU中都具有指令乱序执行功能,其目的不包括____。

【选项】:

A消除指令依赖,更充分利用多流水线

B提高cache效率

C改变计算结果

D消除资源冲突

【答案】:

C

23.传统科学和工程实验相对于计算机并行仿真的劣势不包括____。

【选项】:

A成本太高

B结果不准确

C时间太长

D太危险

【答案】:

B

24.为了充分利用CPU内的多条流水线,程序应满足____。

【选项】:

A相邻指令无依赖性

B相邻指令相互依赖

C整段程序中指令无依赖性

D整段程序中指令相互依赖

【答案】:

A

25.pthread_create函数中设置一个参数为“线程函数参数”的原因是____。

【选项】:

A它调用线程函数时可直接传递,性能更优

B它需要预处理之后传递给线程函数

C线程函数不是用户程序调用,只能采用这种方式由系统代为传递参数

D没有特别用意

【答案】:

C

26.天河1号、天河2号、神威.太湖之光总体上都是____架构

【选项】:

A单核

B多核

C众核

D集群

【答案】:

D

27.如果运算结果要保存到独立无关的变量,则在向量运算之后需要进行的一个操作是____。

【选项】:

A对齐

B打包

C解包

D以上皆错

【答案】:

C

28.每个SSE寄存器宽度为____位。

【选项】:

A32

B64

C128

D256

【答案】:

C

29.pthread_sem_post是对信号量进行____操作。

【选项】:

A加锁

B解锁

C加1

D减1

【答案】:

D

30.一个Neon寄存器最多存放____个整型数。

【选项】:

A2

B4

C8

D16

【答案】:

B

31.在用pthread_mutex_trylock对互斥量进行加锁时,若其已上锁,则线程进入____状态。

【选项】:

A初始化

B阻塞

C继续执行

D销毁

【答案】:

C

32.当处理器数量不变时,随着问题规模增大,效率增大对____成立。

【选项】:

A部分并行算法

B所有并行算法

C所有并行算法都不

D以上皆错

【答案】:

A

33.实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是____。

【选项】:

Aompparallel

Bompbarrier

Compcritical

Dompreduce

【答案】:

C

34.动态任务划分相对于静态任务划分的缺点是____。

【选项】:

A可能导致负载不均

B通信开销高

C任务粒度粗

D计算复杂度高

【答案】:

B

35.pthread_join的第二个参数的作用是____。

【选项】:

A设置指定线程属性

B获取指定线程属性

C向指定线程传递参数

D获取指定线程函数返回结果

【答案】:

D

36.关于OpenMP循环并行程序的编写,下列说法中正确的是____。

【选项】:

A程序员需要编写线程创建和管理代码

B程序员需要编写循环划分代码

C程序员需要编写调度策略代码

D程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么

【答案】:

D

37.SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:

7],若imm8[j]=0则表示___。

【选项】:

A将第一个源寄存器的第j个元素放在目标寄存器位置0

B将第二个源寄存器的第j个元素放在目标寄存器位置0

C将第一个源寄存器的第j个元素放在目标寄存器位置j

D将第二个源寄存器的第j个元素放在目标寄存器位置j

【答案】:

C

38.对于条件变量,下列说法错误的是____。

【选项】:

A可以用互斥量实现相同功能

B不能用互斥量实现相同功能

C较之互斥量方案节省资源

D较之互斥量方案代码更简洁

【答案】:

B

39.在超市的顾客购买商品记录中统计一些商品组合的购买频率,将购买频率(商品组合)划分给不同进程,这是一种划分____的数据并行策略。

【选项】:

A输入数据

B中间结果

C输出数据

D临时数据

【答案】:

C

40.为持续提高CPU性能,以下说法正确的是____。

【选项】:

A只需不断增加器件集成密度

B只需不断提高频率

C必须利用并行技术

D只需提高功耗

【答案】:

C

41.对于搜索分解,下面哪个说法是错误的_____。

【选项】:

A所有子树搜索任务都必须全部完成

B工作量可能大于串行计算

C工作量可能小于串行计算

D可能产生超线性加速比

【答案】:

A

42.一个AVX寄存器最多存放____个短整型数。

【选项】:

A2

B4

C8

D16

【答案】:

D

43.在使用信号量之后必须对其进行____。

【选项】:

A初始化

B解锁

C减1

D销毁

【答案】:

D

44.起泡排序改为奇偶转置排序,消除了循环步间的数据依赖的原因是____。

【选项】:

A增大了元素比较距离

B减小了元素比较距离

C改为元素两两分组比较

D消除了元素比较

【答案】:

C

45.下面说法错误的是____。

【选项】:

A不存在权威的并行体系结构

B学习并行程序设计只关心软件即可

C并行体系结构对性能有巨大影响

D很多并行体系结构未来发展不明了

【答案】:

B

46.在条件不成立时,使用pthread_cond_wait____。

【选项】:

A令线程阻塞

B解锁互斥量

C解锁互斥量然后令线程阻塞

D加锁互斥量

【答案】:

C

47.关于MPI是什么,以下说法错误的是____。

【选项】:

A一种消息传递编程模型标准

B一种共享内存编程模型标准

C编程角度看是C++/Fortran等的库

D基于SPMD模型

【答案】:

B

48.使用一个信号量实现“主线程等待4个从线程完成任务”,信号量初始值应设置为____。

【选项】:

A0

B1

C2

D4

【答案】:

A

49.CUDA的优点不包括____。

【选项】:

A可移植性

B入门简单

C标准的SPMD模式

D不再需要图形API

【答案】:

A

50.将寄存器设置为4个给定单精度浮点数的SSEintrinsics指令是____。

【选项】:

A_mm_set_ps

B_mm_set1_ss

C_mm_setzero_ss

D_mm_setzero_ps

【答案】:

A

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 广告传媒

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1