南开20秋学期《并行程序设计》在线作业答案0118.docx

上传人:b****3 文档编号:3767600 上传时间:2022-11-25 格式:DOCX 页数:19 大小:19.99KB
下载 相关 举报
南开20秋学期《并行程序设计》在线作业答案0118.docx_第1页
第1页 / 共19页
南开20秋学期《并行程序设计》在线作业答案0118.docx_第2页
第2页 / 共19页
南开20秋学期《并行程序设计》在线作业答案0118.docx_第3页
第3页 / 共19页
南开20秋学期《并行程序设计》在线作业答案0118.docx_第4页
第4页 / 共19页
南开20秋学期《并行程序设计》在线作业答案0118.docx_第5页
第5页 / 共19页
点击查看更多>>
下载资源
资源描述

南开20秋学期《并行程序设计》在线作业答案0118.docx

《南开20秋学期《并行程序设计》在线作业答案0118.docx》由会员分享,可在线阅读,更多相关《南开20秋学期《并行程序设计》在线作业答案0118.docx(19页珍藏版)》请在冰豆网上搜索。

南开20秋学期《并行程序设计》在线作业答案0118.docx

南开20秋学期《并行程序设计》在线作业答案0118

(单选题)1:

CUDA寄存器是由____。

A:

Grid中所有线程共享

B:

一个Block中所有线程共享

C:

一个Warp中所有线程共享

D:

每个线程独享

正确答案:

D

(单选题)2:

SIMD并行化时遇到对齐问题,高效的处理方法是____。

A:

直接使用SIMD不对齐访存指令

B:

将数据拷贝到对齐的内存地址

C:

重写算法保证对齐访问

D:

串行处理到对齐边界,然后进行SIMD对齐访存

正确答案:

D

(单选题)3:

使用一个信号量实现“主线程等待4个从线程完成任务”,信号量初始值应设置为____。

A:

0

B:

1

C:

2

D:

4

正确答案:

A

(单选题)4:

对这样的循环for(i=0;i1

D:

可能随着处理器数量增大趋向于0

正确答案:

B

(单选题)11:

SSEintrinsics_mm_store_sd命令的功能是____。

A:

对齐向量存单精度浮点数

B:

未对齐向量存单精度浮点数

C:

对齐标量存双精度浮点数

D:

未对齐标量存双精度浮点数

正确答案:

C

(单选题)12:

和一对多广播对应的组通信操作是____。

A:

多对一收集

B:

多对多收集

C:

多对一归约

D:

多对多归约

正确答案:

C

(单选题)13:

对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。

A:

声明语句

B:

条件分支语句

C:

循环语句

D:

输入输出语句

正确答案:

C

(单选题)14:

若SIMD并行化时遇到对齐问题,下列说法正确的是____。

A:

只能使用不对齐访存指令

B:

不能进行SIMD并行化

C:

对齐开销可能完全抵消SIMD并行收益

D:

以上皆错

正确答案:

C

(单选题)15:

使用____无法直接实现“主线程唤醒4个从线程去执行任务”。

A:

1个信号量

B:

障碍

C:

1个互斥量

D:

4个互斥量

正确答案:

C

(单选题)16:

在使用条件变量时,还需配套使用一个____。

A:

互斥量

B:

信号量

C:

障碍

D:

自旋锁

正确答案:

A

(单选题)17:

OpenMP中指定单线程执行的指令是____。

A:

ompatomic

B:

omponly

C:

ompstatic

D:

ompsingle

正确答案:

D

(单选题)18:

在条件成立时使用pthread_cond_signal____。

A:

唤醒等待线程

B:

解锁互斥量

C:

加锁互斥量

D:

唤醒等待线程,该线程重新加锁互斥量

正确答案:

D

(单选题)19:

MPI收发各一条消息的API是_____。

A:

MPI_Sendrecv

B:

MPI_Send

C:

MPI_Recv

D:

MPI_Replace

正确答案:

A

(单选题)20:

OpenMP循环划分策略不包括____。

A:

static

B:

fixed

C:

dynamic

D:

guided

正确答案:

B

(单选题)21:

第一款桌面多核CPU是____发布的。

A:

Intel

B:

AMD

C:

IBM

D:

SUN

正确答案:

A

(单选题)22:

pthread_join的作用是____。

A:

强制终止指定线程

B:

检测指定线程是否结束

C:

等待指定线程结束才返回

D:

向指定线程发送数据

正确答案:

C

(单选题)23:

静态线程编程模式的缺点是____。

A:

线程管理开销高

B:

系统资源利用率低

C:

线程负载不均

D:

线程通信开销高

正确答案:

B

(单选题)24:

控制流语句进行SIMD并行化很困难的原因是控制流语句导致____。

A:

连续数据执行不同指令

B:

连续数据执行相同指令

C:

同一数据执行不同指令

D:

同一数据执行相同指令

正确答案:

A

(单选题)25:

OpenMP循环并行指令是____。

A:

ompparallel

B:

ompsingle

C:

ompparallelfor

D:

ompmaster

正确答案:

C

(单选题)26:

任务依赖图中顶点权重之和表示____。

A:

任务数

B:

任务难度

C:

串行执行时间

D:

并行执行时间

正确答案:

C

(单选题)27:

OpenMP主要是通过____来更高层抽象的多线程编程。

A:

设计实现新的语言

B:

为现有语言提供大量库函数

C:

为现有语言扩展编译指示

D:

新编译器实现自动并行化

正确答案:

C

(单选题)28:

MPI默认点对点通信模式是____。

A:

阻塞的

B:

非阻塞的

C:

对等的

D:

主从的

正确答案:

A

(单选题)29:

下面说法错误的是____。

A:

不存在权威的并行体系结构

B:

学习并行程序设计只关心软件即可

C:

并行体系结构对性能有巨大影响

D:

很多并行体系结构未来发展不明了

正确答案:

B

(单选题)30:

关于OpenMP程序中的并行结构,以下说法正确的是____。

A:

其结束时需程序员人为添加同步

B:

其结束时OpenMP已默认添加隐式障碍

C:

其结束时完全不需要同步

D:

其结束时必须进行同步

正确答案:

B

(单选题)31:

GPU相对于其他众核产品的优势不包括____。

A:

平台普及

B:

有CUDA这样易学的开发工具

C:

性价比高

D:

由英伟达公司一家把控

正确答案:

D

(单选题)32:

MPI的通信是____。

A:

无类型传输

B:

弱类型传输

C:

强类型传输

D:

以上皆错

正确答案:

C

(单选题)33:

对单精度浮点计算,MMX最高实现____路并行。

A:

2

B:

4

C:

8

D:

16

正确答案:

A

(单选题)34:

n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法____。

A:

肯定不是代价最优

B:

肯定是代价最优

C:

不确定是否代价最优

D:

以上皆错

正确答案:

A

(单选题)35:

OpenMP是___的一个常见替代。

A:

SSE

B:

MPI

C:

Pthread

D:

CUDA

正确答案:

C

(单选题)36:

n个节点的超立方构造成本为____。

A:

O(logn)

B:

O(sqrt(n))

C:

O(n)

D:

O(nlogn)

正确答案:

D

(单选题)37:

Pthread是_____线程接口标准。

A:

Linux

B:

POSIX

C:

Windows

D:

IOS

正确答案:

B

(单选题)38:

一个AVX寄存器最多存放____个整型数。

A:

2

B:

4

C:

8

D:

16

正确答案:

C

(单选题)39:

新一代GPU重点提供的新特性不包括____。

A:

新型高速显存

B:

GPU间直接高速互联

C:

自动并行化

D:

人工智能计算专门优化

正确答案:

C

(单选题)40:

编写矩阵乘法的SSE程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。

A:

2

B:

4

C:

8

D:

16

正确答案:

A

(单选题)41:

在使用互斥量之后必须对其进行____。

A:

初始化

B:

加锁

C:

解锁

D:

销毁

正确答案:

D

(单选题)42:

对于多线程各自进行本地运算,然后由主线程汇总结果的模式,下面说法正确的是____。

A:

在同构核心上,线程运行速度一样,主线程无需等待,直接汇总结果即可

B:

线程运行速度可能不一致,必须采用同步保证主线程汇总正确结果

C:

太多本地运算,不能体现并行效果,不是好的模式

D:

主线程汇总结果在性能上必然不如多线程并行汇总结果

正确答案:

B

(单选题)43:

在下面问题中,SIMD并行最不适合____。

A:

向量加法

B:

向量中元素排序

C:

矩阵向量乘法

D:

矩阵加法

正确答案:

B

(单选题)44:

忙等待方法解决竞争条件的思路是____。

A:

令CPU一直处于忙碌状态无法产生竞争条件

B:

令存在数据依赖的内存操作充分并行

C:

强制多线程进入临界区的顺序来将存在数据依赖内存操作串行化

D:

以上皆错

正确答案:

C

(单选题)45:

OpenMP中多线程间是一种____关系。

A:

主从

B:

分组

C:

对等

D:

竞争

正确答案:

A

(单选题)46:

SSE的shuffle指令的8位二进制整数参数被划分为4个2位二进制整数imm8[0:

3],若imm8[1]=j则表示___。

A:

将第一个源寄存器的第j个元素放在目标寄存器位置1

B:

将第二个源寄存器的第j个元素放在目标寄存器位置1

C:

将第一个源寄存器的第1个元素放在目标寄存器位置1

D:

将第二个源寄存器的第1个元素放在目标寄存器位置1

正确答案:

A

(单选题)47:

采用划分子矩阵(大小b*b)的方法实现n*n矩阵乘法,一次乘—加运算涉及的子矩阵可全部放入cache,则整个计算过程中,两个输入矩阵的每个元素会产生____次访存。

A:

n

B:

t

C:

n-t

D:

n/t

正确答案:

D

(单选题)48:

多线程是____架构下的并行模式。

A:

MIMD

B:

共享内存

C:

分布式内存

D:

分离式地址空间

正确答案:

B

(单选题)49:

在对互斥量进行解锁时,还会执行____操作。

A:

互斥量初始化

B:

互斥量销毁

C:

唤醒阻塞线程

D:

以上皆错

正确答案:

C

(单选题)50:

全球500强超算越来越体现出依赖____提供强大计算能力的趋势。

A:

单核CPU

B:

多核CPU

C:

FPGA

D:

众核协处理器

正确答案:

D

(单选题)1:

CUDA寄存器是由____。

A:

Grid中所有线程共享

B:

一个Block中所有线程共享

C:

一个Warp中所有线程共享

D:

每个线程独享

正确答案:

D

(单选题)2:

SIMD并行化时遇到对齐问题,高效的处理方法是____。

A:

直接使用SIMD不对齐访存指令

B:

将数据拷贝到对齐的内存地址

C:

重写算法保证对齐访问

D:

串行处理到对齐边界,然后进行SIMD对齐访存

正确答案:

D

(单选题)3:

使用一个信号量实现“主线程等待4个从线程完成任务”,信号量初始值应设置为____。

A:

0

B:

1

C:

2

D:

4

正确答案:

A

(单选题)4:

对这样的循环for(i=0;i1

D:

可能随着处理器数量增大趋向于0

正确答案:

B

(单选题)11:

SSEintrinsics_mm_store_sd命令的功能是____。

A:

对齐向量存单精度浮点数

B:

未对齐向量存单精度浮点数

C:

对齐标量存双精度浮点数

D:

未对齐标量存双精度浮点数

正确答案:

C

(单选题)12:

和一对多广播对应的组通信操作是____。

A:

多对一收集

B:

多对多收集

C:

多对一归约

D:

多对多归约

正确答案:

C

(单选题)13:

对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。

A:

声明语句

B:

条件分支语句

C:

循环语句

D:

输入输出语句

正确答案:

C

(单选题)14:

若SIMD并行化时遇到对齐问题,下列说法正确的是____。

A:

只能使用不对齐访存指令

B:

不能进行SIMD并行化

C:

对齐开销可能完全抵消SIMD并行收益

D:

以上皆错

正确答案:

C

(单选题)15:

使用____无法直接实现“主线程唤醒4个从线程去执行任务”。

A:

1个信号量

B:

障碍

C:

1个互斥量

D:

4个互斥量

正确答案:

C

(单选题)16:

在使用条件变量时,还需配套使用一个____。

A:

互斥量

B:

信号量

C:

障碍

D:

自旋锁

正确答案:

A

(单选题)17:

OpenMP中指定单线程执行的指令是____。

A:

ompatomic

B:

omponly

C:

ompstatic

D:

ompsingle

正确答案:

D

(单选题)18:

在条件成立时使用pthread_cond_signal____。

A:

唤醒等待线程

B:

解锁互斥量

C:

加锁互斥量

D:

唤醒等待线程,该线程重新加锁互斥量

正确答案:

D

(单选题)19:

MPI收发各一条消息的API是_____。

A:

MPI_Sendrecv

B:

MPI_Send

C:

MPI_Recv

D:

MPI_Replace

正确答案:

A

(单选题)20:

OpenMP循环划分策略不包括____。

A:

static

B:

fixed

C:

dynamic

D:

guided

正确答案:

B

(单选题)21:

第一款桌面多核CPU是____发布的。

A:

Intel

B:

AMD

C:

IBM

D:

SUN

正确答案:

A

(单选题)22:

pthread_join的作用是____。

A:

强制终止指定线程

B:

检测指定线程是否结束

C:

等待指定线程结束才返回

D:

向指定线程发送数据

正确答案:

C

(单选题)23:

静态线程编程模式的缺点是____。

A:

线程管理开销高

B:

系统资源利用率低

C:

线程负载不均

D:

线程通信开销高

正确答案:

B

(单选题)24:

控制流语句进行SIMD并行化很困难的原因是控制流语句导致____。

A:

连续数据执行不同指令

B:

连续数据执行相同指令

C:

同一数据执行不同指令

D:

同一数据执行相同指令

正确答案:

A

(单选题)25:

OpenMP循环并行指令是____。

A:

ompparallel

B:

ompsingle

C:

ompparallelfor

D:

ompmaster

正确答案:

C

(单选题)26:

任务依赖图中顶点权重之和表示____。

A:

任务数

B:

任务难度

C:

串行执行时间

D:

并行执行时间

正确答案:

C

(单选题)27:

OpenMP主要是通过____来更高层抽象的多线程编程。

A:

设计实现新的语言

B:

为现有语言提供大量库函数

C:

为现有语言扩展编译指示

D:

新编译器实现自动并行化

正确答案:

C

(单选题)28:

MPI默认点对点通信模式是____。

A:

阻塞的

B:

非阻塞的

C:

对等的

D:

主从的

正确答案:

A

(单选题)29:

下面说法错误的是____。

A:

不存在权威的并行体系结构

B:

学习并行程序设计只关心软件即可

C:

并行体系结构对性能有巨大影响

D:

很多并行体系结构未来发展不明了

正确答案:

B

(单选题)30:

关于OpenMP程序中的并行结构,以下说法正确的是____。

A:

其结束时需程序员人为添加同步

B:

其结束时OpenMP已默认添加隐式障碍

C:

其结束时完全不需要同步

D:

其结束时必须进行同步

正确答案:

B

(单选题)31:

GPU相对于其他众核产品的优势不包括____。

A:

平台普及

B:

有CUDA这样易学的开发工具

C:

性价比高

D:

由英伟达公司一家把控

正确答案:

D

(单选题)32:

MPI的通信是____。

A:

无类型传输

B:

弱类型传输

C:

强类型传输

D:

以上皆错

正确答案:

C

(单选题)33:

对单精度浮点计算,MMX最高实现____路并行。

A:

2

B:

4

C:

8

D:

16

正确答案:

A

(单选题)34:

n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法____。

A:

肯定不是代价最优

B:

肯定是代价最优

C:

不确定是否代价最优

D:

以上皆错

正确答案:

A

(单选题)35:

OpenMP是___的一个常见替代。

A:

SSE

B:

MPI

C:

Pthread

D:

CUDA

正确答案:

C

(单选题)36:

n个节点的超立方构造成本为____。

A:

O(logn)

B:

O(sqrt(n))

C:

O(n)

D:

O(nlogn)

正确答案:

D

(单选题)37:

Pthread是_____线程接口标准。

A:

Linux

B:

POSIX

C:

Windows

D:

IOS

正确答案:

B

(单选题)38:

一个AVX寄存器最多存放____个整型数。

A:

2

B:

4

C:

8

D:

16

正确答案:

C

(单选题)39:

新一代GPU重点提供的新特性不包括____。

A:

新型高速显存

B:

GPU间直接高速互联

C:

自动并行化

D:

人工智能计算专门优化

正确答案:

C

(单选题)40:

编写矩阵乘法的SSE程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。

A:

2

B:

4

C:

8

D:

16

正确答案:

A

(单选题)41:

在使用互斥量之后必须对其进行____。

A:

初始化

B:

加锁

C:

解锁

D:

销毁

正确答案:

D

(单选题)42:

对于多线程各自进行本地运算,然后由主线程汇总结果的模式,下面说法正确的是____。

A:

在同构核心上,线程运行速度一样,主线程无需等待,直接汇总结果即可

B:

线程运行速度可能不一致,必须采用同步保证主线程汇总正确结果

C:

太多本地运算,不能体现并行效果,不是好的模式

D:

主线程汇总结果在性能上必然不如多线程并行汇总结果

正确答案:

B

(单选题)43:

在下面问题中,SIMD并行最不适合____。

A:

向量加法

B:

向量中元素排序

C:

矩阵向量乘法

D:

矩阵加法

正确答案:

B

(单选题)44:

忙等待方法解决竞争条件的思路是____。

A:

令CPU一直处于忙碌状态无法产生竞争条件

B:

令存在数据依赖的内存操作充分并行

C:

强制多线程进入临界区的顺序来将存在数据依赖内存操作串行化

D:

以上皆错

正确答案:

C

(单选题)45:

OpenMP中多线程间是一种____关系。

A:

主从

B:

分组

C:

对等

D:

竞争

正确答案:

A

(单选题)46:

SSE的shuffle指令的8位二进制整数参数被划分为4个2位二进制整数imm8[0:

3],若imm8[1]=j则表示___。

A:

将第一个源寄存器的第j个元素放在目标寄存器位置1

B:

将第二个源寄存器的第j个元素放在目标寄存器位置1

C:

将第一个源寄存器的第1个元素放在目标寄存器位置1

D:

将第二个源寄存器的第1个元素放在目标寄存器位置1

正确答案:

A

(单选题)47:

采用划分子矩阵(大小b*b)的方法实现n*n矩阵乘法,一次乘—加运算涉及的子矩阵可全部放入cache,则整个计算过程中,两个输入矩阵的每个元素会产生____次访存。

A:

n

B:

t

C:

n-t

D:

n/t

正确答案:

D

(单选题)48:

多线程是____架构下的并行模式。

A:

MIMD

B:

共享内存

C:

分布式内存

D:

分离式地址空间

正确答案:

B

(单选题)49:

在对互斥量进行解锁时,还会执行____操作。

A:

互斥量初始化

B:

互斥量销毁

C:

唤醒阻塞线程

D:

以上皆错

正确答案:

C

(单选题)50:

全球500强超算越来越体现出依赖____提供强大计算能力的趋势。

A:

单核CPU

B:

多核CPU

C:

FPGA

D:

众核协处理器

正确答案:

D

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1