南开20秋学期《并行程序设计》在线作业答案0118Word文档格式.docx

资源描述

南开20秋学期《并行程序设计》在线作业答案0118Word文档格式.docx

《南开20秋学期《并行程序设计》在线作业答案0118Word文档格式.docx》由会员分享，可在线阅读，更多相关《南开20秋学期《并行程序设计》在线作业答案0118Word文档格式.docx（19页珍藏版）》请在冰豆网上搜索。

南开20秋学期《并行程序设计》在线作业答案0118Word文档格式.docx

（单选题）4:

对这样的循环for（i=0;

可能随着处理器数量增大趋向于0

（单选题）11:

SSEintrinsics_mm_store_sd命令的功能是____。

对齐向量存单精度浮点数

未对齐向量存单精度浮点数

对齐标量存双精度浮点数

未对齐标量存双精度浮点数

（单选题）12:

和一对多广播对应的组通信操作是____。

多对一收集

多对多收集

多对一归约

多对多归约

（单选题）13:

对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。

声明语句

条件分支语句

循环语句

输入输出语句

（单选题）14:

若SIMD并行化时遇到对齐问题,下列说法正确的是____。

只能使用不对齐访存指令

不能进行SIMD并行化

对齐开销可能完全抵消SIMD并行收益

以上皆错

（单选题）15:

使用____无法直接实现“主线程唤醒4个从线程去执行任务”。

1个信号量

障碍

1个互斥量

4个互斥量

（单选题）16:

在使用条件变量时,还需配套使用一个____。

互斥量

信号量

自旋锁

（单选题）17:

OpenMP中指定单线程执行的指令是____。

ompatomic

omponly

ompstatic

ompsingle

（单选题）18:

在条件成立时使用pthread_cond_signal____。

唤醒等待线程

解锁互斥量

加锁互斥量

唤醒等待线程，该线程重新加锁互斥量

（单选题）19:

MPI收发各一条消息的API是_____。

MPI_Sendrecv

MPI_Send

MPI_Recv

MPI_Replace

（单选题）20:

OpenMP循环划分策略不包括____。

static

fixed

dynamic

guided

（单选题）21:

第一款桌面多核CPU是____发布的。

Intel

AMD

IBM

SUN

（单选题）22:

pthread_join的作用是____。

强制终止指定线程

检测指定线程是否结束

等待指定线程结束才返回

向指定线程发送数据

（单选题）23:

静态线程编程模式的缺点是____。

线程管理开销高

系统资源利用率低

线程负载不均

线程通信开销高

（单选题）24:

控制流语句进行SIMD并行化很困难的原因是控制流语句导致____。

连续数据执行不同指令

连续数据执行相同指令

同一数据执行不同指令

同一数据执行相同指令

（单选题）25:

OpenMP循环并行指令是____。

ompparallel

ompparallelfor

ompmaster

（单选题）26:

任务依赖图中顶点权重之和表示____。

任务数

任务难度

串行执行时间

并行执行时间

（单选题）27:

OpenMP主要是通过____来更高层抽象的多线程编程。

设计实现新的语言

为现有语言提供大量库函数

为现有语言扩展编译指示

新编译器实现自动并行化

（单选题）28:

MPI默认点对点通信模式是____。

阻塞的

非阻塞的

对等的

主从的

（单选题）29:

下面说法错误的是____。

不存在权威的并行体系结构

学习并行程序设计只关心软件即可

并行体系结构对性能有巨大影响

很多并行体系结构未来发展不明了

（单选题）30:

关于OpenMP程序中的并行结构,以下说法正确的是____。

其结束时需程序员人为添加同步

其结束时OpenMP已默认添加隐式障碍

其结束时完全不需要同步

其结束时必须进行同步

（单选题）31:

GPU相对于其他众核产品的优势不包括____。

平台普及

有CUDA这样易学的开发工具

性价比高

由英伟达公司一家把控

（单选题）32:

MPI的通信是____。

无类型传输

弱类型传输

强类型传输

（单选题）33:

对单精度浮点计算,MMX最高实现____路并行。

（单选题）34:

n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法____。

肯定不是代价最优

肯定是代价最优

不确定是否代价最优

（单选题）35:

OpenMP是___的一个常见替代。

SSE

MPI

Pthread

CUDA

（单选题）36:

n个节点的超立方构造成本为____。

O（logn）

O（sqrt（n））

O（n）

O（nlogn）

（单选题）37:

Pthread是_____线程接口标准。

Linux

POSIX

Windows

IOS

（单选题）38:

一个AVX寄存器最多存放____个整型数。

（单选题）39:

新一代GPU重点提供的新特性不包括____。

新型高速显存

GPU间直接高速互联

自动并行化

人工智能计算专门优化

（单选题）40:

编写矩阵乘法的SSE程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。

（单选题）41:

在使用互斥量之后必须对其进行____。

初始化

加锁

解锁

销毁

（单选题）42:

对于多线程各自进行本地运算,然后由主线程汇总结果的模式,下面说法正确的是____。

在同构核心上，线程运行速度一样，主线程无需等待，直接汇总结果即可

线程运行速度可能不一致，必须采用同步保证主线程汇总正确结果

太多本地运算，不能体现并行效果，不是好的模式

主线程汇总结果在性能上必然不如多线程并行汇总结果

（单选题）43:

在下面问题中,SIMD并行最不适合____。

向量加法

向量中元素排序

矩阵向量乘法

矩阵加法

（单选题）44:

忙等待方法解决竞争条件的思路是____。

令CPU一直处于忙碌状态无法产生竞争条件

令存在数据依赖的内存操作充分并行

强制多线程进入临界区的顺序来将存在数据依赖内存操作串行化

（单选题）45:

OpenMP中多线程间是一种____关系。

主从

分组

对等

竞争

（单选题）46:

SSE的shuffle指令的8位二进制整数参数被划分为4个2位二进制整数imm8[0:

3],若imm8[1]=j则表示___。

将第一个源寄存器的第j个元素放在目标寄存器位置1

将第二个源寄存器的第j个元素放在目标寄存器位置1

将第一个源寄存器的第1个元素放在目标寄存器位置1

将第二个源寄存器的第1个元素放在目标寄存器位置1

（单选题）47:

采用划分子矩阵（大小b*b）的方法实现n*n矩阵乘法,一次乘—加运算涉及的子矩阵可全部放入cache,则整个计算过程中,两个输入矩阵的每个元素会产生____次访存。

n-t

n/t

（单选题）48:

多线程是____架构下的并行模式。

MIMD

共享内存

分布式内存

分离式地址空间

（单选题）49:

在对互斥量进行解锁时,还会执行____操作。

互斥量初始化

互斥量销毁

唤醒阻塞线程

（单选题）50:

全球500强超算越来越体现出依赖____提供强大计算能力的趋势。

单核CPU

多核CPU

FPGA

众核协处理器

展开阅读全文