ImageVerifierCode 换一换
格式:DOCX , 页数:9 ,大小:80.27KB ,
资源ID:1960189      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/1960189.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(计算机系统结构第六章练习 答案.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

计算机系统结构第六章练习 答案.docx

1、计算机系统结构第六章练习 答案第六章向量处理机1在大型数组的处理中常常包含向量计算,按照数组中各计算相继的次序,我们可以把向量处理方法分为哪三种类型?横向处理方式,纵向处理方式,纵横处理方式横向处理方式:向量计算是按行的方式从左至右横向的进行纵向处理方式:向量计算是按列的方式自上而下纵向的进行纵横处理方式:横向处理和纵向处理相结合的方式2解释下列与向量处理有关的术语。(1)向量和标量的平衡点:为了使向量硬件设备和标量设备的利用率相等,一个程序中向量代码所占的百分比(2)用户代码的向量化比值:用户代码可向量化的部分占全部的比重(3)向量化编译器或量化器:将标量运算进行向量化或者将向量运算进行适当

2、的修改使之能够进入向量处理进行向量处理的编译器3简要叙述提高向量处理机性能的常用技术(1)链接技术(2)向量循环或分段开采技术(3)向量递归技术(4)稀疏矩阵的处理技术4下述的几个需要解决的问题中,那个是向量处理机所最需要关心的?A.计算机指令的优化技术B.设计满足运算器带宽要求的存储器C.如何提高存储器的利用率,增加存储器系统的容量D.纵横处理方式的划分问题5.假设系统在向量模式下面能够达到9Mflops,在标量模式下能够达到1Mflops速度,而代码的90%是向量运算,10%是标量运算,这样花在两种模式上的计算时间相等。那么向量平衡点是:A.0.1 B.0.9 一个程序中向量代码所占的百分

3、比C.0.5 D.以上都不是6.查看下面三条指令:V3AV2V0+V1V4V2*V3假设向量长度小于64,且前后其他的指令均没有相关性,数据进入和流出每个功能部件,包括访问存储器都需要一拍的时间,假设向量的长度为N。三条指令全部采用串行的方法,那么执行的时间是: A.3N+20 B.3N+21C.3N+22 D.3N+237下面一组向量操作能分成几个编队?假设每种流水功能部件只有一个。LV V1,Rx ;取向量MULTSV V2,F0,V1 ;向量和标量相乘LV V3,Ry ;取向量YADDV V4,V2,V3 ;加法SV Ry,V4 ;存结果可以划分成四个编队:(1)LV (2)MULTSV

4、 LV (3)ADDV (4)SV8.在一台向量处理机上实现A=Bs操作,其中A和 B是长度为200的向量,s是一个标量。向量寄存器长度为64。功能部件的启动开销为:取数和存数部件为12个时钟周期,乘法部件为7个时钟周期,加法部件为6个时钟周期。总的执行时间是?A.784B.783C.785D.7809.简述三种向量处理方式,他们对向量处理机结构要求有什么不同。解:水平处理方式:向量长度为N,则水平处理方式相当于执行N次循环。不适合对向量进行流水处理。(或者叫做横向处理方式)垂直处理方式:将整个向量按相同的运算处理完毕之后,再去执行其他的运算,适合对向量进行流水处理,向量运算指令的源/目向量都

5、放在存储器内,使得流水线运算部件的输入输出端直接与存储器相联,构成M-M型的运算流水线。分组处理方式:把长度为N的向量分为若干组,每组按照纵向处理10解释下列与向量处理有关的术语。(1)向量规约指令(2)收集和散播指令解:(1)将向量化转化为标量的指令(2)收集指令可以把非连续存储单元的内容传送到向量寄存器组中若干个连续的寄存器;散播指令与此相反。他们用于稀疏矩阵的存储与运算,可以节省空间。11. 查看下面三条指令:V3AV2V0+V1V4V2*V3假设向量长度小于64,且前后其他的指令均没有相关性,数据进入和流出每个功能部件,包括访问存储器都需要一拍的时间,假设向量的长度为N。三条指令采用链

6、接的方法,那么执行的时间是:A.3N+22 B.2N+15C.N+16 D.N+1712.在一台向量处理机上实现A=Bs操作,其中A和 B是长度为200的向量,s是一个标量。向量寄存器长度为64。功能部件的启动开销为:取数和存数部件为12个时钟周期,乘法部件为7个时钟周期,加法部件为6个时钟周期。那么一个结果元素的平均执行时间(包括启动开销)为:A.3.7 B.3.9 C.4.1 D.4.313.某向量处理机有16个向量寄存器,其中V0-V5种分别存放有向量A,B,C,D,E,F,向量的长度是8,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍

7、。采用类似CRAY-1的链接技术,先计算(A+B)*C,在流水线不停的情况下,接着计算(D+E)*F。求此链接流水线的通过时间是多少拍?(设寄存器出入各需1拍)A.8 B.9 C.17 D.1814名词解释向量流水处理机解:处理机具有向量数据表示,并通过向量指令对向量的各元素进行处理。15某向量处理机有16个向量寄存器,其中V0-V5种分别存放有向量A,B,C,D,E,F,向量的长度是8,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。采用类似CRAY-1的链接技术,先计算(A+B)*C,在流水线不停的情况下,接着计算(D+E)*F。每拍时间

8、是50ns,完成这些计算并且把结果存进相应的寄存器,此处理部件实际吞吐率是多少MFLOPS?(设寄存器出入各需1拍)A.26.67 B.29. C.24.6 D.25.8316.一台单处理机可以以标量方式运行,也可以以向量方式运行。在向量方式情况下,计算可比标量方式快9倍。设某基准程序在此计算机上运行的时间是T。另外,已知T的25%用于向量方式,其余机器时间则以标量方式运行。请计算在上述条件下与完全不用向量方式条件下相比的加速比,并计算上述程序中向量化代码所占的百分比。加速比=(0.25T*9+0.75T*1)/T=3由于T中向量化代码所占的时间为0.25T,则串行代码用时=T-0.25T=0

9、.75T,所以完全不用向量方式执行该段代码用时= 0.75T+9*0.25T=3T, 因此加速比=3T/T=3. 根据Amdahl定律.17.一台向量计算机一次只能以下述两种方式中的一种运行:一种是向量方式,执行速度为10Mflops;另一种是标量方式,执行速度为1Mflops。设是该计算机的典型程序代码中可以向量化部分的百分比。如果要使平均执行的速度达到7.5Mflops,那么向量化百分比应该多大?1/a/Rv+(1-a)/Rs=7.5所以a=0.96318.在CARY1机器上,设向量长度均为32,s是标量寄存器,加法需要6拍,乘法需要7拍,从存储器读数需要6拍,打入寄存器及启动功能部件(包

10、括寄存器)各需要1拍。则下面的指令组完成所需要的拍数是:V3存储器 打入1,启动1,读数6V2V0+V1 s0s2+s3V3V1V4A.111 B.110 C.78 D.798+31+9+3119.在CRAY-1机器上,链接方式执行下面4条向量指令(括号中给出相应功能部件的时间),如果向量寄存器和功能部件之间的数据传输需要1拍,试求此链接流水线的流过时间为多少拍?V0存储器 (存储器取数7拍)9V1V0+V1 (向量加3拍)5V3V2A3 (按照A3左移4拍)6V5V3V4 (向量逻辑乘2拍)4A.23B.24C.30D.3120. 一台单处理机可以以标量方式运行,也可以以向量方式运行。在向量

11、方式情况下,计算可比标量方式快18倍。设某基准程序在此计算机上运行的时间是T。另外,已知T的25%用于向量方式,其余机器时间则以标量方式运行。那么在上述条件下与完全不用向量方式的条件下相比的加速比是:A.3B.3.43C.3.33D.以上均不正确1/0.75/18+0.25/121.一台向量计算机一次只能以下述两种方式中的一种运行:一种是向量方式,执行速度为10Mflops;另一种是标量方式,执行速度为1Mflops。设是该计算机的典型程序代码中可以向量化部分的百分比。求平均执行速度的计算公式。1/a/Rv+(1-a)/Rs=10/(10-9a)22.向量处理机有那两种最基本的结构?存储器-存

12、储器结构寄存器-寄存器结构23.研制高性能的向量处理机主要需要解决哪几个问题?(1)较好的维持向量/标量性能平衡(2)可扩展性随处理机数目的增加而提高(3)增加存储器系统的容量和性能(4)提供高性能的I/O和易访问的网络24.为了提高向量处理机的性能,会采用一些特殊的技术,下面那一项不是提高向量处理机性能而采用的技术?A.链接技术B.向量递归技术C.cache缓存技术D.稀疏矩阵的处理技术25.在CARY1机器上,设向量长度均为32,s是标量寄存器,加法需要6拍,乘法需要7拍,从存储器读数需要6拍,打入寄存器及启动功能部件(包括寄存器)各需要1拍。则下面的指令组完成所需要的拍数是:V0存储器V

13、2V0+V1V3V2V1V5V3V426.若要进行向量运算D=A(B+C),假设向量长度N64,且B和 C已经存至V0和V1,则下面三条指令就可以完成上述的运算。V3A (6拍)V2V0+V1 (6拍)V4V2V3 (7拍)分别求三条指令全部用串行的方法和链接技术执行的时间(读写各需1拍)。27.在某台向量处理机上执行DAXPY代码,即完成Y=aX+Y,其中X和Y是向量,最初存放在内存,a是一个标量,他们的向量指令如下:LV V1,Rx ;取向量MULTSV V2,F0,V1 ;标量和向量相乘LV V2,Ry ;取向量YADDV V4,V2,V3 ;相加SV Ry,V4 ;存结果求总的执行时间

14、。假设其中存取数需要12拍,乘法需要7拍,加法需要6拍,向量长度是n。28.假设某向量处理机上执行DAXPY代码所需要的时钟周期是4n+64,其中n是向量长度,时钟频率是200MHz,那么最大性能是多少?A. 90MFLOPS B. 80MFLOPS C.50 MFLOPS D. 100MFLOPS29.假设某向量处理机上执行DAXPY代码所需要的时钟周期是4n+64,其中n是向量长度,时钟频率是200MHz,那么半性能向量长度是:A.12.8 B.10.7 C.12 D.1330.日本FOCOM向量处理机VP-200具有流水线链接和并行化功能。它有2条存储流水线到向量寄存器,两者可以并行工作

15、。此外尚有加法和乘法流水线。各流水线间均可以链接操作。若现在要在Vp-200向量机上实现以下的向量操作:A(I)=B(I) C(I)+D(I) E(I)+F(I) G(I)I=1,2,N。假定所有流水线的延迟时间都相等,取/存操作转换时将有t的流水线重构延迟时间。求完成操作所需要的时间。 所以时间为:4N+t31. 在CARY1机器上,设向量长度均为32,s是标量寄存器,加法需要6拍,乘法需要7拍,从存储器读数需要6拍,打入寄存器及启动功能部件(包括寄存器)各需要1拍。则下面的指令组完成所需要的拍数是:V3存储器V2V0+V1V4V2V3存储器V4A.87 B.88 C.89 D.8632.表示向量流水方式的工作速度优于标量串行方式工作时间时所需要的向量长度的临界值。请问该参数主要衡量那些标准?衡量建立时间,也衡量标量向量的速度比对性能的影响。33.有关半性能向量长度,下面哪种说法正确?

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1