《计算机系统结构教学资料》第四章作业答案优质PPT.ppt

上传人:b****9 文档编号:13638592 上传时间:2022-10-12 格式:PPT 页数:13 大小:388.51KB
下载 相关 举报
《计算机系统结构教学资料》第四章作业答案优质PPT.ppt_第1页
第1页 / 共13页
《计算机系统结构教学资料》第四章作业答案优质PPT.ppt_第2页
第2页 / 共13页
《计算机系统结构教学资料》第四章作业答案优质PPT.ppt_第3页
第3页 / 共13页
《计算机系统结构教学资料》第四章作业答案优质PPT.ppt_第4页
第4页 / 共13页
《计算机系统结构教学资料》第四章作业答案优质PPT.ppt_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

《计算机系统结构教学资料》第四章作业答案优质PPT.ppt

《《计算机系统结构教学资料》第四章作业答案优质PPT.ppt》由会员分享,可在线阅读,更多相关《《计算机系统结构教学资料》第四章作业答案优质PPT.ppt(13页珍藏版)》请在冰豆网上搜索。

《计算机系统结构教学资料》第四章作业答案优质PPT.ppt

(1)在上述流水方式下,完成AB需多少时间?

画出时空图并计算此流水线的使用效率和吞吐率。

(2)与顺序运算方式相比,加速比为多少?

2,T,解:

(1),1,2,3,4,1,2,3,4,4,5,5,5,1,2,3,1,2,3,19,S,6,1,2,3,4,5,4,5,完成A*B需要的时间=19,效率为:

吞吐率为:

(2)加速比为:

2、已知某单功能非线性流水线的预约表如下图,要求:

(1)列出禁止表F和冲突向量C。

(2)画出该流水线状态图,确定其最小平均延迟以及此时的调度方案?

当按此流水调度方案共输入8个任务时,则其实际吞吐率为多少?

附图,解:

(1)禁止表F=4冲突向量C=(1000)

(2)最佳调度策略(1,1,1,5)吞吐率=8/17t,=5,=5,=5,=5,=5,=5,=5,=5,1,2,3,2,3,3,1,3,2,1,1,2,各种调度方案及其相应的平均延迟:

3、有一个双输入端的加-乘双功能静态流水线,由经过时间为t、t、2t、t的1、2、3、4四个子过程构成。

加按124连接,乘按134连接,流水线输出设有数据缓冲器,也可将数据直接返回输入。

现要执行A*(B+C*(D+E*F)+G*H的运算,请调整计算顺序,画出能获得吞吐率尽量高的流水时空图,标出流水线入、出端数据的变化情况,求出完成全部运算的时间及此期间整个流水线吞吐率,效率,加速比?

如对流水线瓶颈子过程再细分,最少只需多少时间可完成全部运算?

若子过程3不能再细分,只能用并联方法改进,问流水线的效率为多少?

解:

根据题意,对算法经调整后,能使流水吞吐率尽量高的流水时空图如图所示。

图中已标出了流水线入、出端的数据变化情况。

S,1,2,3,4,1,2,1,2,1,2,3,3,3,1,2,3,4,5,6,4,5,4,5,6,6,4,5,6,7,8,7,8,7,8,9,9,9,输入,输出,AC,EF,AB,GH,ACD,ACEF,ABACD,ACEFGH,ACEF+GHACD+AB,AC,EF,AB,GH,ACD,ACEF,ACD+AB,ACEF+GH,ACEF+GH+ACD+AB,21t,S,1,2,31,32,1,2,1,3,2,4,3,5,6,4,5,6,7,8,7,8,7,8,9,9,9,根据上图的流水时空图,可以看出,完成全部运算的时间为21t。

如果现在将瓶颈子过程3细分成两个子过程,则时空图如下图所示。

4,1,3,2,4,5,6,1,3,2,4,5,6,16t,S,1,2,31,32,1,2,1,3,1,3,3,5,5,4,5,6,7,8,7,8,7,8,9,9,9,4,2,4,2,4,6,6,1,3,2,4,5,6,16t,由上图可见,完成全部运算最少需要16t的时间即可。

现在若子过程3不能再细分了,只能用2个子过程3通过并联来改进,则其时空图如下图所示。

完成全部运算时的流水线效率,4、超级标量机和超级流水线机都能开发指令级的并行性,现假定这两种机器的流水线都为4段,每段均需1个时钟周期。

若在超级标量机中,每个时钟周期可同时启动3条指令,而超级流水线机中则是每隔1/3时钟周期启动一条指令。

现若要执行6条指令的代码序列,问在两种机器上各需用多少个时钟周期方可执行完毕?

解:

超级标量机需5个时钟周期,超级流水线机需5.67个时钟周期。

5、在CRAY-1机上,V是向量寄存器,设向量长度均为32。

S是标量寄存器,所用浮点功能执行部件的执行时间分别为:

加法需6拍,相乘需7拍,从存储器读存数需6拍,求倒数近似值及除法需14拍,写入寄存器及启动功能部件(包括存储器)各需1拍。

问下列各指令组中的哪些指令可以链接?

哪些指令不可链接?

哪些指令可以并行执行?

试说明其原因并分别计算出各指令组全部完成所需的拍数。

(1)V0存储器

(2)V2V0+V1V1V2+V3V3存储器V4V5*V6V4V2*V3(3)V0存储器(4)V0存储器V3V1+V2V11/V0V4V0*V3V3V1+V2V6V4+V5V5V3*V4(5)V0存储器(6)V3存储器V1V2+V3V2V0+V1V4V5*V6s0s2+s3s0s1+s2V3V1*V4(7)V3存储器(8)V0存储器V2V0+V1V2V0+V1V4V2*V3V3V1+V2存储器V4V5V3*V4,解:

(1)三条指令可全并行执行,需(1+7+1)+(32-1)=40(拍)

(2)前两条并行,和第三条链接,需(1+7+1)+(1+6+1)+(32-1)=48拍(3)前两条并行和第三条链接,而第四条指令与第三条指令串行(因第二条和第四条功能部件冲突),需(1+6+1)+(1+7+1)+(32-1)+(1+6+1)+(32-1)=87拍(4)全部链接(1+6+1)+(1+14+1)+(1+6+1)+(1+7+1)+(32-1)=72拍(5)全并行执行,需(1+7+1)+(32-1)=40(拍)(6)前三条指令并行,与第四条指令串行(V1源操作数冲突),需(1+6+1)+(32-1)+(1+7+1)+(32-1)=79拍(7)前两条指令并行,与第三条链接,再与第四条串行(因第一条和第四条冲突),需(1+6+1)+(1+7+1)+(32-1)+(1+6+1)+(32-1)=87拍(8)前两条指令链接,与第三条串行(V1源操作数冲突),与第四条链接,需(1+6+1)+(1+6+1)+(32-1)+(1+6+1)+(1+7+1)+(32-1)=95拍,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 农学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1