江西师范大学体系计算题Word格式.docx

上传人:b****5 文档编号:15766862 上传时间:2022-11-16 格式:DOCX 页数:23 大小:47.32KB
下载 相关 举报
江西师范大学体系计算题Word格式.docx_第1页
第1页 / 共23页
江西师范大学体系计算题Word格式.docx_第2页
第2页 / 共23页
江西师范大学体系计算题Word格式.docx_第3页
第3页 / 共23页
江西师范大学体系计算题Word格式.docx_第4页
第4页 / 共23页
江西师范大学体系计算题Word格式.docx_第5页
第5页 / 共23页
点击查看更多>>
下载资源
资源描述

江西师范大学体系计算题Word格式.docx

《江西师范大学体系计算题Word格式.docx》由会员分享,可在线阅读,更多相关《江西师范大学体系计算题Word格式.docx(23页珍藏版)》请在冰豆网上搜索。

江西师范大学体系计算题Word格式.docx

20%+8×

15%+4×

25%=5.0

S=实际CacheCPU执行时间/理想CacheCPU执行时间

=(IC×

时钟周期×

CPI实际)/(IC×

CPI理想)=CPI/CPIA=5.0/1.6

=3.12

1.45用一台80MHz处理机执行标准测试程序,它包含的指令数和相应的平均时钟周期数如表1-10所示,求该处理机的有效CPI、MIPS和程序执行时间。

表1-10题1.46的指令数和相应的平均周期数

指令类型

指令数

平均周期数

整数运算

46000

1

数据传输

36000

2

浮点运算

14000

控制指令

9000

该处理机指令的平均时钟周期数CPI为:

CPI=

=46/105×

1+36/105×

2+14/105×

2+9/105×

2=1.6

所以MIPS=时钟频率/(CPIB×

106)=(80×

106)/(1.6×

106)=50

TCPU=IC/(MIPS×

106)=105000/(50×

106)=0.21(ms)

1.44某工作站采用时钟频率为15MHz、处理速率为10MIPS的处理机来执行一个测试程序。

假定每次存储器存取为1个时钟周期,试问:

(1)此计算机的有效CPI是多少?

(2)假定将处理机的时钟频率提高到30MHz,但存储器的工作速率不变,这样,每次存储器存取需要2个时钟周期。

如果30%指令每条只需要一次存储器存取操作,另外5%指令每条需要二次存储器存取操作,假定测试程序的指令数不变,并与原工作站兼容,试求改进后的处理机的CPI。

(1)由MIPS=时钟频率/(CPI×

106),

则有:

CPIA=时钟频率/(MIPS×

106)=1.5。

(2)当时钟频率为15MHZ时,假设不进行存储操作指令的CPI为x,则要进行一次存储操作指令的CPI为1+x,要进行二次存储操作指令的CPI为2+x,因此有:

1.5=x×

65%+(1+x)×

30%+(2+x)×

5%

解得x=1.1

当时钟频率为30MHZ时,不进行存储操作指令的CPI不变为1.1,要进行一次存储操作指令的CPI为2+x=3.1,要进行二次存储操作指令的CPI为4+x=5.1,因此平均CPI为:

CPIB=1.1×

65%+3.1×

30%+5.1×

5%=1.9

所以MIPSB=时钟频率/(CPIB×

106)=(30×

106)/(1.9×

106)=15.8

第二章

2.13在一台单流水线多操作部件的处理机上执行下面的程序,每条指令的取指令、指令译码需要一个时钟周期,MOVE、ADD和MUL操作分别需要2个、3个和4个时钟周期,每个操作都在第一个时钟周期从通用寄存器中读操作数,在最后一个时钟周期把运算结果写到通用寄存器中。

k:

MOVER1,R0;

R1←(R0)

k+1:

MULR0,R2,R1;

R0←(R2)×

(R1)

k+2:

ADDR0,R2,R3;

R0←(R2)+(R3)

(1)就程序本身而言,可能有哪几种数据相关?

(2)在程序实际执行过程中,哪几种数据相关会引起流水线停顿?

(3)画出指令执行过程的流水线时空图,并计算完成这3条指令共需要多少个时钟周期?

(1)就程序本身而言,可能有三种数据相关。

若3条指令顺序流动,则k指令对R1寄存器的写与k+1指令对R1寄存器的读形成的“先写后读”相关。

若3条指令异步流动,则k指令对R0寄存器的读与k+1指令对R0寄存器的写形成的“先读后写”相关,k+2指令对R0寄存器的写与k+1指令对R0寄存器的写形成的“写—写”相关。

(2)在程序实际执行过程中,二种数据相关会引起流水线停顿。

一是“先写后读”相关,k指令对R1的写在程序执行开始后的第四个时钟;

k+1指令对R1的读对指令本身是第三个时钟,但k+1指令比k指令晚一个时钟进入流水线,则在程序执行开始后的第四个时钟要读R1。

不能在同一时钟周期内读写同一寄存器,因此k+1指令应推迟一个时钟进入流水线,产生了流水线停顿。

二是“写—写”相关,k+1指令对R0的写对指令本身是第六个时钟,而要求该指令进入流水线应在程序执行开始后的第三个时钟,所以对R0的写是在程序执行开始后的第八个时钟。

k+2指令对R0的写对指令本身是第五个时钟,而k+2指令比k+1指令晚一个时钟进入流水线,则在程序执行开始后的第四个时钟,所以对R0的写是在程序执行开始后的第八个时钟。

不能在同一时钟周期内写写同一寄存器,因此k+2指令应推迟一个时钟进入流水线,产生了流水线停顿。

另外,可分析“先读后写”相关不会产生流水线的停顿。

(3)由题意可认位该指令流水线由六个功能段取指、译码、取数、运一、运二和存数等组成,则程序指令执行过程的流水线时空图如下图所示。

若3条指令顺序流动,共需要9个时钟周期。

空间

存数K存数K+1存数K+2存数

运二K+1运二

运一K+1运一K+2运一

取数K取数K+1取数K+2取数

译码K译码K+1译码K+2译码

取指K取指K+1取指K+2取指时间

0123456789

2.23有一条5个功能段的线性动态多功能流水线如图所示,其中1→2→3→5功能段组成加法流水线,1→4→5功能段组成乘法流水线,设每个功能段的延迟时间均相等为△t。

用这条流水线计算F=

,画出流水线时空图,并计算流水线的实际吞吐率、加速比和效率。

Z

 

由于该流水线为动态双功能流水线,计算要求先加后乘,因此应先设置加法功能,连续计算出(a1+b1)、(a2+b2)、(a3+b3)、(a4+b4)四个加法后;

再设置乘法功能,而且按[(a1+b1)×

(a2+b2)]×

[(a3+b3)×

(a4+b4)]顺序做3个乘法。

因此可画出该流水线的时空图如图所示,图中A=a1+b1,B=a2+b2,C=a3+b3,D=a4+b4。

由时空图可以看出,在总共12个△t的时间内输出7个结果,所以有:

TP=n/Tn=7/12△t

而当用串行方法完成操作时,需要四次加法和三次乘法,完成一次加法需要4△t,完成一次乘法需要3△t,完成该运算总共需要时间为:

T0=4×

4△t+3×

3△t=25△t

所以S=T0/Tn=2.08

E=有效时空区面积/全部时空区面积

=(4×

3△t)/(5×

12△t)=0.42

2.24有一条3个功能段的流水线如下图所示,每个功能段的延迟时间均为△t,但是,功能段S2的输出要返回到它自己的输入端循环执行一次。

S3

输入输出

△t△t△t

(1)如果每隔一个△t向流水线连续输入任务,这条流水线会发生什么问题?

(2)求这条流水线能够正常工作的实际吞吐率、加速比和效率。

(3)可用什么办法来提高流水线的吞吐率,画出改进后的流水线结构。

(1)每个任务在段S2要反馈循环一次,执行时间为2Δt,其它各段的执行时间为Δt,因此应按瓶颈段的执行时间2Δt流入任务,才不会发生冲突现象,否则会发生流水线的阻塞。

(2)若连续输入n个任务,则流水线的实际吞吐率、加速比和效率分别为:

TP=n/(4Δt+2(n–1)Δt)=n/2(n+1)Δt→1/2Δt

S=4nΔt/(4Δt+2(n–1)Δt)=2n/(n+1)→2

E=4nΔt/3(4Δt+2(n–1)Δt)=2n/3(n+1)→2/3

(3)为提高流水线的吞吐率,可重复设置段S2,并使两个段S2串连在一起,从而消除瓶颈段S2,而且各段执行时间相等为Δt,流水线的段数为4。

流水线的结构如下图所示。

S2

S1

△t△t△t△t

2.25在一个5段的流水线处理机上需经9△t才能完成一个任务,其预约表为:

时间123456789

流水段

S1×

×

S2×

S3×

S4×

S5×

延迟D2×

(1)写出流水线的初始冲突向量。

(2)画出流水线任务调度的状态有向图。

(3)求出流水线的最优调度策略及最小平均延迟时间和流水线的最大吞吐率。

(4)按最优调度策略连续输入8个任务时,流水线的实际吞吐率是多少?

解:

(1)根据初始冲突向量的构成方法,对预约表各行中打“×

”的拍数求出差值,除去重复的后汇集在一起,即得到延迟禁止表为F={1,5,6,8}。

由F可得到初始冲突向量为:

C=(10110001)

(2)根据后继冲突向量的递推规则Cj=SHR(k)(Ci)∨C0则可得出所有的后继状态,具体有:

10110001C0

C0四个后继状态:

C1=SHR

(2)(C0)∨C0=101111017

C2=SHR(3)(C0)∨C0=10110111

C3=SHR(4)(C0)∨C0=1011101132

C4=SHR(7)(C0)∨C0=10110001=C0747

10111101C1

10110111C2

C1二个后继状态:

C5=SHR

(2)(C1)∨C0=10111111

C6=SHR(7)(C1)∨C0=10110001=C07

C2二个后继状态:

C7=SHR(4)(C2)∨C0=10111011=C33472

10111011C3

10111111C5

C8=SHR(7)(C2)∨C0=10110001=C0

C3二个后继状态:

C9=SHR(3)(C3)∨C0=10110111=C2

C10=SHR(7)(C3)∨C0=10110001=C0

C5一个后继状态:

C11=SHR(7)(C5)∨C0=10110001=C0

由后继状态和引起状态转移的时间间隔可得到状态有向图如上图所示。

(3)由状态转移有向图可得到无冲突的任务调度策略及其平均延迟时间,如下表所示。

调度策略平均延迟时间特别地,从C0出发的[3,(4,3)]也是一个

(2,2,7)(2+2+7)△t/3=3.67△t任务调度策略,除第一条有向弧外,第二、三条

(2,7)(2+7)△t/2=4.5△t有向组成一个环路,该调度策略为(4,3)。

从表

(3,4,7)(3+4+7)△t/3=4.67△t中可以得到平均延迟时间最小的调度策略为(4,

(3,7)(3+7)△t/2=5△t3),该调度策略则为最优调度策略,相应的最小

(4,3,7)(4+3+7)△t/3=4.67△t平均延迟时间为3.5△t,所以流水线的最大吞吐

(4,7)(4+7)△t/2=5.5△t率为:

(7)7△tTPmax=1/(3.5△t)=0.286/△t

3,(4,3)(4+3)△t/2

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 财务管理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1