高级计算机系统结构复习题.docx
《高级计算机系统结构复习题.docx》由会员分享,可在线阅读,更多相关《高级计算机系统结构复习题.docx(19页珍藏版)》请在冰豆网上搜索。
![高级计算机系统结构复习题.docx](https://file1.bdocx.com/fileroot1/2022-10/28/f0402627-625f-4346-864b-2dc13d733648/f0402627-625f-4346-864b-2dc13d7336481.gif)
高级计算机系统结构复习题
精选文档
1.假定有一条长流水线,只是对条件转移指令使用分支目标缓冲。
假定分支展望错误的开支为4个时钟周期,缓冲不命中的开支为3
个时钟周期。
假定:
命中率为90%,展望精度为90%,分支频次
为15%,没有分支的基本CPI为1。
①求程序履行的CPI。
②有关于采纳固定的2个时钟周期延缓的分支办理,哪一种方法程序
履行速度更快?
参照答案:
解:
(1)程序履行的CPI=没有分支的基本CPI
(1)+分支带来的额外开支
分支带来的额外开支是指在分支指令中,缓冲命中但展望错误带来的开支与缓冲没有命
中带来的开支之和。
分支带来的额外开支=15%*(90%命中×10%展望错误×4+10%没命中×
所以,程序履行的CPI=1+
(2)采纳固定的2个时钟周期延缓的分支办理CPI=1+15%×
由
(1)
(2)可知分支目标缓冲方法履行速度快。
2.计算机系统中有三个零件能够改良,这三个零件的零件加快比为:
零件加快比1=30;零件加快比2=20零件加快比3=10
①假如零件2和零件3的可改良比率均为30%,那么当零件
1的可改良比率为多少时,系统加快比才能够达到
10?
②假如三个零件的可改良比率分别为20%、10%和30%,三个零件同时改良,那么系统中不行加快部分的履行时间在总履行时间中占的比率是多少?
参照答案:
解:
(1)在多个零件可改良状况下,
Amdahl定理的扩展:
Sn
1
Fi
(1
Fi
)
Si
已知S1=30,S2=15,S3=15,Sn=10,F1=,F2=,得:
10
1
F3)(
F3/10)
1(
得F3=,即零件3的可改良比率为36%。
(2)设系统改良前的履行时间为
T,则3个零件改良前的履行时间为:
(0.3+0.3+0.2)
T=0.8T,不行改良部分的履行时间为
。
已知3个零件改良后的加快比分别为
S1=30,S2=20,S3=10,所以3个零件改良后的
履行时间为:
'
Tn
30
20
10
改良后整个系统的履行时间为:
那么系统中不行改良部分的履行时间在总履行时间中占的比率是:
.
精选文档
3.设指令流水线由取指令、剖析指令和履行指令3个零件构成,每个零件经过的时间为△t,连续流入12条指令。
分别画出标量流水
办理机以及ILP均为4的超标量办理机、超长指令字办理机、超流水办理机的时空图,并分别计算它们有关于标量流水办理机的加快比。
参照答案:
解:
标量流水办理机的时空图:
履行
剖析
取指
14时间
履行完12条指令需T1=14△t。
超标量流水办理机与超长指令字办理机的时空图:
超标量流水办理机中,每一个时钟周期同时启动4条指令。
履行完12条指令需T2=5
履行
履行
剖析
剖析
取指
5时间
超长指令字办理机时空图
取指
5
时间
超标量办理机时空图
△t,有关于标量流水办理机的加快比为:
T1
14
t
S2
5
T2
t
超长指令字办理机中,每
4条指令构成一条长指令,共形成
3条长指令。
履行完
12条
指令需T3=5△t,有关于标量流水办理机的加快比为:
T1
14
t
S3
5
T3
t
超流水办理机的时空图:
.
精选文档
履行
剖析
取指
4
时间
超流水办理机中,每
1/4个时钟周期启动一条指令。
履行完
12条指令需T4=△t,
有关于标量流水办理机的加快比为:
T1
14
t
S4
T4
t
4.设一条指令的履行过程分红取指令、剖析指令和履行指令三个阶
段,每个阶段所需的时间分别为△t、△t和2△t。
分别求出以下各样状况下,连续履行N条指令所需的时间。
①只有“取指令”与“履行指令”重叠;
②“取指令”、“剖析指令”与“履行指令”重叠。
参照答案:
①连续履行N条指令所需的时间为:
4△t+3(N-1)△t=(3N+1)△t
③连续履行N条指令所需的时间为:
4△t+2(N-1)△t=(2N+2)△t
5.有一指令流水线以下所示
②求连续输入10条指令,该流水线的实质吞吐率和效率;②该流水线的“瓶颈”在哪一段?
请采纳两种不一样的举措除去
此“瓶颈”。
关于你所给出的两种新的流水线,连续输入10条指令时,其实质吞吐率和效率各是多少?
参照答案:
(1)
.
m
Tpipeline
ti(n1)tmax
i
1
(5050100200)9200
2200(ns)
TP
n
Tpipeline
1
220(ns
1
)
m
ti
400
5
E
TP
i1
m
TP
45.45%
4
11
(2)瓶颈在3、4段。
变为八级流水线(细分)
入
1
2
3_1
3_2
50ns
50ns
50ns
50ns
3-1
12
3-2
m
Tpipeline
i
1
ti(n1)tmax
50
8
9
50
850(ns)
TP
n
1
(ns
1
)
Tpipeline
85
m
ti
400
10
E
TPi1
TP
58.82%
m
8
17
重复设置零件
n
1
1
TP
(ns)
Tpipeline
85
精选文档
出
4_14_4
50ns50ns
4-1
4-2
4-3
4-4
.
精选文档
段
4_4
4_3
4_2
4_1
3_2
3_1
2
1
4
8
3
7
2
6
10
1
5
9
2
4
6
8
10
1
3
5
7
9
12345678910
12345678910
时间
850ns
E
40010
8
10
17
58.82%
850
6.动向多功能流水线由6个功能段构成,以以下图:
加法
S1
S2
S3
S4
S5
S6
乘法
此中,S1、S4、S5、S6构成乘法流水线,S1、S2、S3、S6构成加法流水线,各个功能段时间均为50ns,假定该流水线的输出结果能够直
接返回输入端,5并且设置有足够的缓冲寄存器,若以最快的方式用该
xiyizi
流水计算:
i1
①画出时空图;
②计算实质的吞吐率、加快比和效率。
参照答案:
.
精选文档
7.某向量办理机有16个向量寄存器,此中V0~V5中分别放有向量A、
B、C、D、E、F,向量长度均为8,向量各元素均为浮点数;办理零件采纳两条单功能流水线,加法功能零件时间为2拍,乘法功能零件时间为3拍。
采纳近似于CARY-1的链接技术,先计算(A+B)*C,在流水线不断流的状况下,接着计算(D+E)*F。
①求此链接流水线的经过时间?
(设寄存器入、出各需1拍)②若是每拍时间为50ns,达成这些计算并把结果存进相应寄存器,
此办理零件的实质吞吐率为多少MFLOPS?
参照答案:
解:
(1)在这里假定A+B的中间结果放在V6中,(A+B)×C地最后结果放在V7中,
D+E地中间结果放在V8中,(D+E)×F的最后结果放在V9中。
详细实现参照以下图:
V0AV1BV6V2CV7
向量加向量乘
V3DV4EV8V5FV9
经过时间应当为前者((A+B)×C)经过的时间:
T经过=(1+2+1)+(1+3+1)=9(拍)
(2)在做完(A+B)×C以后,作(C+D)×E就不需要经过时间了。
V6←A+B
V7←V6×C
V8←D+E
V9←V8×F
T
T经过+(8-1)824(拍)1200(ns)
TP
32
26.67MFLOPS
T
8.假定分支目标缓冲的命中率为
90%,程序中无条件转移指令的比
例为5%,没有无条件转移指令的程序CPI值为1。
假定分支目标缓冲中包含分支目标指令,同意无条件转移指令进入分支目标缓冲,则程序的CPI值为多少?
参照答案:
解:
设每条无条件转移指令的延缓为x,则有:
1+5%×x=
x=2
.
精选文档
当分支目标缓冲命中时,无条件转移指令的延缓为0。
所以程序的CPI=1+2×5%×(1-90%)=
9.一台32个办理器的计算机,对远程储存器接见时间为400ns。
除了通讯之外,假定计算中的接见均命中局部储存器。
当发出一个
远程恳求时,本办理器挂起。
办理器时钟时间为1GHz,假如指
令基本的IPC为2(设所有访存均命中Cache),求在没有远程访
问的状态下与有0.2%的指令需要远程接见的状态下,前者比后
者快多少?
参照答案:
解:
没有远程接见时,机器的CPI为1/基本
有0.2%远程接见的机器的实质CPI为
CPI=基本CPI+远程接见率×远程接见开支
=+0.2%×远程接见开支
远程接见开支为:
远程接见时间/时钟周期时间=400ns/1ns=400个时钟周期
∴CPI=+0.2%×4