系统结构作业Word文件下载.docx
《系统结构作业Word文件下载.docx》由会员分享,可在线阅读,更多相关《系统结构作业Word文件下载.docx(15页珍藏版)》请在冰豆网上搜索。
(2)假设程序有M条指令组成。
算逻运算中25%的指令的两个操作数中的一个已在寄存器中,另一个必须在算逻指令执行前用Load指令从存储器取到寄存器。
因此有人建议增加另一种算逻指令,其特点是一个操作数取自寄存器,另一个操作数取自存储器,即寄存器-存储器类型,假设这种指令的CPI等于2。
同时,转移指令的CPI变为3。
求新指令系统的平均CPI。
解:
(1)等效CPI为:
43%*1+21%*2+12%*2+24%*2=1.57
(2)增加新指令后:
算逻指令43%*75%=32.25%1
Load指令21%—43%*25%=10.25%2
转移指令24%3
新指令43%*25%=10.75%2
新指令系统的平均CPI为:
1.908ns
(3)新的CPI比原先的CPI要大,所以效率比原先要低,修改前的系统较好
第二章
2-9经统计,某机器14条指令的使用频度分别为0.01,0.15,0.12,0.03,0.02,0.04,0.02,
0.04,0.01,0.13,0.15,0.14,0.11,0.03。
分别求出用等长码、哈夫曼码、只有两种码长的扩展操作码等3种编码方式的操作码平均码长。
等长码:
log214向上取整结果为4,即码长为4
=4
即等长码的操作码平均码长为4;
哈夫曼码:
1
0
0.01
10
101
11001
00
101010101
哈夫曼树
哈夫曼编码及扩展操作码编码
频度
哈夫曼编码
OP长度
扩展码
OP
长度
频率
赫夫曼码
位
0.15
000
3
0.04
10100
5
11001
0.15
001
0.03
10101
11010
0.14
010
10110
11011
0.13
011
0.02
10111
11100
0.12
100
11110
11101
0.11
110
101
111110
6
1110
4
11000
111111
11111
=(0.15+0.15+0.14+0.13+0.12+0.11)*3+0.04*4+0.14*5+0.02*6=3.38
即哈夫曼码操作码平均码长为3.38;
只有两种码长的扩展操作码:
=0.8*3+0.2*5=3.4
即只有两种码长的扩展操作码平均码长为3.4
2-17答:
设计RISC的基本原则:
(1)确定指令系统时,只能选择使用频率很高的那些指令,在增加少量有效能支持操作系统、高级语言实现及其他功能的指令。
(2)减少指令系统所用寻址方式种类,一边不超过两种。
(3)让所有指令都在一个周期内完成。
(4)扩大通用寄存器数,一般不少于32个,以尽量减少访存。
(5)大多数指令都用硬联控制实现,少量指令采用微程序实现。
(6)通过精简指令和优化设计编译程序,简单有效地支持高级语言实现。
设计RISC结构采用的基本技术
(1)按RISC基本原则设计
(2)逻辑实现采用硬联和微程序相结合。
(3)在CPU中设置大量工作寄存器并采用重叠寄存器窗口。
(4)指令用流水和延迟转移
(5)采用高速缓存Cache
(6)优化设计编译系统
第三章
3—5答:
(1)中断处理顺序1—>
3—>
4—>
2。
(2)图为:
3—12答:
(1)所有设备都工作时的通道实际最大流量为50+15+100+25+40+20=250KB/s。
(2)通道的工作周期为
。
响应次序:
1—>
5—>
6—>
2。
1号设备传一个字节所用的时间:
2号设备传一个字节所用的时间:
3号设备传一个字节所用的时间:
4号设备传一个字节所用的时间:
5号设备传一个字节所用的时间:
6号设备传一个字节所用的时间:
。
(3)答:
在
(2)的基础上,只需在2号设备中设置两个字节的数据缓冲器,采用先进先出的方式工作,暂时保存尚未得到传输的数据,就可以避免字节数据信息的丢失。
本题中,在66.6
时,缓冲器的第一个字节单元存的是0
时所传的数据,而缓冲器第二个字节单元存放的是设备在66.6
时所需传送的字节数据。
到100
时,通道将缓冲器中的第一个字节传送,在放下一个来不及处理的数据,依次类推,设备就不会丢失信息。
第四章
4-6.因为实页数越多命中率越高,当实页数为5时
实页数为5的命中率为7/12;
当实页数为4时:
实页数为4的命中率为7/12;
当实页数为3时:
实页数为3的命中率为1/6;
综上分析,至少分配给程序4个实页,最高命中率为7/12
4-14.
(1).主存、Cache地址的各字段的对应关系图:
(2).主存-Cache空间块的映像对应关系:
(3).
(3)根据上表的内容可知,发生Cache块失效又发生争用的时刻有6,7,9,10,11,12,14,15.
(4)根据上表的内容可知,发生Cache块命中的时刻有:
4,8,13可知Cache命中率:
1/5
第五章
5.5为提高流水线的效率可用哪两种主要途径来克服速度瓶颈?
现有3段流水线各段经过的时间依次为△t、3△t、△t。
(1)分别计算在连续输入3条指令时和30条指令时的吞吐率和效率。
(2)按两种逾径之一改进,画出你的流水线结构示意图.同时计算连续输入3条指令和30条指令时的吞吐率和效率。
(3)通过对
(1)、
(2)两小题的计算比较可得出什么结论?
个颈段并联工作,给其轮流分配任务的两种途径。
(1)答:
提高流水线效率,消除速度瓶颈主要有将瓶颈段再细分以及重复设置多
连续输入3条指令时流水线的时空图为:
原3段的流水线工作起来仍可看成是一条线性流水线只是其中经过时间为3△t的段是瓶颈段,所以可以按
及
来求得
和
.其中,n为连续输入的指令数,m为3个段,,△
=△t,
=3△t,△
=△t,△
为瓶颈段经过时间。
在3段流水线,各段经过时间依次为△t、3△t、△t的情况下,连续流入3条指令时,将n=3,m=3,△
=3△t代入,可得吞吐率
,和效率
为
而连续流入30条指令时,只需将上式之n改为30,其它参数不变,得
(2)采取将2段细分成3个子段,每个子段均为△t,构成的流水线结构如图
连续流入3条指令时,将n=3,m=5,△
=△
代入,得
连续流入30条指令时,将n=30代入,其它参数不变,有
将
(1)题的计算结果进行比较可以看出,只有当连续流入流水线的联指令越多时,流水线的实际吞吐率和效率才会提高。
将
(1)、
(2)题的计算结果进行比较,同样可以看出,无论采用瓶颈子过程再细分,还是将多个瓶颈子过程并联来消除流水线瓶颈,都只有在连续流入流水线的指令数越多时才能使实际吞吐率和效率得到显著的提高。
若连续流入流水线的指令数太少,消除流水线瓶颈虽可以提高流水线的实际吞吐率
,而效率
却可能下降。
5.9题在一个5段的流水线处理机上需经9拍才能完成一个任务,其预约表如表5.9所示。
分别写出延迟禁止表F、冲突向量c;
画出流水线状态转移图,求出最小平均延迟及流水线的最大吞吐率及其调度方案.按此流水调度方案输入6个任务,求实际吞吐率,效率。
.
对预约表中各个行中打“√”的拍数求出差值,并将这些差值汇集在一起,就可得到延迟禁止表
F={1,3,4,8}
由延迟禁止表F可转换得初始冲突向量
C=(10001101)
流水线状态转移图为:
各种调度方案及其相应的平均延迟如下表所示:
由上表可知,最小平均延迟为3.5拍。
此时流水线的最大吞吐率Tpmax=1/3.5(任务/拍).
最佳调度方案宜选其中按(2,5)周期性调度的方案。
按(2,5)调度方案输入6个任务的时空图为:
全部完成的时间为25(拍),实际吞吐率Tp=6/25(拍/任务),
效率
=(11*6)/(25*5)。