计算机体系结构考试总结docxWord文档下载推荐.docx
《计算机体系结构考试总结docxWord文档下载推荐.docx》由会员分享,可在线阅读,更多相关《计算机体系结构考试总结docxWord文档下载推荐.docx(23页珍藏版)》请在冰豆网上搜索。
计算机系统的使用者,在需要更换外围设备吋,各种不同型号,不同生产厂家的设备都可以直接通过独立于具体设备的标准接口与计算机系统连接。
处理机采用统一的硬件和软件対品种繁多的设备进行管理。
10.什么是线性流水,非线性流水,静态线性流水,动态线性流水?
线性流水:
流水线可以按不同的观点进行分类。
1分
按照是否有反馈冋路來分,可分为线性流水线和非线性流水线。
1分线性流水线指流水线的各段串行连接,没有反馈回路。
2分
非线性流水:
按照是否有反馈回路來分,可分为线性流水线和非线性流水线。
1分非线性流水线指流水线屮除有串行连接的通路外,还有反馈冋路。
2分。
i挣态线性流水:
同一段时间内,各个功能段只能按照一种方式连接,实现一种固定的功能。
按同一时间内各段之间的连接方式來分,可分为静态流水线和动态流水线。
1分
静态流水线是指同一时间内,流水线的各段只能按同一种功能的连接方式工作。
2分
动态线性流水:
动态流水线是指同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。
什么是向量循环开采技术:
当向量的长度大于向量寄存器的长度时,必须把长向量分成长度固定的段,采用循坏结构处理这个长向量,这种技术称为向量循坏开采技术,也称为向量分段开釆技术。
2.简答题
1.计算机体系结构设计中有哪些常用的定向原理?
1•大概率事件优先原则,这是最重要也是最广泛采用的计算机设计准则。
2.阿姆达尔定律。
即系统屮对某一部件采川某种更快的执行方式所能获得的系统性能改进程度,収决于这种执行方式被使用的频率或所占总执行时间的比例。
3.程序访问的局部性规律。
其主要反映在时间和空间局部性两个方面,时间局部性是指程序屮近期被访问的信息项很可能马上被访问;
空间局部性長指那些在访问地址上相邻近的信息项很可能会被一同访问。
2.存储器层次结构:
第1层:
RegisterFiles(寄存器堆)
第2层:
Buffers(Lookahead)(先行缓冲站)
第3层:
Cache(高速缓冲存储器)
笫4层:
MainMemory(主存储器)
笫5层:
OnlineStorage(联机存储器)第6层:
Off-lineStorage(脱机存储器)
3.体系结构的佛林(Flynn)分类
⑴单指令流单数据流SISD(SingleInstructionSingleDatastream)
(2)单指令流多数据流SIMD(SingleInstructionMultipleDatastream)
(3)多指令流单数据流MISD(MultipleInstructionSingleDatastream)
(4)多指令流多数据流MIMSfMultipleInstructionMultipleDatastream)
4.通用机指令系统有哪五大类?
数据传送类指令运算类指令
程序控制指令
输入输出指令
处理机控制
调试指令
5.解决存储器频带平衡的方法
⑴多个存储器并行工作
(2)设置各种缓冲存储器
⑶采用存储系统
6.造成cache与主存不一致的原因?
(1)由于CPU写Cache,没有立即写主存
(2)由于10处理机或10设备写主存
7.通道的类型:
字节多路通道通常用于连接多个慢速或中速的设备,这些设备以传送字节为单位。
工作方式采用分时方式工作,它与CPU之间的高速数据通路分时为多台设备服务。
选择通道:
以独占的方式工作,它为一台外设传送完数据后才转去处理其他外设的请求•适用于高速外设。
数组多路通道:
是上述两种通道的结合。
它允许以块为单位在若干高速传输操作Z间进行交叉复用。
因此它相当于一个只以猝发模式工作的高速多路通道。
8.开发并行性的途径有哪些?
(1)时间重叠:
多个处理过程在时间上相互错开,轮流重迭地使川同一套硬件设备的各个部分,以加快硬件周转而赢得速度。
(2)资源重复:
根据“以数量取胜”的原则,通过重复地设置资源,尤其是换件资源,以大幅度提高计算机系统的性能。
(3)资源共享:
这是一种软件方法,它使多个任务按一定时间顺序轮流使用同一套硬件设备。
9•解决指令相关,数据相关,控制相关的方法
指令相关:
在程序执行过程中不允许修改指令。
数据相关:
方法一:
把读操作数、写运算结果与指令执行合在一个节拍。
方法二:
建立相关专用通路(ByPass)
控制相关:
在流水线屮尽早判断出分支转移是否成功;
尽早计算出分支转移成功时的PC值(即分支的目标地址)1分
(2)“冻结”或“排空”流水线的方法1分(3)预测分支失败1分(4)
预测分支成功1分(5)延迟分支
10.什么是向量链接技术?
当前一条指令的结果寄存器可以作为示继指令的操作数寄存器时,多条有数据和关的向量指令并行执行,这种技术称为两条流水线的链接技术。
11.先行控制的方式的原理
1.采用二次垂叠执行方式必须解决两个问题:
(1)有独立的取指令部件、指令分析部件和指令执行部件
把一个集中的指令控制器,分解成三个独立的控制器:
存储控制器、指令控制器、运算控制器
(2)要解决访问主存储器的冲突问题
取指令、分析指令、执行指令都可能耍访问存储器
答:
先行捽制技术是把缓冲技术和檢处理技术相结合。
缓冲技术是在工作速度不周定的两个功能部件之间设置缓冲器,川以平滑它们的工作。
预处理技术是指预瑕指令、対指令进行加工以及预取操作数等。
采用先行控制方式的处理机内部设遥多个缓冲站,用于平滑主存、指令分析部件、运口器三者之间的工作。
这样不仅使它们都能独总地工作,充分忙碌而不用相互等待.而且使折令分析部件和运算器分别能快速地取得描令和操作数•大幅度地提高指令的执行速度和部件的效率。
这些缓冲站都按先进先出的方式工作•而且都是由一组若干个能快速访问的存储单元和相关的控制逻辑组成。
采用先fj控制技术诃以实现』条指令的重脅解释执彳J。
3.计算题
1.Amdahl定理,加速比必考
1.已知某商用计算机拟增加字符串操作功能。
若用软件实现,与无字符串操作相比,速度提高4倍,CPU成本提高1/5倍;
若用硬件实现,则速度是原來的100倍,,CPU成本是原來的5倍。
山实验测得,字符串操作占总运行时间的50%,CPU成本约占整机成本的1/3。
你选用哪种设计方案?
9、答案內容:
解:
采用软件方法时
根据阿姆达尔定律,性能提高:
1
4(1-50%)+警丸66免
硬件成本提高到C=2/3+1/3*(1+1/5)二1.07分
价格性能比为:
C/S=1.07/1.66=0.64分
采用硬件方法时:
S=l/[(1-50%)+50%/100]=1.98分2
硬件成本提髙到C=2/3+1/3*5=2.33分1
C/S=2.33/1.98=1.18分1
如果仅考虑性能提高,则可选择换件方法,而考虑性能提高和成本因素,则应选择软件方法。
分2
2.存储器中LRU,FIFO,OPT,页替换算法,计算命屮率
有一个-Cache-主存“存储层次,主存共分8个块(0〜7),Cache分为4个块(0〜3)採用组相联映象,组内块数为2块,替换算法为近期最少使用法(LRU)O
(1)画出主存、Cache存储器地址的各字段对应关系:
(2)对于如下主存块地址流:
1、2、4、1、3、7、0、1、2、5、4、6、4、7、2,如主存中内空一开始耒装入Cache中,请列出随时间变化Cache中各块的使用情况。
;
⑶对于
(2),指出块失效乂发生块争用时刻。
⑷对于(23),求出此间的Cache命屮率。
nd区号
q,~
S,块号
11位
1位
nmi•(块内地址)|
J
11
nci*(块内地址)|
(2如下表
■
分3
访问顺序
?
3
4
5
6
7
S
9
10
11
12
13
14
15
地址块号
2
一
Cache屮块分配情况
—
b
/
——
操作状态
调进
命屮
替换
命
屮
(3)在第11和15次访问块时产生块失效乂发生块争用现象。
掘
(4)命屮率:
He二3/15二20%分2
3.通道中计算流量,工作周期,吞吐量及出现什么问题
6.8一个字节多路通道连接有6台设备,它们的数抑:
传输率妇下表所示。
设备名称
d2
d4
d5
d6
数据传输速率<B/ms)
50
40
25
(1)计算该通道的实际工作流量o
(2)若迪道的最大流虽等于实际工作流量,求逋道的工作周期Ts+TD0無
(1)通道实际流量为
力=工升=5()+50+4()+25+25+10=200B/ms
(2)由于通道的最人流賦等于实际工作流亂,即有
Jmax-bvtc~
TsF
=200/ms
可得.通道的工作周期Ts+Td=5ps.
4.指令重叠过程中计算效率
一个流水线山四段组成,其中每当流经笫三段时,总要在该段循环一次才能流到笫四段。
如果每段经过一次的时间都是问:
当在流水线的输入端每At时间输入任务时,该流水线会发生什么悄况?
此流水线的实际吞吐率为多少?
如果每2At输入一个任务,连续处理10个任务的实际吞吐率和效率是多少?
当每段时间不变时,如何提高该流水线的吞吐率?
仍连续处理10个任务时,其吞吐率提高多少?
解:
(1)会发生流水线阻塞情况。
2
Instr.l
staaelstase?
JV
stase3
V
stage3
stase4
instr.2
stasel
stage!
stall
instr.3
stagel
stage2
stase?
stage4
insti.4
(2)
Ot
分4
It
2t3t
4t5t
6t7t
st
Instr.1
staael
w
staae2
Ur
staae3
staae4w
instr.:
•-
c
stages
stage3u
iiisti\3
stase3stasei
stage」
•
■rw
s
A
n
q
r
8
9占
二
Time
►
■气w
Rs
1C
Stage
t
:
m•
i
a
G
I
•c
e
:
2△/
^pipeline=?
A/
AE=TP-5%=5%2〜54.35%
X
d|
D
■o
3_2
3_1
14△/
TP=%pt=1%4・4=%・&
吞叶率提高倍数=怎=1.64
3.15动态多功能流水线由6个功能段组成,如下图:
力」法
乘法
其中,SI、S4、S5、S6组成乘法流水线,SI、S2、S3、S6组成加法流水线,各个功能段时冋均为50ns,假设该流水线的偷出结果讨以」'
]•接返冋输入端,而巨设宜晳足够的缓冲寄存器,若以最快的方式用该流水计算:
£
x,yz
i・】
U)画出时空图:
(2)计算实际的吞吐率、加速比和效率。
机器一共要做10次乘法,4次加法°
曰s
1t
[10口
L—l—L
SB
g
io
加連I蛊=2-55
I4x4
好‘騎11也皿
5.哈夫曼树指令优化
6.流水线的时空图,计算加速比,吞吐率
若有一静态多功能流水线分为6段,如图所示,其中乘法流水线由1、2、3、6段组成,加法流水线由1、4、5、6段组成,通过每段所需时间如图所示。
使用流水线时,要等某种功能(如加法)操作都处理完毕后才能转换成另种功能(如乘法)。
若要计算:
AXB=(al+bl)X(a2+b2)X(a3+b3),问:
⑴在上述流水方式下,完成AXB需要多少时间?
画岀时空图并计算此流水线的使用效率和吞吐率。
(2)与顺序运算方式相比,加速比为多少?
(1)T二26T
吞吐率:
Tp二3/26T
效率:
E二(2*17)/(26*6)二21.79%分3
(2)加速比:
Sp=Tl/Tk=(6t*3+8t*2)/26t=1.31
在如下图所示的静态流水线上计算工AS,/=!
流水线的输出可以直孩返回输入端或
协态流水线<
*>
加曲法
m~~n~1-1r~\~—U~l
45678
ML_1L_H_J-
棗法
暂存丁•相应丁的流水线寄存器屮,试计算其吞叶•率,加速比,效率。
(1)确定适合丁•流水处理的计算过程为:
3分
右AiBi的计算过程
AiBi■AiBi+A2B2+A3B3+A4B4
A1B1
A2B2
A3B3
A4B4
十十
(2)根据所确定的计算过程,画出时空图
时空阴
«
3.1)
Q12345C7
4144i
89
10111213141516
it1:
io.0时m
Al
A2
Ad
A4
A1B1十A2B2
Bi
Bn
Ba
AoB34-A4&
A1B1/
LaBa
AiBi>
A2B2
AtBi>
A2Bz
AnB”A4B4
+A3Ba4>
A4&
(3)根据时空国和流水线性能公式,计算性能分3
故:
吞叶率ZP=7/(20At)
加速比S=(34ZU)/(20Z\r)=l.7
效率^=(4X4+3X6)/(8X20)=0.21
7.给定一个向量计算过程,如何用向量链接技术计算完成计算过程的吋间(指周期,单位为拍)
CRAY-1机器上,按照链接方式执行下述4条向量指令(括号屮给出了相应功能部件的时间),如果向虽寄存器和功能部件之间数据传输需要1拍,试求此链接流水线的通过时间是多少扌|'
|?
如果向虽长度为64,则需要多少扌|'
|才能得到全部结果。
VO-存储器(从存储器中収数:
7拍)V2-VO+V1(向量加:
3拍)V2-V2vA3(按(A3)左移:
4拍)
V5-V3AV4(向量逻辑乘:
2拍
通过时间就是每条向量指令的第一个操作数执行完毕需要的时间,也就是各功能流水线由空到满的时间,具体过程如下图所示。
要得到全部结果,在流水线充满之后,向量中后继操作数继续以流水方式执行,直到整组向量执行完毕。
T通过=(7+1)+(1+3+1)+(1+4+1)+(1+2+1)=23(拍)!
\叹=丁通过+(64-1)=23+63=86(拍)
向量处理机有16个向量寄存器,其中VO〜V5中分别存放有向量A、B、C、D、E、F,向量长度均为12,向量各元素均为浮点数;
处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。
采用类似CRAY-1的链接技术,先计算(A+B)*C,在流水线不停留的情况下,接着计算(D+E)*FO
(1)求此链接流水线的通过时间为多少拍?
(设寄存器入、出各盂1拍)假如每拍时间为50ns,完成这些计算并把结果存进相应寄存器,此处理部件地实际吞吐率为多少MFLOPS?
秤:
(1)我们在这里假设A+B的屮间结果放在丫6屮,(A+B)*C地最后结果放在V7屮,D+E地屮间结果放在V8屮,(D+E)*F的最后结果放在¥
9屮。
具体实现参考下图:
通过时间应该为前者((A+B)*C)通过的时间:
T通过二(1+2+1)+(1+3+1)=940)掘
(2)在做完(A+B)*CZ后,作(C+D)*己就不需要通过时间了。
4分
V6=A+B:
V7=V6*C;
V8=D+E:
V9=V8♦F:
T=T^i+(8-1)+8=24(扌口)=1200(ns)
TP=—=26.67NIFLOB
T
四、(15分)有一条动态多功能流水线由5段组成,加法用1、2、3、5段,乘法用1、4、5段,第4段的时间为2At,其余各段时间均为而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。
若在该流水线上计算f=Al*Bl+A2*B2+A3*B3+A4*B4,
(1)画出处理过程的时空图;
(2)计算其吞吐率、加速比和效率。
由图可见,它在14个△£
时间中.给出了7个结果。
所以吞吐率为:
77^=7/(14Arf
如只不用流水线,由于一次求枳需3Af,一次求和册4△八则产牛.上述7个结來共需(4X4+3X3)AZ=25AZo所以加速比为:
25Ar
14A/
=1.79
■该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得:
/?
=4x4±
3x3=O357
5x14
六、(4分)将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的90%,则采用此增强功能方法后,能使整个系统的性能提高多少?
七、(6分)假设有一个长流水线,仅仅对