计算机体系结构复习题含答案.docx
《计算机体系结构复习题含答案.docx》由会员分享,可在线阅读,更多相关《计算机体系结构复习题含答案.docx(15页珍藏版)》请在冰豆网上搜索。
计算机体系结构复习题含答案
计算机体系结构复习题
一、选择题
1.下列不属于cache地址映象算法的是()
A.全相联映象B.直接映象C.段相联映象D.组相联映象
答案:
C
2.从处理数据的角度来看,不属于其并行性的是()
A.字串位串B.字串位并C.字并位串D.指令字并行
答案:
D
3.以下IO控制方式中适用于高速外设的是()
A.程序中断方式B.通道控制方式
C.程序查询方式D.无条件传送方式
答案:
B
4.影响通信延迟的因素有()
A.发送开销B.跨越时间C.传输时间D.接收开销
5.传统机器程序员所看到的计算机属性,即概念性结构与功能特性,是()
A.计算机系统结构B.计算机组成原理
C.计算机的实现D.计算机机器语言
答案:
A
6.由同一厂家生产的具有相同系统但不同组成和实现的一系列不同型号的计算机属于()
A.品牌机B.系列机C.一体机D.兼容机
答案:
B
7.用于存放近期经常使用的页表项、其内容是页表部分内容副本的是()
A.PCBB.CPIC.TLBD.ALU
答案:
C
8.流水线冲突主要有()
A.数据冲突B.名冲突C.结构冲突D.控制冲突
答案:
ACD
9.相关主要有()
A.数据相关B.名相关C.结构相关D.控制相关
答案:
ABD
10.按照流水技术用于计算机系统的等级不同,可分为()
A.多功能流水线B.部件级流水线
C.处理机级流水线D.系统级流水线
答案:
BCD
11.下列不属于指令设计要求的是()
A.规整性B.高效率C.集约性D.兼容性
答案:
C
12.记录相关分支指令的“历史”,并据此进行预测的方法是()
A.BHT法B.BTB法C.TLB法D.PCB法
答案:
A
二、填空题
1.IO通道可分为三类:
___________,____________,____________。
2.在指令流水中,解决控制相关的方法,主要有:
_________________,________________,________________和________________。
3.单机和多机并行性发展的技术途径有:
________,________,________。
4.指令集结构的正交特性是指令集的三个主要元素________、________和_________两两在指令集结构中独立无关。
5.系列机软件四类兼容主要包括________、________、_______、_______。
6.设计IO系统的三个标准是______、______和______。
7.互联网络根据工作行为可分为两类,一种是________,一种是________。
8.DLX流水线可分为_____、_____、_____、_____、_____五个操作功能段。
9.延迟分支的三种调度方法是:
__________,__________,__________。
答案:
1.字节多路通道;数组多路通道;选择通道;
2.冻结或排空流水线;预测发生;预测不发生;调试分支延迟;
3.资源共享;资源重复;时间重叠;
4.操作;数据类型;寻址方式;
5.向前兼容;向后兼容;向下兼容;向上兼容;
6.性能;价格;容量;
7.动态网络;静态网络;
8.取指;译码;执行;访存;写回;
9.从前调度;从目标处调度;从失败处调度。
三、判断题
1.两级cache的设计中,应使第一级cache的容量较大。
()
答案:
错
2.减小容量失效的方法是减小容量。
()
答案:
错
3.减小冲突失效的方法是提高相联度。
()
答案:
对
4.多道程序系统以吞吐率为标准评价计算机性能。
()
答案:
对
5.流水线各个功能段所需时间应尽量相等。
()
答案:
对
6.评价cache系统速度快慢的指标是cache与主存的容量差。
()
答案:
错
7.多级存储层次是利用程序局部性原理来设计的。
()
答案:
对
8.磁盘的每一磁道分成若干扇区,它们之间留有不用的间隙。
()
答案:
对
9.在计算机体系结构设计中,软硬件功能分配取决于主存容量。
()
答案:
错
10.在存储层次结构中,cache比辅存离CPU远。
()
答案:
错
11.一般并行性包括并行和并发两个方面。
()
答案:
对
12.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三方面内容。
()
答案:
对
13.缺页中断发生率能够评价cache系统对整个系统CPU性能的影响。
()
答案:
错
14.程序执行时间是指从事件开始到结束之间的时间。
()
答案:
错
15.减小强制性失效的方法有增加块大小和预取。
()
答案:
对
16.流水线中解决数据相关可通过定向技术、暂停技术和编译器调度。
()
答案:
对
17.磁盘访问一致性协议是维护多个处理器一致性的协议。
()
答案:
错
18.采用容量大、结构复杂的cache可以降低cache命中时间。
()
答案:
错
19.用软件实现的机器是虚拟机。
()
答案:
对
20.程序的局部性原理是指程序在主存中的存放地址不可预测。
()
答案:
错
21.用一台现有的计算机上的微程序去解释实现另一台计算机的指令系统,是仿真。
()
答案:
对
22.用软件的方法在一台现有的计算机上实现另一台计算机的指令系统,是模拟。
()
答案:
对
23.数据表示即用软件实现的数据类型。
()
答案:
错
24.指令设计时,对于不常使用的指令可以设调较长的操作码。
()
答案:
错
25.CISC结构指令集中,各种指令的使用频率比较相近。
()
答案:
错
26.RISC指令集结构中所有指令长度均相同。
()
答案:
对
27.寻址方式只能在操作码中指出。
()
答案:
错
28.多功能流水线各段之间可进行不同连接,以实现不同功能流水线。
()
答案:
对
29.结构冲突是指因访问同一存储单元而引起的冲突。
()
答案:
错
30.超流水是指在一个时钟周期内分时流出多条指令。
()
答案:
对
四、简答题
1.从执行程序的角度来看,计算机系统中并行性等级从低到高可以分为哪几级?
答案:
从执行程序的角度来看,并行性等级从低到高可分为:
(1)指令内部并行:
单条指令中各微操作之间的并行;
(2)指令级并行:
并行执行两条或两条以上的指令;
(3)线程级并行:
并行执行两个或两个以上的线程,通常是以一个进程内派生的多个线程为调度单位;
(4)任务级或过程级并行:
并行执行两个或两个以上的过程或任务(程序段),以子程序或进程为调度单元;
(5)作业或程序级并行:
并行执行两个或两个以上的作业或程序。
2.计算机系统结构的Flynn分类法是按什么来分类的?
共分为哪几类?
答案:
Flynn分类法是按照指令流和数据流的多倍性进行分类。
把计算机系统的结构分为:
(1)单指令流单数据流SISD
(2)单指令流多数据流SIMD
(3)多指令流单数据流MISD
(4)多指令流多数据流MIMD
3.简述RISC指令集结构的设计原则。
答案:
(1)选取使用频率最高的指令,并补充一些最有用的指令;
(2)每条指令的功能应尽可能简单,并在一个机器周期内完成;
(3)所有指令长度均相同;
(4)只有Load和Store操作指令才访问存储器,其它指令操作均在寄存器之间进行;
(5)以简单有效的方式支持高级语言。
4.指令的执行可采用顺序执行、重叠执行和流水线三种方式,它们的主要区别是什么?
各有何优缺点。
答案:
(1)指令的顺序执行是指指令与指令之间顺序串行。
即上一条指令全部执行完后,才能开始执行下一条指令。
优点是控制简单,节省设备。
缺点是执行指令的速度慢,功能部件的利用率低。
(2)指令的重叠指令是在相邻的指令之间,让第k条指令与取第k+l条指令同时进行。
重叠执行不能加快单条指令的执行速度,但在硬件增加不多的情况下,可以加快相邻两条指令以及整段程序的执行速度。
与顺序方式相比,功能部件的利用率提高了,控制变复杂了。
(3)指令的流水执行是把一个指令的执行过程分解为若干个子过程,每个子过程由专门的功能部件来实现。
把多个处理过程在时间上错开,依次通过各功能段,每个子过程与其它的子过程并行进行。
依靠提高吞吐率来提高系统性能。
流水线中各段的时间应尽可能相等。
5.简述先行控制的基本思想。
答案:
先行控制技术是把缓冲技术和预处理技术相结合。
缓冲技术是在工作速度不固定的两个功能部件之间设置缓冲器,用以平滑它们的工作。
预处理技术是指预取指令、对指令进行加工以及预取操作数等。
采用先行控制方式的处理机内部设置多个缓冲站,用于平滑主存、指令分析部件、运算器三者之间的工作。
这样不仅使它们都能独立地工作,充分忙碌而不用相互等待,而且使指令分析部件和运算器分别能快速地取得指令和操作数,大幅度地提高指令的执行速度和部件的效率。
这些缓冲站都按先进先出的方式工作,而且都是由一组若干个能快速访问的存储单元和相关的控制逻辑组成。
采用先行控制技术可以实现多条指令的重叠解释执行。
6.简述流水线技术的特点。
答案:
(1)流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。
因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率。
(2)流水线中各段的时间应尽可能相等,否则将引起流水线堵塞和断流。
(3)流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。
(4)流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。
(5)流水线需要有通过时间和排空时间。
在这两个时间段中,流水线都不是满负荷工作。
五、计算题
1.假设有一条长流水线,仅仅对条件转移指令使用分支目标缓冲。
假设分支预测错误的开销为4个时钟周期,缓冲不命中的开销为3个时钟周期。
假设:
命中率为90%,预测精度为90%,分支频率为15%,没有分支的基本CPI为1。
(1)求程序执行的CPI。
(2)相对于采用固定的2个时钟周期延迟的分支处理,哪种方法程序执行速度更快?
2.假设分支目标缓冲的命中率为90%,程序中无条件转移指令的比例为5%,没有无条件转移指令的程序CPI值为1。
假设分支目标缓冲中包含分支目标指令,允许无条件转移指令进入分支目标缓冲,则程序CPI值为多少?
3.给定以下的假设,试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU的性能。
由计算结果能得出什么结论?
(1)理想Cache情况下的CPI为2.0,时钟周期为2ns,平均每条指令访存1.2次;
(2)两者Cache容量均为64KB,块大小都是32字节;
(3)组相联Cache中的多路选择器使CPU的时钟周期增加了10%;
(4)这两种Cache的失效开销都是80ns;
(5)命中时间为1个时钟周期;
(6)64KB直接映象Cache的失效率为1.4%,64KB两路组相联Cache的失效率为1.0%。
4.一个字节多路通道连接有6台设备,它们的数据传输率如下表所示。
(1)计算该通道的实际工作流量。
(2)若通道的最大流量等于实际工作流量,求通道的工作周期TS+TD。
5.假设一台计算机的I/O处理时间占10%,当其CPU性能改进为原来的100倍,而I/O性能仅改进为原来的2倍时,系统总体性能有什么样的变化?
6.一个具有32台处理机的系统,对远程存储器访问时间是2000ns。
除了通信以外,假设计算中的访问均命中局部存储器。
当发出一个远程请求时,本地处理机挂起。
处理机的时钟周期时间是10ns,假设指令基本的CPI为1.0(设所有访存均命中Cache)。
对于下述两种情况:
(1)没有远程访问;
(2)0.5%的指令需要远程访问。
试问前者比后者快多少?
7.计算机系统字长32位,包含两个选择通道和一个多路通道,每个选择通道上连接了两台磁盘机和两台磁带机,多路通道上连接了两台行式打印机,两台读卡机,10台终端,假定各设备的传输率如下:
磁盘机:
800KBps
磁带机:
200KBps
行打机:
6.6KBps
读卡机:
1.2KBps
终端:
1KBps
计算该计算机系统的最大I/O数据传输率。
8.设某个字节多路通道的设备选择时间TS为9.8μs,传送一个字节的数据所需的时间TD为0.2μs。
若某种低速外设每隔500μs发出一次传送请求,那么,该通道最多可连接多少台这种外设?
9.设一条指令的执行过程分成取指令、分析指令和执行指令三个阶段,每个阶段所需的时间分别为△t、△t和2△t。
分别求出下列各种情况下,连续执行N条指令所需的时间。
(1)顺序执行方式;
(2)只有“取指令”与“执行指令”重叠;
(3)“取指令”、“分析指令”与“执行指令”重叠。
10.有一指令流水线如下所示,求连续输入10条指令,该流水线的实际吞吐率和效率。
11.分别计算以下程序段中写操作在访存操作中所占的比例和写指令在访存指令中所占的比例。
LOADR2,b
LOADR3,c
ADDR1,R2,R3
LOADR3,f
SUBR2,R1,R3
STOREa,R2
12.某机存储系统采用并行和交叉相结合的方式工作,有32个存储体低位交叉,每次并行读写512位,存储周期为1280ns,处理机字长32位,试计算其存储带宽Bm
答案:
1.解:
(1)程序执行的CPI=没有分支的基本CPI+分支带来的额外开销
分支带来的额外开销是指在分支指令中,缓冲命中但预测错误带来的开销与缓冲没有命中带来的开销之和。
分支带来的额外开销=15%×(90%命中×10%预测错误×4+10%没命中×3)=0.099
所以,程序执行的CPI=1+0.099=1.099
(2)采用固定的2个时钟周期延迟的分支处理CPI=1+15%×2=1.3
所以,分支目标缓冲方法执行速度快。
2.解:
设每条无条件转移指令的延迟为x,则有:
1+5%×x=1.1
x=2
当分支目标缓冲命中时,无条件转移指令的延迟为0。
所以,程序的CPI=1+2×5%×(1-90%)=1.01
3.解:
平均访问时间=命中时间+失效率×失效开销
平均访问时间1-路=2.0+1.4%×80=3.12ns
平均访问时间2-路=2.0×(1+10%)+1.0%×80=3.0ns
所以,两路组相联的平均访问时间比较低。
CPUtime=(CPU执行+存储等待周期)×时钟周期
CPUtime=IC(CPI执行+总失效次数/指令总数×失效开销)×时钟周期
=IC((CPI执行×时钟周期)+(每条指令的访存次数×失效率×失效开销×时钟周期))
CPUtime1-way=IC(2.0×2+1.2×0.014×80)=5.344IC
CPUtime2-way=IC(2.2×2+1.2×0.01×80)=5.36IC
直接映象cache的访问速度比两路组相联cache要快1.04倍,而两路组相联Cache的平均性能比直接映象cache要高1.003倍。
因此这里选择两路组相联。
4.解:
(1)通道实际流量为
(2)由于通道的最大流量等于实际工作流量,即有
可得,通道的工作周期TS+TD=5μs
5.解:
6.解:
已知远程访问率p=0.5%,远程访问时间t=2000ns,时钟周期T=10ns
远程访问开销C=t/T=2000ns/10ns=200(时钟周期数)
有0.5%远程访问的机器的实际CPI2为:
CPI2=CPI1+p×C=1.0+0.5%×200=2.0
只有局部访问的机器的基本CPI1=1.0
CPI2/CPI1=2.0/1.0=2(倍)
故,没有远程访问状态下的机器速度是有0.5%远程访问的机器速度的2倍。
7.解:
(1)fBYTE=Σfi=f打印机传输率×2+f读卡机传输率×2+f终端传输率×10=25.6KBps(i=1..14)
(2)两个选择通道连接的设备相同,所以只要计算其中一个通道的传输率既可。
因为磁盘机的传输率大于磁带机。
所以此类通道的传输率为:
max{800,200}=800KBps
所以本系统的最大数据传输率为:
f系统=2×800+25.6=1625.6KBps
8.解:
其中,p为通道连接的外设台数,fi为外设i的数据传输速率。
因为连接的是同样的外设,所以f1=f2=…=fp=f,故有fbyte=pf。
已知TS=9.8μs,TD=0.2μs,1/f=500μs,可求出通道最多可连接的设备台数为:
9.解:
(1)每条指令的执行时间为:
△t+△t+2△t=4△t
连续执行N条指令所需的时间为:
4N△t
(2)连续执行N条指令所需的时间为:
4△t+3(N-1)△t=(3N+1)△t
(3)连续执行N条指令所需的时间为:
4△t+2(N-1)△t=(2N+2)△t
10.解:
11.解:
访存操作有:
每条指令的获取:
6条,读操作;Load指令:
3条,读操作;Store指令:
1条,写操作。
写操作在所有访存操作中所占的比例:
1/(6+3+1)=10%
写指令在访存指令中所占的比例:
1/(3+1)=25%
12.解:
n=32,w=512b,Tm=1280ns,
Bm=nw/Tm=32×512b/1280ns
=12.8Gb/s=1.6GB/s=400MW/s