解释下列术语.docx
《解释下列术语.docx》由会员分享,可在线阅读,更多相关《解释下列术语.docx(24页珍藏版)》请在冰豆网上搜索。
解释下列术语
★★
一、解释下列术语
计算机系统结构
计算机组成
计算机实现
【答案】计算机系统结构、计算机组成和计算机实现是三个不同的概念。
系统结构概念为由程序设计者所看到的一个计算机系统的属性,即概念性结构和功能特性,这里的程序设计者是指为机械语言或编译程序设计者所看到的计算机属性,是硬件子系统的概念结构及其功能特性,它是计算机系统的软、硬件的界面。
计算机组成是计算机系统结构的逻辑实现,包括机械内部的数据流和控制流的组成和逻辑设计等。
计算机实现是指计算机组成的物理实现。
★★
二、解释下列术语
系列机
兼容机
模拟
仿真
【答案】所谓系列机是指在一个厂家内生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机械。
不同公司厂家生产的具有相同系统结构的计算机成为兼容机。
系列机方式能够在具有相同系统结构的各类机械之间实现软件移植,为了实现软件在不同系统结构的机械之间的彼此移植,可以采用模拟和仿真。
模拟方式是指用软件方式在一台现有的计算机上实现另一台计算机的指令系统。
仿真是指用微程序直接解释另一种机械指令系统的方式。
★
3、SIMD是指()
A、单指令流单数据流B、单指令流多数据流
C、多指令流单数据流D、多指令流多数据流
【答案】B
★★
4、从执行程序的角度看,并行性品级可分为哪些?
【答案】指令内部并行、指令级并行、任务级或进程级并行、作业或程序级并行。
★★★
五、名词解释
Amdahl定律、CPI
【答案】Amdahl定律:
系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的利用频率或占总执行时间的比例有关。
Fe=(改良前可改良部份占用的时间)/(改良前整个任务的执行时间)
Se=(改良前可改良部份的执行时间)/(改良后改良部份的执行时间)
则,改良后整个系统加速比为
。
每条指令平均时钟周期数
CPI=CPU时钟周期数/IC(指令的条数)=
其中
=指令i在程序中执行的次数
★★
六、名词解释
MIPS、MFLOPS
【答案】MIPS=
=
MFLOPS=
★
7、依照计算机系统层次结构,算术运算、逻辑运算和移位等指令应属于()级机械语言。
A、传统机械语言机械B、操作系统机器
C、汇编语言机械D、高级语言机器
【答案】B
★
八、依照Flynn分类法,多处置机属于()。
A、SISDB、SIMD
C、MISDD、MIMD
【答案】D
★★
九、依照Amdahl定律,假设将某系统的某一部件的处置速度加速到原来的5倍,但该部件的原处置时间仅为整个运行时间的20%,则采用加速办法后能使整个系统的性能提高到原来的()倍。
A、1/B、1/
C、1/D、1/
【答案】D
★
10、对计算机系统结构,下列()是透明的。
A、浮点数据表示B、程序性中断
C、访问方式保护D、阵列运算部件
【答案】D
★
1一、对汇编语言程序员,下列()不是透明的。
A、中断字寄放器B、乘法器
C、移位器D、指令缓冲器
【答案】A
★★
1二、下列()兼容方式对系列机来讲是必需做到的。
A、向前兼容B、向后兼容
C、向上兼容D、向下兼容
【答案】B
★★
13、若是某一个计算任务用向量方式求解比用标量方式求解要快10倍,称可用向量方式求解部份所花费时间占总时间的百分比为可向量化百分比。
请画出加速比与可向量化比例二者关系的曲线,并回答加速比为2和5时,可向量化百分比别离为多少。
【答案】解:
设可向量化百分比为x,加速比为y,按照Amdahl定律,有
。
图略
则,
。
y=2时,x=
y=5时,x=
★★
14、用一台433MHz的处置器执行标准测试程序,它包括的各类指令和相应的时钟周期数如下表,求有效CPI、MIPS速度和程序的执行时间。
指令类型
指令数
时钟周期数
整数运算
50000
1
数据传送
35000
2
浮点运算
12000
2
控制传送
7000
2
【答案】
解:
=(50000*1+35000*2+12000*2+7000*2)/(50000+35000+12000+7000)
=周期/指令
=
执行时间t=(50000*1+35000*2+12000*2+7000*2)/(433*
)=*
★
1五、假设对A机械指令系统的每条指令的解释执行可直接由B机械的一段微程序解释执行,则A称为()。
A、仿真机B、宿主机
C、虚拟机D、目标机
【答案】D
★
1六、假设用软件方式在A计算机上实现B计算机的指令系统,则B称为()。
A、仿真机B、宿主机
C、虚拟机D、目标机
【答案】C
★
17、在计算机系统层次结构图中,下列四个级别机械由下到上应按()排列:
(1)、汇编语言机械
(2)、微程序控制机器
(3)、传统机械语言机械(4)、操作系统机器
A、
(2)(3)(4)
(1)B、
(2)(4)(3)
(1)
C、(3)
(2)
(1)(4)D、
(1)
(2)(3)(4)
【答案】A
★★
1八、在计算机系统设计的方式中,“由中间开始”设计方式通常把“中间”取在()。
A、传统机械级和操作系统机械级之间
B、操作系统机械级和汇编语言机械级之间
C、传统机械级和汇编语言机械级之间
D、微程序控制机械级和传统机械级之间
【答案】A
★
1九、在系列机的软件兼容中,按某档机械编制的程序,不加修改就可以运行于比它高级的机械,叫做()。
A、向下兼容B、向上兼容
C、向前兼容D、向后兼容
【答案】B
★★
20、什么是访问的局部性原理,有哪两种,别离是什么?
【答案】局部性原理是指按照程序的最近情况,可以较精准地预测出最近地未来将要用到哪些指令和数据。
局部性分为时间上的局部性和空间上的局部性。
时间上的局部性是指最近访问过的代码是不久将被访问的代码。
空间上的局部性是指那些地址上相临近的代码可能会被一路访问。
★
2一、用于科学计算的计算机中,标志系统性能的主要参数是()。
A、提高CPU主频B、扩大主存容量
C、采用非冯.诺依曼结构D、采用并行处理技术
【答案】A
★
2二、下列体系结构中,最适合多个任务并行执行的体系结构是()。
A、流水线向量机结构B、堆栈处理机结构
C、共享存储多处置机结构D、分布存储多计算机结构
【答案】C
★★
23、对计算机系统结构依照Handler法分类,PEPE表示为t(ILLIACⅣ)=(1,64,64),则在Flynn分类法中,它属于()。
A、SISDB、SIMD
C、MISDD、MIMD
【答案】B
★
24、在冯·诺依曼计算机特征中,机械以()为中心。
A、存储器B、输入输出设备
C、运算器D、控制器
【答案】C
★
2五、若是有一个经解释实现地计算机,可以按功能划分为3级。
每一级为了执行一条指令需要下一级的M条指令解释。
若执行第一级的一条指令需要Kns的时间,那么执行第三级的一条指令需要用()ns时间。
A、KMB、K
M
C、KM
D、KM
【答案】D
★
2六、从用户的观点看,评价计算机系统性能的综合参数是()。
A、指令系统B、吞吐率
C、主存容量D、主频率
【答案】B
★
27、主频为400MHz的微处置机,平均每条指令的执行时间为两个机械周期,每一个机械周期由两个时钟脉冲组成,则当存储器为“零等待”时,机械运行速度为()MIPS。
A、100B、200
C、300D、400
【答案】A
★★
2八、为使虚存系统有效地发挥其预期的作用,所运行的程序应具有的特性是()。
A、该程序不该含有过量的I/O操作
B、该程序的大小不该该超过实际的内存容量
C、该程序应具有较好的局部性
D、该程序的指令相关不该过量
【答案】C
★★
2九、下列哪个方式不能提高并行性?
A、时间重叠B、资源重复
C、资源共享D、分布存储
【答案】D
★
30、在采用基准测试程序来测试评价机械的性能时,下列方式依照评价准确性递增的顺序排列是()。
(1)、实际的应用程序方式
(2)、核心程序方式
(3)、玩具基准测试程序(小测试程序)
(4)、综合基准测试程序
A、
(1)
(2)(3)(4)B、
(2)(3)(4)
(1)
C、(3)(4)
(1)
(2)D、(4)(3)
(2)
(1)
【答案】D
★
3一、每秒百万指令条数为()。
A、ICB、CPI
C、MIPSD、MFLOPS
【答案】C
★
3二、软件和硬件在()意义上是等效的。
A、系统结构B、功能
C、性能D、价格
【答案】B
★★
33、机械工作状态的概念和切换对()来讲是透明的。
A、操作系统操作员B、机器语言程序员
C、逻辑设计员D、硬件维护员设计员
【答案】A
★★★
34、某台计算机只有Load/Store指令能对存储器进行读/写操作,其它指令只对寄放器进行操作。
按照程序跟踪实验结果,已知每种指令所占的比例及CPI数如下:
指令类型指令所占比例CPI
算逻指令43%1
Load指令21%2
Store指令12%2
转移指令24%2
(1)求上述情况下的平均CPI。
(2)假设程序由M条指令组成。
算逻运算中25%的指令的两个操作数中的一个已在寄放器中,另一个必需在算逻指令执行前用Load指令从存储器取到寄放器。
因此有人建议增加另一种算逻指令,其特点是一个操作数取自寄放器,另一个操作数取自存储器,即寄放器−存储器类型,假设这种指令的CPI等于2。
同时,转移指令的CPI变成3。
求新指令系统的平均CPI。
【答案】
(1)CPI旧=×1+×2+×2+×2)=
(2)原算逻指令中的25%变成了寄放器−存储器型指令,所以算逻指令(寄放器−寄放器型)少了×M条,Load指令少了×M条,而×M条的新指令为寄放器−存储器型指令。
指令总数少了×43%)M条。
设执行算逻指令(寄放器−寄放器型)、Load指令、算逻指令(寄放器−存储器型)、Store指令和转移指令的周期总数别离为C1,C2,C3,C4,C5,所以:
C1=×)M×1=
C2=×)M×2=
C3=×M×2=
C4=×2=
C5=×3M=
新指令总数N=(1-×)M=
CPI新=(C1+C2+C3+C4+C5)/N==
★★★
35假设一台计算机可用两种运行方式,即常规方式与提高方式执行一个程序,其概率散布别离为{
,1-
}。
(a)假设
在a与b之间变更,0
a
1,试用调和均值概念推导平均加速比因子表达式。
(
n为性能提高的倍数)
试计算a
0和b
1时的加速比因子。
【答案】
(a)
n为性能提高的倍数
(b)
★★
3六、假设在一台40MHZ处置机上运行200,000条指令的目标代码,程序主要由四种指令组成。
按照程序跟踪实验结果,已知指令混合比和每种指令所需的指令数如下:
指令类型
CPI
指令混合比
算术和逻辑
1
60%
高速缓存命中的加载/存储
2
18%
转移
4
12%
高速存储缺失的存储器访问
8
10%
计算在单处置机上用上述跟踪数据运行程序的平均CPI。
按照所得的CPI,计算相应的MIPS速度。
【答案】
平均
=
★★
37、假设高速缓存Cache工作速度为主存的5倍,且Cache被访问命中的概率为90%,则采用Cache后,能使整个存储系统取得多高的加速比?
【答案】
Speedup=
=
★★★
3八、假定一个计算机设计者,对高级语言结构的利用进行研究,结果表明进程挪用是最常常利用的操作之一。
该设计者已假想了一个优化的设计方案,它能减少进程挪用和返回所需的取存指令次数。
为了进行验证,对未加优化和已优化的方案进行实验测试,假定所利用的是相同的优化编译器。
实验测得结果如下:
(1)为优化方案的时钟周期比优化的快5%
(2)未优化方案中的取存指令数占总指令数的30%
(3)优化方案中的取存指令数比未优化的少1/3,对于其他指令,两种方案的动态执行数没有转变
(4)所有指令,包括取存,均只需1个时钟周期
要求定量的判断,哪个设计方案使计算机工作的速度更快。
【答案】
由
(1)可知,未优化方案的时钟周期t=,t1为优化后的时钟周期
由
(2)(3)可以取得优化方案的指令条数
由(4)可知,两种方案的CPI都是1,又因为
所以,优化后的方案工作速度更快。
★★★
3九、假定要将某一执行部件改良后速度提高10倍,改良后被改良部件执行时间占系统总运行时间的50%。
问改良后,取得的加速比
是多少?
【答案】
假设系统在改良前后的执行时间别离为
和
,则
(1)
由
(1)式,得
(2)
由题意
(3)
(2)-(3),得
(4)
(5)
由(4)(5)可得
★★★
40、某工作站采历时钟频率f为15MHz,CPI为的处置机来执行一个已知混合程序。
假定每次存储器存取为1个周期延迟,问:
(1)此计算机的处置速度为多少MIPS?
(2)假定将处置机的时钟频率f提高到30MHz,但存储器子系统的速度不变。
这样,每次存储器存取需要2个时钟周期,若是30%指令每条只需要一次存贮存取,而另外5%每条需要2次存贮存取,还假定已知混合程序的指令数不变,并与原工作站兼容,试求改良后的处置机性能。
【答案】
(1)MIPS=f/(CPI*10
)=15*10
/*10
)=10MIPS
(2)如题所述,30%的指令需要一次存贮存取,则这些指令在处置器提高时钟频率以后需要增加1个时钟周期;一样,另外5%的指令需要增加2个时钟周期。
=(改良前执行混合程序所需的时钟周期数+30%*1*指令数+5%*2*指令数)/指令数
=
+30%*1+5%*2=++=
处置速度MIPS=
假设混合程序的指令数为IC,则有
可见,改良后工作站性能提高了。
★★★
4一、1台向量计算机1次只能以下述两种执行方式中的一种运行:
一种是向量方式,执行速度
为10MFLOPS;另一种是标量方式,执行速度
为1MFLOPS。
设α是该计算机的典型程序代码中可向量化部份的百分比。
(a)推导出该计算机平均执行速度R的公式
(b)要使R达到,问向量化百分比α应多大?
(c)假设
=1MFLOPS,α=,要使R达到2MFLOPS,问
应为多大?
【答案】
(a)
(b)R=,则
,α=
(c)
,
则
MFLOPS
★★★
4二、假设咱们有一个需要运行100秒的标准程序,其中有90秒是CPU时间而剩下的是I/O占用的时间。
若是在以后的五年中,CPU速度每一年提高50%且I/O时间维持不变,那么五年后咱们的程序要花费多少时间?
【答案】
花费的时间=CPU时间+I/O时间
100=90+I/O时间
I/O时间=10秒
下表计算新的处置器时间和剩下的运行时间:
第N年以后
CPU时间
I/O时间
耗费的时间
%I/O时间
0
90秒
10秒
100秒
10%
1
90/=60秒
10秒
70秒
14%
2
60/=40秒
10秒
50秒
20%
3
40/=27秒
10秒
37秒
27%
4
27/=18秒
10秒
28秒
36%
5
18/=12秒
10秒
22秒
45%
★★★
43、计算机系统有三个部件可以改良,这三个部件的加速比如下:
部件1加速比S1=30;部件2加速比S2=20;部件3加速比S3=10;
(1)若是部件1和部件2的可改良比例为30%,那么当部件3的可改良比例为多少时,系统的加速比才可以达到10?
(2)若是三个部件的可改良比例为30%、30%和20%,三个部件同时改良,那么系统中不可加速部份的执行时间在总执行时间中占的比例是多少?
【答案】
(1)多个部件可改良情况下Amdahl定理的扩展
其中,Fi为可加速部件I在未优化系统中所占的比例,Si是部件I的加速比。
∴F3==36%
(2)
★★★
44、假设咱们考虑条件分支指令的两种不同设计方式如下:
CPU1:
通过比较指令设置条件码,然后测试条件码进行分支。
CPU2:
在分支指令中包括比较进程。
在两种CPU中,条件分支指令都占用2个时钟周期而所有其他指令占用1个时钟周期,对于CPU1,执行的指令中分支指令占20%;由于每一个分支指令之前都需要有比较指令,因此比较指令也占20%。
由于CPU1在分支时不需要比较,因此假设它的时钟周期时间比CPU2快倍。
哪个CPU更快?
若是CPU1的时钟周期时间仅仅比CPU2快倍,哪个CPU更快?
【答案】
对于CPU1,占用2个时钟周期的分支指令占总指令的20%,剩下的指令占用1个时钟周期,所以CPI1=*2+*1=
总CPU时间T1=IC**时钟周期1
按照假设,有:
时钟周期2=*时钟周期1
在CPU2中,没有独立的比较指令,所以CPU2的程序量为CPU1的80%,分支指令的比例为:
20%/80%=25%
这些分支指令占用2个时钟周期,而剩下的75%的指令占用1个时钟周期,因此:
CPI2=*2+*1=
IC2=*IC1
总CPU时间T2=IC2*CPI2*时钟周期2=*IC1***时钟周期1
=*IC1*时钟周期1
在这些假设之下,虽然CPU2执行指令条数较少,CPU1因为有着更短的时钟周期,所以比CPU2快。
若是CPU1的时钟周期仅仅比CPU2快倍,则
时钟周期2=*时钟周期1
T2=*IC1*时钟周期1
因此,CPU2由于只能更少的指令,比CPU1运行更快。
★★
4五、从机械(汇编)语言程序员看,以下哪些是透明的?
指令地址寄放器;指令缓冲器;时标发生器;条件码寄放器;乘法器;主存地址寄放器;磁盘外设;先行进位链;移位器;通用寄放器;中断字寄放器
【答案】
透明的有:
指令缓冲器、时标发生器、乘法器、磁盘外设、先行进位链、移位器
★★
4六、实现软件移植的主要途径有哪些?
它们存在什么问题?
适用于什么场合?
【答案】
(1)采用系列机方式,只能在具有相同系统结构的各类机械之间实现软件移植,一般是一个厂家生产的机械。
(2)采用模拟与仿真的方式,可在不同系统结构的机械之间彼此移植软件,对于利用频率较高的指令,尽可能用仿真方式以提高运算速度,而对于利用频率低且难于用仿真实现的指令则用模拟方式来实现。
(3)采用统一的高级语言方式,可以解决结构相同或完全不同的各类机械上的软件移植,可是,要统一高级语言,语言的标准化很重要,但难以在短时间内解决。
★★
47、在SUNSPARC2工作站上,对SPECBenchmark进行测试,取得了如下所示的速度值,求出其算术、几何及调和平均值(以MFLOPS表示)
程序名
速率(MFLOPS)
GCC
Espress0
Spice2g6
DODUC
NASA7
Li
Eqntott
Matrix300
FPPPP
TOMCATV
【答案】
算术平均值
几何平均值
=
调和平均值
★★
4八、某计算机系统采用浮点运算部件后,使浮点运算速度提高到原来的20倍,而系统运行一程序的整体性能提高到原来的5倍,试计算该程序中浮点操作所占的比例。
【答案】设该程序中浮点操作所占的比例是x
有:
∴x==%
★★★
4九、假定咱们有一台计算机,若是所有的cache访问都命中的话,它的CPI是。
唯一的数据访问指令是store和load,它们占指令总数的40%,不命中损失是25个时钟周期,不命中率是2%。
若是所有的指令访问cache都命中的话,那么机械的速度是存在cache不命中时的多少倍?
【答案】
首先计算所有cache访问都命中时计算机的性能:
CPU执行时间=(CPU时钟周期+内存停机周期)×时钟周期时长
=(IC×CPI+0)×时钟周期时长
=IC××时钟周期时长
此刻计算考虑cache不命中在内的真实计算机性能,咱们先计算内存停机周期:
内存停机周期=IC×每条指令访问内存的次数×不命中率×不命中损失
=IC×(1+)××25
=IC×
其中(1+)代表每条指令访问一次内存,而占指令总数40%的store和load访问两次内存,所以平均每条指令访问访问(1+次内存。
这样总的性能是:
CPU执行时间=(IC×+IC×)×时钟周期时长
=IC××时钟周期时长
性能提高的比是执行时间之比的倒数:
cache不命中考虑在内的CPU执行时间/cache访问全数命中的CPU执行时间
=×IC×时钟周期时长/×IC×时钟周期时长
=
cache访问全数命中时的速度是有cache不命中机会械速度的倍。
★★★
50、下面由六条指令组成的代码段需运行64次才能计算向量算术表达式:
D(I)=A(I)+B(I)xC(I),其中0≤I≤63。
LoadR1,B(I)/R1←Memory(α+I)/
LoadR2,C(I)/R2←Memory(β+I)/
MultiplyR1,R2/R1←(R1)x(R2)/
LoadR3,A(I)/R3←Memory(γ+I)/
AddR3,R1/R3←(R3)+(R1)/
StoreD(I),R3/Memory(θ+I)←(R3)/
这里R1、R2和R3为CPU的寄放器,(R1)是R1的内容,α、β、γ和θ别离是数组B(I)、C(I)、A(I)和D(I)的起始存储地址。
假设在一台SIMD机中,不论单处置机仍是单个PE,每次取数或存数需4个时钟周期,加法需2个周期,乘法需8个周期。
计算在一台SISD单处置机计算机上依次重复执行上述代码段64次所需的CPU周期数,忽略所有其它延迟时间。
假设用一台有64个PE的SIMD机,以6条同步向量指令对64组向量数据执行上述向量操作,所用的时钟速度与前面一样。
计算SIMD机的总执行时间,忽略指令广播及其它延迟。
SIMD计算机与SISD计算机相较,其加速比为多少?
【答案】
该程序段中每条指令所需的周期数如下所示:
LoadR1,B(I)4
LoadR2,C(I)4
MultiplyR1,R28
LoadR3,A(I)4
AddR3,R12
StoreD(I),R34
运行一遍这六条指令,共需要(忽略其它延迟时间)4+4+8+4+2+4=26个周期。
在一台SISD单处置计算机上依次重复执行上述代码段64遍所需的CPU周期数为26×64=1664
在一台有64个PE的SIMD机,以6条同步向量指令直接对64组向量数据执行上述向量操作,那么只需要执行一遍,所需CPU周期数为26。
SIMD计算机和SISD计算机相较,加速比为1664/26=64。