ImageVerifierCode 换一换
格式:DOCX , 页数:16 ,大小:508.20KB ,
资源ID:14906129      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/14906129.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(计算机体系结构Word文档下载推荐.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

计算机体系结构Word文档下载推荐.docx

1、如果用硬件实现,则快100倍,CPU成本增加到5倍。问设计人员提出增加此功能就是否恰当?如恰当则此功能应该用软件实现还就是用硬件实现?设CPU成本占整机成本的1/3解: 首先来计算机在两种情况下提高的性能与成本性能比。 设: S为CPU未增加字符串功能时的CPU平均速度,Told为此时运行程序的时间,Tnew为增加字符串功能后程序运行的时间,则 Amdahl定律 (性能递减规则) 某部件应用越频繁,当提高该部件性能时,整机性能也提高的越多。但不管该部件性能提高多大,整机的性能加速不可能大于在原机器中除该部件外所有其它部件运行时间的百分比的倒数1/(1-F) 计算机性能的改善程度受其采用的快速部

2、件(被提高性能的部件)在原任务中使用所占的时间百分比的限制 采用新器件使某一功能性能提高10倍,但该功能的使用只占原程序运行时间的40%。请计算新计算机性能改善了多少? 高频事件高速处理(大概率事件优先的原则) 局部性原理 最重要的就是90/10局部性规则 时间局部性 空间局部性 适应计算机发展趋势 在指令系统中指令的确定就是属于计算机系统结构的,而指令操作的实现,如取指令、取操作数、运算、送结果等具体操作及排序方式就是属于计算机组成的,而实现这些指令功能的具体电路、器件的设计及装配技术就是计算机物理实现的 计算机的性能就是指在计算机上完成用户的应用任务所需的时间长短 响应(实耗)时间就是指计

3、算机系统完成某一任务(程序)所花费的时间 速度,即用响应时间的倒数 用速度来评价性能,我们称“高”为性能好;如果用响应时间来评价性能,我们称“短”为性能好 计算机整机性能分成两部分:一就是CPU执行程序的时间,二就是等待时间。提高计算机性能就就是提高CPU性能与减少等待时间。 CPU时间也包含两部分,即用户CPU时间(user CPU time)与系统CPU时间(system CPU time) CPUtime =整个程序的总时钟数时钟周期 每条指令的平均时钟周期数(Clock cycles Per Instruction),简称为CPI 指令数CPI代替总时钟数 设条件转移指令的实现有两种方

4、案可以选择。机器A:用两条指令完成。由比较指令建立条件码,再在转移指令中测试条件码。机器B:只用一条指令。比较与转移一起执行。对于这两种机器来说,条件转移指令用2个时钟,所有其它指令花费一个时钟。在机器A上有20%的执行指令就是条件转移指令,因此每个转移都需要比较,有20%就是比较指令。由于机器A在转移指令中没有比较功能,这样时钟频率比机器B快25%,问哪个机器快?忽略所有等待及系统时间,我们可以用CPU时间来比较机器的性能。 机器A: CPIA20%2 80%11、2 CPUtimeA指令数A1、2时钟周期A 1、2IA A 无比较指令,则指令数要比机器A少20%,只有机器A指令数的80%,

5、即指令数B=80%指令数A。在机器A的指令中有20%指令就是转移指令,它占机器B的指令数的百分比就是20%80%=25%。因此机器B的CPIB25%275%11、25。同时A机器时钟比B机器快25%,故时钟周期B(1+25%)A1、25ACPUtimeB指令数BCPIB时钟周期B 0、80IA1、251、25A 1、25IAA 从计算中我们瞧出机器A虽然比机器B多执行了20%的指令,但由于它的时钟周期短,同时CPI也小,反而比机器B快 某台计算机的指令集原来进行存储器访问的指令只有Load/Store,其它指令只能在寄存器之间操作。这种机器我们称为Load/Store型机器。现测得这台Load

6、/Store计算机指令的使用频率与时钟数如表1-5所示。在ALU操作中,有25%的操作数就是由Load指令取得。现在ALU操作中使其有一个操作数可以在存储器内,即register-memory指令,这条指令执行的时钟数就是2。假设扩展指令集后使转移指令增加1个时钟数,但不影响时钟周期,问这样改变后计算机性能就是否提高? 对于例1-6的计算机,我们采用优化编译来改善其性能。编译可以减少50%的ALU指令,但它不能减少Load,Store与Branch指令,忽略系统因素,并假设时钟周期就是20ns(50MHz频率),请问优化编译后的MIPS与没有优化编译时的MIPS各为多少?MIPS的变化与执行时

7、间的变化就是否一致? 基准程序的一般设计原则 具有代表性 不能对基准程序进行优化。 复现性。 可移植性。 紧凑性。 成本-效率要高 性能报告相关参数的计算 哈夫曼压缩的基本思想就是:出现频率最大的事件用最少的位(或最短的时间)来表示(或处理),而频率较小的事件用较多的位(较长的时间)来表示(或处理),从而达到平均位数(或时间)缩短的目的 操作码的信息源熵(entropy 系统包含的平均信息量)公式 H=pilog2pi式中pi为事件出现的频率Chapter 2 计算机的三种机器结构 堆栈 优点:赋值表达式简单,指令长度较短,代码密度高; 缺点:不能随机访问存储器,代码效率低。 累加器机器内部状

8、态最少,指令长度最短(9bytes);仅一个暂存器,与存储器的通信频繁。 通用寄存器最一般的指令模型,第一类,寄存器利用率最高,代码长度MAX15字节。第二类,与累加器形式相似,暂存器个数多;寄存器要显示说明,导致指令字较长。 在ALU指令中不对内存进行操作的计算机称为载入-存储(Load-Store)或者寄存器-寄存器(register-register)机器。ALU指令中有一个内存操作数的指令称为寄存器-存储器(register- memory)指令。有多个内存操作数的指令称为存储器-存储器(memory-memory)指令。 我们就是在确定了计算机应有的功能后,并确定了哪些功能就是由硬件

9、来实现(直接提供指令),哪些功能就是由软件实现(由基本指令组合实现)后,再来进行指令集的设计。 最常用的指令操作:存储器访问(memory references)、算术逻辑单元(ALU operation)操作与转移指令(branch)操作三类。 控制操作、算术操作与数据传输三大类指令就是最常用的,可以认为也就是各种计算机必不可少的指令。 假定反向条件转移指令90%就是成功的,用表2-4平均数计算正向条件转移的成功率。 正向条件转移大部分就是不成功的,它满足条件的概率较低 在字单元地址内有两种字节排列次序:第一种为低位收尾(little endian),其字节次序就是低字节在最低位的排列;第二

10、种为高位收尾(big endian),其字节次序就是高字节在最低位的排列 假设访问的数据字节数就是S,而访问的字节地址就是A,那么A mod S =0,则称为地址A所访问的S字节就是对齐的。 只要就是跨CPU字地址的寄存器总线访问一定要两个总线访问周期才能完成 寄存器分配策略1. 假设计算机具有无穷多个寄存器,根据需要分配寄存器的变量个数,以出现时间先后为序建立一个寄存器变量图。图中每个变量用小圆圈表示,圈内标上变量名,每个变量称为一个节点。2. 用弧连接各相邻节点。连接的原则就是可能同时出现的变量节点作为相邻节点,用弧连接起来。从变量角度来讲,线段连接的就是时空上重叠出现的变量生存范围。此时

11、称整个图为相干图。3. 编译程序给相干图着色。着色的颜色数应小于等于能分配给变量的寄存器数,着色的条件就是相邻节点不可以用同样的颜色。这种限制使两个同时出现的变量不会争用同一个寄存器。没有线段相连的节点,可以就是同一种颜色,即允许不重叠出现的变量使用同一个寄存器。着色后每一种颜色对应一个活动变量或一个寄存器。根据相干图分配物理寄存器。 RISC设计思想就是:指令集设计时根据Amdahl定律选择使用概率高的指令构成指令集,这些大概率指令一般就是简单指令,因此控制器可以设计的简单、高速,且占CPU集成电路芯片的面积少,空出较多的集成电路芯片面积用来增加寄存器数量。在编译的配合下减少访存次数,减少指

12、令间的各种相关与竞争,尽可能得到最佳指令序列,从而提高计算机系统的整体性能。 某应用程序,简单的基本指令占80%,而复杂指令占20%,在传统CISC计算机上运行,简单指令的CPI=4,复杂指令的CPI=8,而在RISC计算机上运行只有简单指令,其CPI=1,复杂指令用简单指令合成实现。假设平均每条复杂指令需14条基本指令组合,请比较个计算机系统运行该应用程序的性能。设CISC计算机的时钟周期为 TCISC,RISC计算机的时钟周期为TRISC,则: CISC计算机的平均 CPI=0、84+0、28=4、8RISC计算机的指令数增加为 IRISC=0、8ICISC+0、2ICISC14=3、6I

13、CISC因 CPUtime=ICPIT故 CPUtime-CISC=ICISC 4、8TCISC=4、8ICISCTCISC CPUtime-RISC=IRISC1TRISC=3、6ICISCTRISC 若TCISC=TRISC ,则RISC计算机比CISC计算机性能提高33%。实际上,减少TRISC比减少TCISC要来的容易。Chapter 3画图题 处理器可分为两部分 数据通路 控制器 一条指令的执行分为以下五个步骤: 1、 取指令(instruction fetch) 。 2、 指令译码/寄存器读出(instruction decode/register fetch)。 3、 执行/有效地址计算(execution/effective address)。 a、 访存指令(access instruction) b、 ALU指令(ALU instruction ) c、 无条件转移/条件转移指令(jump instruction / branch) 4、 存储器访问/完成转移(memory access/branch completion) b、 转移指令(branch instruction) 5、 写回(write-back)。Chapter 4计算题 简答题 流水线(

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1