ImageVerifierCode 换一换
格式:DOCX , 页数:14 ,大小:215.67KB ,
资源ID:13477991      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/13477991.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(微机原理与接口技术课程设计计算机并行处理机制的研究Word文件下载.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

微机原理与接口技术课程设计计算机并行处理机制的研究Word文件下载.docx

1、3.2超标量结构 43. 3超流水线结构 53. 4 VLIW (超长指令字) 6四、 计算机间的并行处理机制 84.1对称多处理机 SMP 84. 1. 1 SMP 的结构和特性 84. 1.2 多处理机中的扩展存储层次结构 94. 2大规模并行处理机 MPP 104. 2. 1 MPP 的结构和特性 104.2. 2 当代MPF系统的公共体系结构 114. 3机群 124.3. 1 机群的概念和特性 124. 3. 2 机群的分类 134. 3. 3 机群的体系结构 13五、 总结与展望 16六、 参考资料 16 一、概述计算机从1946年的ENIAC机问世以来,至今已经历了五次更新换代。

2、每一 代计算机的性能都成数量级倍的提高,计算机的体积、重量、价格、稳定性、可 靠性、可维护性及功能的多样性等均有了显著的改善。 人们通常以电子管、晶体 管、中小规模集成电路、大规模和超大规模集成电路等器件的变革作为计算机换 代的标志。但是,计算机系统实际上是器件、硬件、软件、算法、语言、系统结 构以及通讯技术等的综合,所以计算机的换代也反映在上述各方面的巨大变革 上。促使计算机迅速发展和系统性能极大提高的因素是多方面的,其中,器件技 术尤其是微电子技术的迅速发展无疑是最为关键的因素, 它是计算机得以迅速发展的物质基础。然而,应当看到,如果不能最合理地利用这些新器件、新设备, 最大限度地发挥出它

3、们的内在潜力,设计和构成综合性能指标最佳的计算机系 统,只靠器件技术的变革是不行的,还需要硬件、软件、算法、语言、系统结构、 通讯技术等多方面的发展变革才行。在特定的时期里,器件的发展变化会因物理、工艺、价格等条件限制而有一 定限度。在同一种器件技术水平上,进一步提高计算机系统性能的有效途径就是 在系统结构上使用并行处理技术,挖掘出系统固有的并行性潜力,提高其并行性 操作的程度。并行性在不同的处理级别中可表现为多种形式,如先行方式、流水方式、向 量化、并发行、同时性、数据并行性、划分、交叉、重叠、多重性、重复、时间 共享、空间共享、多任务处理、多道程序、多线程方式和分布式计算等。二、并行的概念

4、2.1并行性只要在同一时刻或是同一时间间隔内完成两种或两种以上性质相同或不同 的工作,它们在时间上相互重叠,都体现了并行性。也就是说,并行性包括同时 性和并发性两重含义。同时性(simultaneity )指的是两个或多个时间在同一时 刻发生,并发性(concurrency)指的是两个或多个事件在同一时间间隔内发生。2.2并行等级的划分并行性可以划分为不同的等级,从不同的角度出发,等级的划分方法也不一 样。(1)从计算机系统内部执行程序的角度来划分指令内部 一条指令内部各种微操作之间的并行指令之间 多条指令在某一时刻或同一时间间隔内并行执行任务或进程之间一一多个任务或程序段之间的并行执行作业或

5、程序之间一一多个作业或多道程序之间的并行执行(2)从计算机系统中处理数据的并行性角度来看字串位串一一同时只对一个字的一位进行处理, 通常指传统的串 行单处理机,没有并行性字串位并一一同时对一个字的全部位进行并行处理, 通常指传统 的并行单处理机,开始出现并行性字并位串一一同时对许多字的同一位进行处理, 开始进入并行处 理领域字并位并一一同时对许多字的全部或部分位组进行处理。(3)从计算机信息加工的各个步骤和阶段来看存储器操作并行一一可以采用单体多字、多体单字或多体多字方 式在一个存储周期内访问多个字,进而采用按内容访问方式在一 个存储周期内用位串字并获全并行方式实现对存储器中大量字 的高速并行

6、比较、检索、更新、变换等操作。典型的例子就是并 行存储器系统和以相联存储器为核心构成的相联处理机。处理机操作步骤并行一一处理机操作步骤可以指一条指令的取 指、分析、执行等操作步骤,也可指如浮点加法的求阶差、对阶、 尾加、舍入、规格化等具体操作的执行步骤。操作步骤并行就是 将操作步骤或具体操作的执行步骤在时间上重叠流水地进行。 典型的例子就是流水线处理机。处理机操作并行一一为支持向量、 数组运算,可以通过重复设置 大量处理单元,让它们在同一控制器控制下按照同一条指令的要 求对多个数据组同时操作。典型的例子就是并行处理机。指令、任务、作业并行 这是较高级的并行,虽然它也可包含 如操作、操作步骤等较

7、低等级的并行,但原则上与操作级并行是 不同的。指令级以上的并行是多个处理机同时对多条指令及有关 的多数据组进行处理,而操作级并行是对同一条指令及其有关的 多数据组进行处理。因此,前者构成的是多指令流多数据流(MIMD计算机,后者构成的则是单指令流多数据流(SIMD计 算机。典型的例子是多处理机。2.3实现并行处理的技术途径实现并行处理的技术途径是各种各样的,其中主要有 时间重叠、资源重复和 资源共享等方法。时间重叠 在并行性概念中引入时间因素,使多个处理过程在时间上错开, 轮流重叠地使用同一套硬件设备的不同部件, 以加快硬件周转而赢得速度。最典型的例子就是流水线工作方式。时间重叠原则上不需要重

8、复增加硬件设备就可提 高系统的性能。资源重复 在并行性概念中引入空间因素,通过重复设置硬件资源,如处理机或外围设备等,来达到大幅度提高可靠性和处理速度的目的。资源共享 让多个用户按一定时间间隔轮流使用同一套资源, 以提高系统的整体性能。三、计算机内部并行处理机制RISC处理机内部可以采用如下技术来增加其并行性:(1) 哈佛结构:即设计分开的指令 cache和数据cache,可以并行工作。(2) 多端口的寄存器堆。如果一个寄存器堆有两个源操作数端口和一个 目的操作数端口,那么两个源操作数可以同时取出,还可以写入或 取出另一条指令的目的操作数。(3) 流水线。(4) 编译优化技术。充分利用硬件资源

9、、优化分配寄存器。(5) 超标量(super scalar )结构。即设置多个执行部件。(6) 超流水线(superpipeline )结构。(7) VLIW( Very Lo ng In structio n Word )指令级并行处理(ILPP,Instruction Level Parallel Processing )是实行低层机器操作的并行执行,如存、取、整数加和浮点乘等。其中的流水线、超长指令字 VLIW超标量结构等技术都属于处理机指令级并行 技术,下面将分别对其加以介绍。3.1流水线一条典型指令的执行基本上由取指、译码、执行和写回 4个阶段组成。由于不同阶段的执行由不同的功能部件

10、来进行, 因此可以使得指令的执行在时间上重迭起来。流水线的基本思想就是重迭连续指令的执行以节省执行时间和增加吞吐 率。一般流水线结构如下图所示:IPC (Instruction Per Cycle ) =1,但由于数据相关、转移相关和资源相关使得IPC1。nIFIDEXWRn+1n+23.2超标量结构主要特点:(1) 配置多个处理部件,采用多条流水线并行处理;(2) 能同时对若干条指令进行译码,将可并行执行的指令送往不同的执行 部件,从而达到每个周期启动多条指令的目的。(3) 在程序运行期间由硬件完成指令调度。下图中,一个周期内同时发出三条指令,有多个执行部件,三条指令发到三 个独立的执行部件

11、去分别执行。超标量的典型结构:指令的执行部件:存储器操作部件:执行Load、Store指令ALU整数运算转移控制部件:执行转移指令状态记录部件(调度部件):进行流水动态调度。依靠硬件在程序运行过程中对可能出现的相关情况 加以检测,从而保证流水线中的各个功能部件能最大限度的重叠工作。它对流水线中的各个功能部件的工作状态、进入流水线中的各条指令的 工作状态、它们所使用的源寄存器和目的寄存器情况等进行集中的统一 记录和调度。在译码阶段,状态记录部件根据所记录的状态决定是否将译码后的指令 发送给有关功能部件进行处理。状态记录部件主要检查:该指令要使用的功能部件是否已被流水线中的其它指令占用(资源冲 突

12、);该指令的源操作数寄存器是否为其它指令的目的寄存器,或者它所要写 入的目的寄存器又正好是前面其它指令所要读出的操作数,或是要写入 的目的寄存器。即检查是否存在 RAW WAR WAV的数据相关。3.3超流水线结构下图中,一个流水段(一个周期)分成三个子段,每个子段取出的仍只有一 条指令,但总体来看,一个周期内取出了三条指令,执行部件可以一套,每个部 件在一个子段时间内完成。超标量结构、超流水线结构一般采用指令窗方法,把一段指令取到窗口中, 判断这段指令能否并行执行。超标量和超流水线的比较超标量:工作部件多,晶体管数目也多, 每个部件的工作速度相对的可以低一些。以空间换取时间。超流水线:工作部

13、件少,晶体管数目少了,每一个部件必须在一个 子周期内执行,工作速度较高。以时间换取了空间。3. 4 VLIW (超长指令字)1983年,Yale大学Fisher教授首先提出。一条长指令来实现多个操作的并行执行,以减少对存储器的访问,这种长指 令往往达上百位,甚至上千位。如下面的图。每拍启动一条长指令,执行 3个操作,相当于3条指令,要求 并行度为3。单一的控制流。只有一个控制器,每个周期启动一条长指令。超长指令字被分成多个控制字段,每个字段直接独立的控制每个功能部 件。含有大量的数据通路和功能部件,由于编译器在编译时间已经考虑可能 出现的数据相关和资源相关,故控制硬件比较简单。在编译阶段完成超

14、长指令中多个可并行执行操作的调度(超长指令字的 生成是由编译器完成)。VLIW机的结构框图RF (寄存器堆)四、计算机间的并行处理机制体系结构的并行性才是并行计算机真正的特点, 下面主要介绍当代流行的几种主要的并行体系结构:对称多处理机 SMP大规模并行处理机 MPP机群。4.1对称多处理机SMP4.1. 1 SMP 的结构和特性SMP机器结构图如下:SMPSMFP吉构具有以下特性:(1) 对称性 系统中任何处理机都可以对称地访问任何存储单元和 I/O设备,且具有相同的访存时间,所以也常叫均匀存储访问 UMA结构(2) 单一物理地址空间 所有处理器的存储单元按照单一地址空 间编址(3)高速缓存及其一致性 多极高速缓存可支持数据局部性,且其一致 性由硬件来实现(4)低通信延迟处理机间的通信用简单的读/写指令来完成正是这些特性使得对称处理机得到了广泛使用。例如,由于存在单一物理地

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1