CPU体系结构发展综述及其性能比较.docx

资源描述

CPU体系结构发展综述及其性能比较.docx

《CPU体系结构发展综述及其性能比较.docx》由会员分享，可在线阅读，更多相关《CPU体系结构发展综述及其性能比较.docx（10页珍藏版）》请在冰豆网上搜索。

CPU体系结构发展综述及其性能比较.docx

CPU体系结构发展综述及其性能比较

一、分年代列出经典CPU产品

CPU从最初发展至今已经有20多年的历史了，这期间，按照其处理信息的字长，CPU可以分为4位微处理器、8位微处理器、16位微处理器、32位微处理器以及64位微处理器等等。

下面列出具体发展的经典CPU产品：

1、1971年

4004是英特尔公司推出的第一个用于计算机的4位处理器，它包含2300个晶体管，随后英特尔也推出了8008，由于运算性能很差，其市场反应十分不理想。

2、1974年

8008发展成8080,成为第二代处理器。

8080作为代替电子逻辑电路的器件被用于各种应用电路和设备中,如果没有处理器,这些应用就无法实现。

3、1978年

8086是Intel系列的16位微处理器，芯片上有4万个晶体管，采用HMOS工艺制造，用单一的+5V电源，时钟频率为4.77MHz~10MHz。

8086有16根数据线和20根地址线，它既能处理16位数据，也能处理8位数据。

可寻址的内存空间为1MB。

4、1979年

英特尔公司又开发出了8088。

8086和8088在芯片内部均采用16位数据传输，所以都称为16位微处理器，但8086每周期能传送或接收16位数据，而8088每周期只采用8位。

因为最初的大部分设备和芯片是8位的，而8088的外部8位数据传送、接收能与这些设备相兼容。

8088采用40针的DIP封装，工作频率为、或8MHz，微处理器集成了大约29000个晶体管。

5、1981年

IBM公司将8088芯片用于其研制的PC机中，从而开创了全新的微机时代。

也正是从8088开始，个人电脑（PC）的概念开始在全世界范围内发展起来。

从8088应用到IBMPC机上开始,个人电脑真正走进了人们的工作和生活之中，它也标志着一个新时代的开始。

6、1982年

80286该芯片比8086和8088都有了飞跃的发展，虽然它仍旧是16位结构，但是在CPU的内部含有万个晶体管，时钟频率由最初的6MHz逐步提高到20MHz。

其内部和外部数据总线皆为16位，地址总线24位，可寻址16MB内存。

80286兼容了8086的所有功能，并且是8086的向上兼容的微处理器，使8086的汇编语言程序可以不做任何修改地在80286上运行。

同时80286的推出也是实模式和保护模式CPU的分水岭。

7、1985年

i386即80386：

它是80X86系列中的第一种32位微处理器，而且制造工艺也有了很大的进步，与80286相比，80386内部内含万个晶体管，时钟频率为，后提高到20MHz，25MHz，33MHz。

80386的内部和外部数据总线都是32位，地址总线也是32位，可寻址高达4GB内存。

它除具有实模式和保护模式外，还增加了一种叫虚拟86的工作方式，可以通过同时模拟多个8086处理器来提供多任务能力。

它也首次实现允许Unix系统运行。

8、1989年

80486是Intel公司推出的32位处理器采用了1mm制造工艺，内部集成了120万个晶体管。

内外部数据总线是32位，地址总线为32位，可寻址4GB的存储空间，支持虚拟存储管理技术，虚拟存储空间为64TB。

片内集成有浮点运算部件和8KB的cache（L1cache），同时也支持外部cache（L2cache）。

整数处理部件采用精简指令集RISC结构，提高了指令的执行速度。

此外，80486微处理器还引进了时钟倍频技术和新的内部总线结构，从而使主频可以超出100MHz。

9、1993年

Pentium是英特尔的第五代x86架构之微处理器，它是486产品线的后代。

Pentium最初级的CPU是Pentium60和Pentium66，分别工作在与系统总线频率相同的60MHz和66MHz两种频率下，没有我们现在所说的倍频设置。

令英特尔最为尴尬的是最初Pentium60和Pentium66的一部分产品还有浮点运算错误，因此它并没有受到人们的欢迎，英特尔还因此回收了大批CPU。

10、1995年

PentiumPro是高端CPU的代名词，PentiumPro所表现的性能在当时让很多人大吃一惊，但是PentiumPro是32位数据结构设计的CPU，所以PentiumPro运行16位应用程序时性能一般，但仍然是32位的赢家。

PentiumPro（高能奔腾，686级的CPU）的核心架构代号为P6（也是未来PⅡ、PⅢ所使用的核心架构），这是第一代产品，二级Cache有256KB或512KB，最大有1MB的二级Cache。

工作频率有:

133/66MHz（工程样品），150/60MHz、166/66MHz、180/60MHz、200/66MHz。

11、1997年

多能奔腾（PentiumMMX）的正式名称就是“带有MMX技术的Pentium”，是在1996年底发布的。

从多能奔腾开始，英特尔就对其生产的CPU开始锁倍频了，但是MMX的CPU超外频能力特别强，而且还可以通过提高核心电压来超倍频，所以那个时候超频是一个很时髦的行动。

超频这个词语也是从那个时候开始流行的。

12、1997年

PentiumII：

奔腾II〔PentiumII〕为英特尔推出的微处理器。

它基于PentiumPro使用的P6架构，但加强了16位元的效能，以及加入MMX指令集。

13、1999年

PentiumIII是英特尔的x86（更准确地说是i686）架构之微处理器。

刚推出的版本与早期的PentiumII非常相似，最值得注意的不同是SSE指令的扩充，以及在每个芯片制造的过程加入了有争议的序号。

与PentiumII相同，也有低阶的Celeron版本和高阶的Xeon版本。

PentiumIII最后被Pentium4所取代，PentiumIII的改进设计就是现在的PentiumM

14、1999年

AMDK7标志着AMD的崛起，Athlon（阿斯龙，也叫速龙）那不输于同频奔三多少的性能，比奔三低很多的价格，超频能力也不差。

还有低端的毒龙出现，抢占了低端赛扬的大半市场。

当时K7系列强劲的性能，强悍的超频能力，比如说不锁倍频的毒龙600，画2B铅笔超频法，还有超高的发热量。

15、2000年

雷鸟：

AMD在这时正是有了比肩INTER奔腾性能的桌面级CPU，但性能和兼容性，稳定性低下的KT133平台实在跟不上雷鸟的脚步了。

雷鸟拥有1GHZ的频率，也是第一个，之后有有了1.1,的超高频率。

16、2001年

Pentium4：

Pentium是Intel生产的第7代x86微处理器，并且是继1995年出品的PentiumPro之后的第一款重新设计过的处理器，这一新的架构称做NetBurst。

首款产品代码为：

Willamette，拥有左右的内核时钟，并使用Socket423脚位架构。

不同于PentiumII、PentiumIII和各种Celeron处理器，因为是全新设计的产品，所以与PentiumPro的关联很小。

值得注意的是，Pentium4有着非常快速到400MHz的前端总线，之后更有提升到533MHz、800MHz。

它其实是一个为100MHz的四条并列总线（100Mhzx4并列），因此理论上它可以传送比一般总线多四倍的容量，所以号称有400MHz的速度。

AMDAthlon的前端总线则有266MHz的速度（133MHz双倍并列总线）。

17、2003年

Transmeta推出了代号为“Efficeon”的处理器。

该处理器含有一个由带引擎的软件层逻辑包围的硬件引擎。

此引擎是一个256位的VLIW（超长指令字）CPU，可以在每个同步脉冲周期内执行八条操作指令（Cursoe只能在每个同步脉冲周期内执行四条操作指令），而能耗同Cursoe相比却降低了47%。

不过，在移动领域，Transmeta不得不面对AMD和Intel两大强敌，慢慢开始力不从心，损失颇大。

2009年1月，Transmeta被Novafora收购。

18、2003年

AMD发布了Athlon64，首款针对主流市场的64-bit处理器。

由于当时Intel正忙于提速生产基于NetBurst核心的P4处理器，AMD趁机凭借着整合了内存控制器的Athlon64处理器一举拿下了性能王冠。

19、2004年

AMD推出了AMDSempron，中文官方名称为“闪龙”，用以取代Duron处理器及与英特尔公司的Celeron和CeleronD处理器竞争。

20、2005年

Intel推出了PentiumD。

这是英特尔公司的双核心处理器系列之一。

它把两颗Pentium4Prescott核心放在同一块芯片上，PentiumD965是Intel最快的处理器，主频到达了3.73GHz（可超频至4.26GHz）。

21、2005年

AMD推出了Athlon64X2。

这是AMD首款桌面级双核心处理器，采用Socket939、AM2插槽，首批产品基于90nm工艺，之后推出的代号为Brisbane的Athlon64X2基于65nm工艺。

Athlon64X2整合内存控制器，新增了SSE3指令集。

处理器内部两颗核心可以通过SystemRequestQueue相连。

而IntelPentiumD双核心之间需要通过FSB相连，需要绕过北桥。

也就是说，PentiumD核心间的连接将会增加FSB的负担，降低处理器的性能。

22、2006年

Intel推出了Core2。

这是Intel的第8代X86架构微处理器，采用全新的Core微架构，取代自2000年起开始被Intel广泛采用的NetBurst架构。

首款Core2Duo处理器内置亿晶体管，基于65nm工艺，内建2MBofL2高速缓存，前段总线为1,066MHz，时至今日，IntelCore2处理器已经全线进入45nm，内建亿晶体管，最强的四核心处理器频率最高可达。

23、2007年

PentiumDual-Core是由英特尔公司推出，采用Core与Westmere微架构的中央处理器系列产品。

该系列布局于英特尔处理器的中低阶，用于取代NetBurst架构的PentiumD系列处理器。

24、2007年

AMD推出了Phenom处理器。

Phenom采用K10微架构，包括四核心（PhenomX49000系列，代号：

Agena）、三核心PhenomX38000系列代号：

Toliman），支持SocketAM2+插槽。

与AthlonX2不同，Phenom处理器至少内置2MB的L3高速缓存，并新增了多种SIMD指令集，包括MMX,Enhanced3DNow!

SSE,SSE2,SSE3以及SSE4a。

25、2007年

Intel推出了Corei7。

与Core2不同的是，Corei7重新引入了超线程技术，支持8线程同时运算，支持TurboMode技术，处理器频率可以按步骤提升，此外，Corei7的SSE4的版本会提升至了，新增了7条指令。

首批登场的包括Corei7-920,Corei7-940以及Corei7-965，内置亿晶体管，8MBofL2共享缓存，性能相当强悍，不过遗憾的是，IntelCorei7售价昂贵。

Corei7个头非常大，die面积达到了263mm，而Core2为143mm。

26、2008年

AMD推出了PhenomII，是AMD首款45nm处理器，首批已经发布的包括PhenomIIX4940/920、X3710/720，前者采用AM2+封装，而后者采用的是原生AM3封装技术。

性能方面，PhenomIIX4940/920基本可以与Intel上一代准旗舰Q9400系列以及Q9500系列抗衡，而且值得一提的是，PhenomIIX4940/920的售价相对更实惠。

PhenomIIX3700系列是由PhenomIIX4屏蔽一颗核心得来的。

27、2008年

Intel推出了IntelAtom，代号为Silverthorne，基于45nm工艺，继承亿晶体管，内置512KBL2缓存，支持SSE3指令集和VT虚拟化技术。

与普通台式处理器不同，Atom处理器采用顺序执行设计，这样做可以减少晶体管的数量。

为了弥补性能较差的问题，Atom处理器的起跳频率会较高。

二、典型CPU的性能指标

AB：

地址总线，其宽度决定了CPU可以访问的物理地址空间，对于486以上的微机系统，地址线的宽度为32位，最多可以直接访问4096MB的物理空间。

DB：

数据总线，其宽度决定了CPU与二级高速缓存、内存以及输入/输出设备之间一次数据传输的信息量。

主频：

主频即CPU的时钟频率（CPUClockSpeed）。

一般说来，主频越高，CPU的速度越快。

由于内部结构不同，并非所有的时钟频率相同的CPU的性能都一样。

主要部件：

CPU内部结构大概可以分为控制单元、运算单元、存储单元和时钟等几个主要部分。

运算器是计算机对数据进行加工处理的中心，它主要由算术逻辑部件、寄存器组和状态寄存器组成；控制器是计算机的控制中心，它决定了计算机运行过程的自动化，包括指令控制逻辑、时序控制逻辑、总线控制逻辑、中断控制逻辑等几个部分。

Cache：

高速缓存，内置高速缓存可以提高CPU的运行效率，在计算机存储系统的层次结构中，介于中央处理器和主存储器之间的高速小容量存储器。

它和主存储器一起构成一级的存储器。

高速缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的

MIPS：

millioninstructionpersecond，即计算机每秒执行几百万个指令数。

下面根据上面列出的一些指标来衡量经典CPU：

4004：

最大的时钟速度为740kHz。

指令周期：

92.6kHz。

程序和数据分别存储（比如：

Harvardarchitecture）。

跟大部分Harvardarchitecture设计使用分别的通道相反，4004使用单个多功能的4字节通道来传输：

12字节地址，8字节指令和4字节数据字。

指令集包含46个指令（其中41个是8字节宽和5个是16字节宽）

8086：

8086有四个完全一样的16位暂存器，但也能够当作八个8位暂存器来访问；以及四个16位索引暂存器（包含堆栈索引）。

数据暂存器通常由指令隐含地使用，针对暂存值需要复杂的暂存器配置。

它提供64K8位的输出输入（或32K16位）端口，以及固定的向量中断。

大部分的指令只能够访问一个存储器地址，所以其中一个操作符必须是一个暂存器。

运算结果会存储在操作符中的一个。

8086有4个存储器区段（segment）暂存器，可以通过索引暂存器来设置。

区段暂存器可以让CPU一种当时是全新的方式访问多达1MB之存储器。

在现今有区段的处理器中，8086把区段暂存器左移4位然后把它加上去寻址。

这通常被认为是一个不太好的设计，因为这么做会让各区段有重叠。

尽管这样对于汇编语言而言会显得有用——因为可以充分控制区段，但同时却使高级语言中的指针（像是C编程语言）使用变得困难。

它降低了指针的高效率，且有可能产生两个指向同一个地方的指针拥有不同的地址。

更坏的是，这种方式产生要让存储器扩充到大于1MB的困难。

而80286的寻址方式改变让存储器扩充较有效率。

处理器的运行时频率介于4.77（在原先的IBMPC）和10MHz.

80286：

80286处理器集成了大约13万个晶体管，最大主频为20MHz，采用16位数据总线和24位地址总线。

80286有两种工作模式：

实模式和保护模式。

在实模式下，80286直接访问内存的空间被限制在1M字节，更多内存需要通过EMS或XMS内存机制进行映射。

而在保护模式下，80286可以直接访问16M字节的内存，并具有异常处理机制，这为后来的微软的多任务操作系统Windows准备了条件。

80386：

首次在x86处理器中实现了32位系统。

可配合使用80387数字协处理器增强浮点运算能力。

首次采用高速缓存（外置）解决内存速度瓶颈问题。

由于这些设计，80386的运算速度达到了前代产品80286的数倍。

80386DX的内部和外部数据总线是32位，地址总线也是32位，可以寻址到4GB内存，并可以管理64TB的虚拟存储空间。

80386有三种工作模式：

实模式、保护模式、虚拟86模式。

实模式为DOS系统的常用模式，直接内存访问空间被限制在1M字节；保护模式下80386-DX可以直接访问4G字节的内存，并具有异常处理机制；虚拟86模式可以同时模拟多个8086处理器来加强多任务处理能力。

　初期推出的80386DX处理器集成了大约万个晶体管，工作频率为。

此后80386处理器逐步提高到20MHz、25MHz、33MHz直至最后的40MHz。

80486：

i486的结构有很大的突破。

它有内置数据快取芯片，一个浮点运算处理器（只有DX型才拥有）和多重管线。

在最佳的条件下，i486的核心可以提供一个时间周期内处理一个指令。

这会提供大约二倍同频率的80386的效能。

然而，有些低等级的i486实际上会比最高速的386还要慢，这在i486SX型会格外的明显。

IntelPentium：

超标量（Superscalar）架构-Pentium拥有两个数据路径（管线，pipelines），可以达到在一个时钟周期内完成一个以上的指令。

一个管线（称为"U"）可以处理任何的指令，而另外一个（称为"V"）可以处理简单的整数及FXCH浮点数指令。

使用一个以上的管线是传统RISC处理器设计的特色，这也是在许多x86平台上第一个实作出来的，显示有将两种技术合并的可能性，创造出几乎“混合在一起”的处理器。

64位数据路径，这使得每一次从内存提取指令的信息数量变成两倍。

这并不表示Pentium可以执行所谓的64位应用程序；他的主缓存器仍然是32位宽度。

MMX指令（只存在于后期的PentiumMMX中）-一种基本的SIMD指令集扩充，设计给多媒体应用程序使用。

IntelPentiumPro：

以陶瓷或有机塑料封装，其最大特色在于首先采用双晶粒封装与内置全速二级缓存，双晶粒自然是指将运算核心与缓冲区两颗芯片一同装入CPU中，而片上（onchip）全速二级缓存则是因为这样做可以使得二级缓存可以与内核相同的频率运作，不必在像过去使用主板上较慢速的L2内存。

从而为“乱序执行”所导致的大量内存查找提供了捷径，直接提升了性能。

其二级缓存有256KB/512KB/1MB三款，其中1MB版本使用OLGA（有机塑料封装），但是肇因于微米制程发热功率甚大，故其频率不曾高于233MHz（正式版不超频）。

PentiumPRO具有64条数据线，可一次传输64Bits的数据；两个8KB的L1Cache。

PentiumPRO有36条地址线，所以寻址空间可以高达64GB。

而且由于PentiumPRO的"非顺序执行的超纯量架构"，平均一个周期可执行三个指令，因此PentiumPRO的执行速度，可为Pentium的2倍。

此外，为了匹配PentiumPRO的指令周期，PentiumPRO内建有256KB（最小）的L2Cache，以避免使用到存取较慢的主存储器而影响效率。

另外IntelPentiumPro也可以支持多处理器的架构。

IntelPentiumII：

PentiumII为英特尔推出的一枚X86架构的处理器，基于PentiumPro使用的P6微处理架构，但另一方面它的16位处理能力获得优化，并加入MMX指令集。

第一代PentiumII核心代号为Klamath，使用350纳米制程，以及，就当时而言，制造出一个非常高的热量。

推出时，频率只有233及266MHz，使用66MHz前端总线，后期另推出频率300MHz的版本。

第二代PentiumII核心代号为Deschutes，运行频率为333MHz，于1998年1月推出，使用250纳米制程，而且温度亦有效的减低。

支持100MHz前端总线，英特尔于1998年另外推出了频率为266、300、350、400、450的PentiumII处理器。

基于PentiumII的计算机系统亦加入了新世代的内存标准——SDRAM〔替代EDORAM〕，以及AGP显示适配器。

与Pentium及PentiumPro处理器不同，PentiumII使用一种插槽式设计。

处理器芯片与其他相关芯片皆在一块类似子卡的电路板上，而电路板上有一块塑料盖，有时亦有一风扇。

PentiumII亦把L2放到这电路板上，但只运行处理器频率一半的速度。

此举增加处理器的良品率，从而减低制作成本。

这个方法亦可更容易改变PentiumII处理器的L2，可以使英特尔用相同的芯片，但可制作廉价低效能处理器，也可制贵价高效能处理器。

IntelPentiumIII：

Katmai；µm制程），唯一的差别是加入了SSE，以及改进第一级快取控制器（导致比后来PentiumII好的稍微效能改进）。

首次推出的速度是450和500MHz。

两个更多的版本是：

550MHz于1999年5月17日推出；600MHz于1999年8月2日推出。

在1999年9月27日，Intel推出533B和600B的版本，分别是533/600MHz，但是使用的是133MHz前端总线，而先前的其他是使用100MHz。

Katmai使用与PentiumII的槽孔设计。

Coppermine：

第二个版本Coppermine整合了在CPU内的低延迟性全速256KBµm制程制造。

PentiumIIICoppermine执行速度为500、533、550、600、650、667、700和733MHz，于1999年10月25日推出。

从1999年12月到2000年2000年中期推出，但是在普遍的硬件评论网站证明他在编译Linux时候不够稳定，因而回收。

这个问题是由于整合到内部的快取无法在1GHz以上的速度运作。

英特尔花费了至少6个月来解决这个问题，于2001年

Coppermine-T：

FC-PGA2封装的CoppermineCPU针脚与Tualatin相同，因此无法与FC-PGA主板兼容

IntelPentiumIV：

这是继1995年出品的PentiumPro之后的第一款重新设计过的处理器，这一新的架构称做NetBurst。

首款产品代码为：

Willamette，拥有左右的核心频率，并使用Socket423脚位架构。

IntelPentiumD：

双内核在一个物理处理器中提供两个执行内核，允许平台在更少的时间完成更多的任务，同时享受与计算机的流畅交互。

病毒防护技术可帮助阻止某些进行缓冲区溢出攻击的病毒和蠕虫，从而帮助提高系统的整体安全性。

IntelPentiumM：

其第一代Banias核心，目前公布有以下主频：

标准1.6GHz，1.5GHz，1.4GHz，1.3GHz，低电压1.1GHz，超低电压900MHz。

为了在低主频得到高效能，Banias作出了优化，使每个时钟所能执行的指令数目更多，并通过高级分支预测来降低错误预测率。

另外最突出的改进就L2高速缓存增至1MB（P3-M和P4-M都只有512KB），估计Banias数目高达7700万的晶体管大部分就用在这上。

此外还有一系列与减少功耗有关的设计：

增强型Speedstep技术是必不可少的了，拥有多个供电电压和计算频率，从而使性能可以更好地满足应用需求。

　　智能供电分布可将系统电量集中分布到处理器需要的地方，并关闭空闲的应用；移动电压定位（MVPIV）技术可根据处理器活动动态降低电压，从而支持更低的散热设计功率和更小巧的外形设计；经优化功率的400MHz系统总线；Micro－opsfusion微操作指令融

展开阅读全文