如何判断CPU和内存的搭配瓶颈.docx

上传人:b****2 文档编号:2469545 上传时间:2022-10-29 格式:DOCX 页数:7 大小:173.22KB
下载 相关 举报
如何判断CPU和内存的搭配瓶颈.docx_第1页
第1页 / 共7页
如何判断CPU和内存的搭配瓶颈.docx_第2页
第2页 / 共7页
如何判断CPU和内存的搭配瓶颈.docx_第3页
第3页 / 共7页
如何判断CPU和内存的搭配瓶颈.docx_第4页
第4页 / 共7页
如何判断CPU和内存的搭配瓶颈.docx_第5页
第5页 / 共7页
点击查看更多>>
下载资源
资源描述

如何判断CPU和内存的搭配瓶颈.docx

《如何判断CPU和内存的搭配瓶颈.docx》由会员分享,可在线阅读,更多相关《如何判断CPU和内存的搭配瓶颈.docx(7页珍藏版)》请在冰豆网上搜索。

如何判断CPU和内存的搭配瓶颈.docx

如何判断CPU和内存的搭配瓶颈

如何判断CPU和内存的搭配瓶颈

CPU主频也叫时钟频率,单位是MHz,用来表示CPU

的运算速度。

CPU的工作频率(主频)包括两部分:

外频与

的主频与外频之间存在着一个比值关系,这个比值就是倍频系数,简称倍频。

倍频可以从1.5一直到23以至更高,以

0.5为一个间隔单位。

外频与倍频相乘就是主频,所以其中任何一项提高都可以使CPU的主频上升。

由于主频并不直接代表运算速度,所以在一定情况下,很可能会出现主频较高的CPU实际运算速度较低的现象。

因此主频仅仅是CPU

性能表现的一个方面,而不代表CPU的整体性能.

大家知道,计算机系统的时钟速度是以频率来衡量的。

晶体振荡器控制着时钟速度,在石英晶片上加上电压,其就以正弦波的形式震动起来,这一震动可以通过晶片的形变和

大小记录下来。

晶体的震动以正弦调和变化的电流的形式表备晶体振荡器,因此内存工作时的时钟信号是由主板芯片组的北桥或直接由主板的时钟发生器提供的,也就是说内存无法决定自身的工作频率,其实际工作频率是由主板来决定的。

再说说为什么会有前端总线一说吧,总线是将信息以

个或多个源部件传送到一个或多个目的部件的一组传输线。

通俗的说,就是多个部件间的公共连线,用于在各个部件之间传输信息。

人们常常以MHz表示的速度来描述总线频率。

总线的种类很多,前端总线的英文名字是FrontSideBus,通常用FSB表示,是将CPU连接到北桥芯片的总线。

计算机的前端总线频率是由CPU和北桥芯片共同决定的。

北桥芯片负责联系内存、显卡等数据吞吐量最大的部件,

并和南桥芯片连接。

CPU就是通过前端总线(FSB)连接到北桥芯片,进而通过北桥芯片和内存、显卡交换数据。

前端总线是CPU和外界交换数据的最主要通道,因此前端总线的数据传输能力对计算机整体性能作用很大,如果没足够快的前端总线,再强的CPU也不能明显提高计算机整体速度。

数据传输最大带宽取决于所有同时传输的数据的宽度和传

400MHz、533MHz、800MHz几种,前端总线频率越大,代表着CPU与北桥芯片之间的数据传输能力越大,更能充分发挥出CPU的功能。

现在的CPU技术发展很快,运算速度提高很快,而足够大的前端总线可以保障有足够的数据供给给CPU,较低的前端总线将无法供给足够的数据给CPU,这样就限制了CPU性能得发挥,成为系统瓶颈。

外频与前端总线频率的区别:

前端总线的速度指的是

CPU和北桥芯片间总线的速度,更实质性的表示了CPU和外界数据传输的速度。

而外频的概念是建立在数字脉冲信号震荡速度基础之上的,也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一万万次,它更多的影响了PCI及其他总线的频率。

之所以前端总线与外频这两个概念容易混淆,主要的原因是在以前的很长一段时间里(主要是在Pentium4出现之前和刚出现Pentium4时),前端总线频率与外频是相同的,因此往往直接称前端总线为外频,最终造成这样的误会。

随着计算机技术的发展,人们发现前端总线频率需要高于外频,因此采用了QDR(QuadDateRate)技术,或者其他类似的技术实现这个目的。

这些技术的原理类似于

AGP的2X或者4X,它们使得前端总线的频率成为外频的2

倍、4倍甚至更高,从此之后前端总线和外频的区别才开始被人们重视起来。

再说说AMD和INTER的区别吧AMD与Intel目前最大

的区别就是指令集的区别,双核的概念AMD早就应用了,只不过不如现在的双芯处理器那么的成熟。

这也就是为什么英特尔用G代表,而AMD用XXXX+来代表编号,英特尔高频低能,AMD低频高能,所以为什么一般同档次的产品

AMD的主频比英特尔的低,其实并不低,只是表现方法不同罢了。

例如AMD的2500+就相当于英特尔的2.5G。

CPU的处理性能不应该单去看主频,而INTEL正是基

于相当相当一部分人对CPU的不了解,采用了加长管线的做法来提高频率,从而误导了相当一部分的人盲目购买。

CPU的处理能力简单地说可以看成:

实际处理能力=主频*

执行效率,就拿P4E来说他的主频快是建立在使用了更长的管线基础之上的,而主频只与每级管线的执行速度有关与执行效率无关,加长管线的好处在与每级管线的执行速度较快,但是管线越长(级数越多)执行效率越低下,AMD的PR值可能会搞得大家一头雾水,但是却客观划分了与其对手想对应的处理器的能力。

为什么实际频率只有1.8G的AMD2500+处理器运行速度比实际频率2.4G的P4-2.4B还快?

为什么采用0.13微米制程的Tulatin核心的处理器最高只能做到1.4G,反而采用0.18微米制程的Willamette核心的处理器却能轻松做到2G?

下面我们就来分析一下到底是什么原因导致以上两种“怪圈”的存在。

每块CPU中都有“执行管道流水线”的存在(以下简称“管

线”,)管线对于CPU的关系就类似汽车组装线与汽车之间的关系。

CPU的管线并不是物理意义上供数据输入输出的的管

路或通道,它是为了执行指令而归纳出的“下一步需要做的事的步骤称作“级”。

管线中的“级”的任务包括分支下一步要执行的指令、分支数据的运算结果、分支结果的存储位置、执行

运算等等

最基础的CPU管线可以被分为5级:

1、取

指令2、译解指令3、演算出操作数4、执行指令5、存储

到高速缓存你可能会发现以上所说的5级的每一级的描述都非常的概括,同时如果增加一些特殊的级的话,管线将会有所延长:

1、取指令12、取指令23、译解指令14、译

解指令25、演算出操作数6、分派操作7、确定时8、执

行指令9、存储到高速缓存110、存储到高速缓存2无论是最基本的管线还是延长后的管线都是必须完成同样的任

务:

接受指令,输出运算结果。

两者之间的不同是:

前者只

作。

如果除此以外的其它细节都完全相同的话,那么你一定希望采用第一种情况的“5级”管线,原因很简单:

数据填充5

级要比填充10级容易的多。

而且如果处理器的管线不是始终充满数据的话,那么将会损失宝贵的执行效率——这将意味着CPU的执行效率会在某种程度上大打折扣。

那么CPU管线的长短有什么不同呢?

——其关键在于

管线长度并不是简单的重复,可以说它把原来的每一级的工

完成每一级工作的时间要明显的快于“5级”模式。

最慢的

也是最复杂)的“级”结构决定了整个管线中的每个“级”的速

请牢牢记住这一点!

我们假设上述第一种管线模式

每一级需要1个时钟周期来执行,最慢可以在1ns内完成的

1/1ns=1GHz)。

现在的情况是CPU内的管线级数越来越多,为此必须明显的缩短时钟周期来提供等于或者高于较短管线处理器的性能。

好在,较长管线中每个时钟周期内所做的工作减少了,因此即使处理器频率提升了,但每个时钟周期缩短了,每个“级”所用的时间也就相应的减少了,从而可以让CPU运行在更高的频率上了。

如果采用上述的第二种管线模式,可以把处理器主频提升到2GHz,那么我们应该可以得到相当于原来的处理器2

倍的性能——如果管线一直保持满载的话。

但事实并非如此,任何CPU内部的管线在预读取的时候总会有出错的情况存在,一旦出错了就必须把这条指令从第一级管线开始重新执行,稍微计算一下就可以得出结论:

如果一块拥有5级管线

的CPU在执行一条指令的时候,当执行到第4级时出错,那么从第一级管线开始重新执行这条指令的速度,要比一块拥有10级管线的CPU在第8级管线出错时重新执行要快的多,也就是说我们根本无法充分的利用CPU的全部资源,那么我们为什么还需要更高主频的CPU呢?

回溯到几年以前,让我们看看当时1.4GHz和1.5GHz

的奔腾四处理器刚刚问世之初的情况:

当时Intel公司将原奔腾三处理器的10级管线增加到了奔腾四的20级,管线长度

提升了100%。

最初上市的1.5GHz奔腾四处理器曾经

举步维艰,超长的管线带来的负面影响是由于预读取指令的

主频的奔腾三处理器相对垒,但明显的优势就是大幅度的提升了主频,因为20级管线同10级管线相比,每级管线的执行时间缩短了,虽然执行效率降低了,但处理器的主频是根据每级管线的执行时间而定的,跟执行效率没有关系,这也就是为什么采用0.18微米制程的Willamette核心的奔腾四处理器能把主频轻松做到2G的奥秘!

固然,更精湛的制造工艺也能对提升处理器的主频起到作用,当奔腾四换用0.13

微米制造工艺的Northwood核心后,主频的优势才大幅度体现出来,一直冲到了3.4G,长管线的CPU只有在高主频的情况下才能充分发挥优势——用很高的频率、很短的时钟周期来弥补它在预读取指令出错时重新执行指令所浪费的时间。

但是,拥有20级管线、采用0.13微米制程的

Northwood核心的奔腾四处理器的理论频率极限是3.5G,那怎么办呢?

Intel总是会采用“加长管线”这种屡试不爽的主

频提升办法

新出来的采用Prescott核心的奔腾四处理器

俗称P4-E),居然采用了31级管线,通过上述介绍,很明显我们能得出Prescott核心的奔四处理器在一个时钟周期的处理效率上会比采用Northwood核心的奔四处理器慢上

大截,也就是说起初的P4-E并不比P4-C的快,虽然P4-E

拥有了更大的二级缓存,但在同频率下,P4-E绝对不是P4-C

的对手,只有当P4-E的主频提升到了5G以上,才有可能

跟P4-3.4C的CPU对垒,著名的CPU效能测试软件SuperPi

点后100万位需要47秒,这仅相当于P4-2.4C的成绩,而

P4-3.4C运算只需要31秒,把同频率下的P4-3.4E远远的甩在了后面!

AMD2500+处理器,采用了10级管线,只有1.8G的主频却能匹敌2.4G的P4;苹果电脑的G4处理器,更是采用了7级管线,只有1.2G的主频却能匹敌2.8C

的P4,这些都要归功于更短的管线所带来的更高的执行效率,跟它们相比,执行效率方面Intel输在了管线长度上,但主频提升方面Intel又赢在了管线长度上,因为相对于“管线”这个较专业的问题,大多数消费者还是陌生的,人们只知道

处理器的主频越高速度就越快”这个片面的、错误的、荒谬的理论!

这就是Intel的精明之处!

内存主频和CPU主频一样,习惯上被用来表示内存的

速度,它代表着该内存所能达到的最高工作频率。

内存主频是以MHz(兆赫)为单位来计量的。

内存主频越高在一定程度上代表着内存所能达到的速度越快。

内存主频决定着该内存最高能在什么样的频率正常工作。

目前较为主流的内存频率室333MHz和400MHz的DDR内存,以及533MHz和

667MHz的DDR2内存。

DDR内存和DDR2内存的频率可以用工作频率和等效

频率两种方式表示,工作频率是内存颗粒实际的工作频率,

但是由于DDR内存可以在脉冲的上升和下降沿都传输数据,

每个时钟能够以四倍于工作频率的速度读

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1