酷睿i3i5i7处理器深度剖析比对.docx
《酷睿i3i5i7处理器深度剖析比对.docx》由会员分享,可在线阅读,更多相关《酷睿i3i5i7处理器深度剖析比对.docx(52页珍藏版)》请在冰豆网上搜索。
酷睿i3i5i7处理器深度剖析比对
◆模组化设计再建新功,CPU中塞进GPU
模组化设计的Nehalem微架构,可灵活组合
英特尔在去年发布的Nehalem微架构非常成功,关键在于它采用可扩展的技术,每个处理器单元均采用了BuildingBlock模组化设计,组件包括有:
核心数量、SMT功能、L3缓存容量、QPI连接数量、IMC数量、内存类型、内存通道数量、整合GPU、能耗和时钟频率等,这些组件均可自由组合,以满足多种性能需求,比如可以组合成双核心、四核心甚至八核心的处理器。
正因为这样的模组化设计,英特尔可以灵活的制造出各种差异化的核心,比如在CPU中加入三通道DDR3内存控制器就是Bloomfield核心(研发代号,Corei7-900系列),加入双通道DDR3控制器和PCI-E2.0控制器就变成了Lynnfield核心(Corei7-800/i5-700系列)。
1月8日,英特尔推出2010全新Core(酷睿)处理器家族
到了2010年,英特尔将GPU图形单元和CPU核心组合在一起,再加上双通道DDR3控制器和PCI-E2.0控制器,搭配出了全新的Clarkdale核心(Corei5-600/i3-500系列),也就是本文的主角。
严格上说,Clarkdale核心是基于Westmere微架构的,不过Westmere只能算是Nehalem的轻微改良版。
Clarkdale是CPU史上首款整合有GPU的处理器,同时也是首款采用32nm制程技术的CPU,具有开创性的历史意义。
在2010年1月8日,英特尔正式发布了Clarkdale核心的处理器,这样它与之前上市的Bloomfield核心和Lynnfied核心处理器组成了全新的Core(酷睿)处理器家族,即Corei7/i5/i3系列处理器,形成一个完整的高中低产品线。
Corei7以英特尔桌面旗舰处理器的身份统领高端消费市场,Corei5则是中端桌面处理器的领军人物,Corei3定位于Core家族入门处理器。
在Core品牌之后,还有经典的Pentium品牌主导普通应用,Celeron系列提供入门级的解决方案,Atom处理器则是为上网本和手持设备量身定造。
◆Clarkdale:
首款32nm制程CPU
英特尔的“Tick-Tock”战略众所周知,“制程技术-微架构”交替更新,比如说在2008年将CPU制程技术升级到了45nm,在2009年将微架构升级到了Nehalem,在2010年伊始,英特尔就非常精准地将制程提升到了32nm,Clarkdale乘此东风,成为首款采用32nm制程技术的处理器。
Intel首次在45nm制程中使用了High-K+MetalGate技术,漏电情况大幅降低
在45nm制程中,英特尔首次使用了High-K栅极介质和MetalGate金属栅极,也就是“HK+MG”技术,使得晶体管漏电率大幅降低,具有非常出色的表现。
英特尔在32nm制程中,将“HK+MG”技术发展到第二代,同时改用第四代StrainedSilicon(应变矽)技术,用SiGe、Dual-StressStrainedSilicon(双应力应变矽)以及先进的应变记忆技术,能够有效提高晶体管的开关速度和电源效率,这样可以让处理器频率和功耗获益匪浅。
32nm中的High-K等价氧化物厚度从45nm的1.0nm下降到0.9nm,Gatelength(栅级长度)达到30nm,GatePitch(栅极间距)从160nm下降到只有112.5nm,也是有史以来最紧密的栅极间距。
从性能上来看,与45nm制程相比,NMOS晶体管的漏电量减少5倍多,PMOS晶体管的漏电量则减少10倍以上,驱动电流也达到史上最高,晶体管整体性能提升22%,同比封装尺寸是45nm工艺产品的70%。
Clarkdale的诞生,正式宣告了处理器制程工艺又向前迈进一大步。
而且制程技术的提升,是微架构进步的基石,明年,基于32nm制程技术的SandyBridge新架构尤其令人期待。
◆Clarkdale:
首款整合GPU的CPU
AMD在收购ATI后,首先提出了CPU与GPU融合的概念,然而一直停留在“纸上谈兵”的阶段。
英特尔后发却先至,发布了首款整合GPU图形单元的处理器Clarkdale。
一颗CPU里其实有两颗“芯”
但是现阶段的Clarkdale处理器,只是简单的将GPU和CPU封装在一起,并没有真正达到“融合”,一颗CPU里其实有两颗“芯”。
这样双“芯”独立并存的方式可能是未来很长一段时间内的主流。
我们需要特别注意的是,Clarkdale中的CPU核心是采用的32nm制程技术,而GPU核心还是采用的45nm制程。
两个核心采用MCP(Multi-ChipPackage)的方式封装在一起。
英特尔解释说,32nm制程Westmere处理器微架构比预期提早成熟,因此直接更新CPU核心至32nm的Westmere,图形核心还是停留在45nm制程,这样可以让Clarkdale尽早上市。
另外,CPU核心与GPU图形核心是分开研发,如果全新GPU图形核心完成研发,英特尔可以将之取代旧有GPU芯片,并配合现有的x86处理器一同封装,立即应市。
如此一来产品升级更具弹性,更能发挥BuildingBlock模块化设计的优势。
Clarkdale内核结构图
从上面这张结构图可以很清楚看到Clarkdale的内部构造,它主要由CPUDie和GPUDie两个核组成。
CPU核内包含有两个处理器内核,每个内核独享256KB的L2Cache,共享4MB的L3Cache。
原来和CPU内核一起封装的内存控制器和PCI-E2.0控制器这次都移到了GPU核中,除此之外,GPU核中还有GPU内核以及DMI(DirectMediaInterface)模块,整个GPUDie更像以前整合主板的北桥芯片。
CPUDie与GPUDie两个核之间通过高速的QPI总线进行通讯。
45nm制程的Lynnfield(Corei7-800/i5-700系列)处理器核心大小为296mm2,晶体管数为7.74亿个,而32nm制程的Clarkdale处理器中CPUDie大小为81mm2(不含GPUDie),晶体管数为3.82亿个,除了制程上的影响外,CPUDie不再包含内存控制器和PCI-E控制器,再加上核心和L3Cache只有Lynnfield的一半,使得CPUDie的大小和晶体管数急剧减少。
对于GPUDie来说,其大小为114mm2,晶体管数为1.77亿个。
◆Westmere:
Nehalem微架构的改良版
Clarkdale核心处理器采用的是Westmere微架构,Westmere实际上是脱胎于大名鼎鼎的Nehalem微架构,并作了少少的增强设计,可以看作是Nehalem的改良版。
Westmere微架构最主要的改进在于增加了AES指令集
Westmere继承了Nehalem微架构的优秀设计,虽然Nehalem仍是基于上一代Core微架构改进而来的,但它的改进是全方位的。
我们可以把这些重要特性分为计算内核(Core)和非计算内核(Uncore)的上的特性。
Nehalem在非计算内核(Uncore)方面的改进:
.三级包含式Cache设计——L3采用共享式设计,被片上所有内核共享
.放弃FSB使用QPI总线——20位宽的QPI连接其带宽可达惊人的每秒25.6GB
.整合内存控制器,支持多通道DDR3——内存读取的延迟大幅度减少,内存带宽大幅提升
Nehalem计算内核(Core)方面的改进:
.重拾超线程技术——第三代SMT超线程技术
.内核加速模式TurboBoost——根据需要开启、关闭以及加速单个或多个内核的运行
.SSE4.2:
新增7条扩展指令——加速字符串和文本处理
我们在以前的Corei7/i5处理器解析中已对这些改进作了详细介绍,因此不再赘述,有兴趣的读者可以点击相关链接进行查阅。
对于Westmere这个新的微架构来说,它主要的改进在于增加了7条新的指令,其中包括六条AES-NI指令和一条CarrylessMultiply(PCLMULQDQ)指令。
AES是AdvancedEncryptionStandard,高级加密标准的缩写,而AES-NI(NewInstructions)也就是支持这项高级加密标准的x86指令集。
另外增加的CarrylessMultiply(PCLMULQDQ)指令可以让处理器在一个周期内处理两组64Bit的Carry-lessMultiplication,这是很多加密标准所必须要处理到的部分。
然而不是所有的Clarkdale处理器都支持这些新指令的,比如Corei3-500系列和PentiumG6950就不支持,目前只有Corei5-600系列是支持的。
◆AES-NI:
加速AES算法应用程序
密码学中的高级加密标准AES(AdvancedEncryptionStandard),又称Rijndael加密法,是美国政府采用的一种区块加密标准,目前已然成为对称密钥加密中最流行的演算法之一。
Westmere中增加的六条AES指令中包括了四条的加密解密指令(AESENC、AESENCLAST、AESDEC、AESDECLAST)和两条的密钥生成(AESIMC、AESKEYGENASSIST)指令,英特尔称硬件支持AES加速可以比软件快四倍以上。
AES-NI不但支持三种符合AES官方规范的密钥长度(ASE128、ASE192、ASE256)和所有符合AES官方规范的运算模式,还可以支持若干种并不在AES官方规范中的算法。
AES-NI的应用领域
在Westmere微架构中增加新的AES指令集,旨在强化AES数学操作,因此有助于加速一些AES算法的应用程序。
就现在的应用来说,快速加密已成为许多计算任务的一部分,像全盘加密、文件存储加密、高清内容加密、互联网安全和网络电话等方面,加密解密的计算日趋繁重。
上面那些离我们的实际应用可能比较遥远,来看看非常熟悉的WinZip压缩软件。
WinZip具有强大的AES加密能力
许多用户购买WinZip的主要原因是其具有功能强大且简单易用的AES加密能力,能够实现256位AES加密文件压缩。
如果搭配支持AES-NI的Clarkdale处理器,就可以通过硬件支持加密作业的速度提高数倍,像7-Zip这个软件也具有AES加密功能,在后面的章节我们会就此进行针对测试。
在去年,富士通发布了首批采用256-Bit高级加密标准AES技术的500GB硬盘MJA2CH系列,显然这样的硬盘与Westmere微架构处理器是天衣无缝的组合。
◆新一代图形核心的架构与3D特性
在Clarkdale处理器中整合了GPU图形核心,英特尔并没有为这个GPU核心取一个正式的名字,统称为“IntelHDGraphics”。
新旧图形核心的架构与3D特性比较
在英特尔G45主板芯片组中整合的GPU图形核心为GMAX4500HD,那曾经是英特尔整合图形芯片中最顶级的产品,随着Clarkdale的诞生,X4500HD已成为历史。
Clarkdale中整合的GPU作为新一代高清图形核心,是英特尔目前最强的GPU,但它与X4500HD相比并没有质的飞跃,仍然是GMA(GraphicsMediaAccelerator)架构,相当于X4500HD强化版。
新的英特尔显卡控制面板
.新图形核心制程升到到了45nm
硬件上最明显的变化莫过于制程上的进步,Clarkdale的图形核心已升级到了45nm制程,而GMAX4500HD使用的是65nm工艺,更小的晶体管则意味着更高的性能和更低的功耗和发热量。
所以新的图形核心频率最高可以达到900MHz(Corei5-661),X4500HD的核心频率最高只有800MHz。
.GPU执行单元增加到12个
Clarkdale的图形核心的EU增加到了12个
规格上的另一个明显变化是EU(ExecutionUnit,执行单元)增加到了12个,而X4500HD核心只有10个EU,因此在运行能力的提升是不言而喻。
.支持动态频率调整(移动版)
移动版Arrandale的图形核心支持动态频率
新一代的图形核心开始支持动态频率调整,这个有点像CPU上用到的TurboBoost技术,当CPU负荷较低而GPU负荷较高时,CPU频率会适当降低而GPU频率会达到一个比较高的值。
不过目前这一技术还仅限于移动版芯片(Arrandale,Clarkdale对应的移动处理器)。
.支持HierarchicalZ和FastZClear技术
HierarchicalZ与FastZClear工作示意图
新的图形核心开始支持HierarchicalZ(层次Z缓存算法)与FastZClear(快速Z清除)技术,它们是为了在3D图形渲染硬件系统中节省带宽和提高消隐效率,在像英特尔图形核心这样带宽有限的GPU中,它们的作用尤为明显。
HierarchicalZ会检测出那些在最终成像画面被隐藏的像素,并在进行渲染之前就将之丢弃,而FastZClear能大幅加快消隐速度。
另外,英特尔新一代高清图形核心还加强了硬件顶点处理功能、支持OpenGL2.1、针对Windows7操作系统作了优化、支持双HDMI同时输出等。
虽然新的核心3D性能得到增强,但仍然处于入门级游戏显卡的地位,大部分3D游戏只能在低画质下来运行才能确保流畅,因此不能奢望它的游戏性能会有翻天覆地的变化。
◆新一代图形核心的多媒体特性
除了上一节介绍到的在3D架构上的改进外,Clarkdale的图形核心在多媒体功能上也得到了很大的增强,比如说开始支持双流解码、xvYCC色域标准、杜比TrueHD和DTS-HDMA音频等。
新旧图形核心的多媒体特性比较
.支持DualVideoDecode
DualVideoDecode(双视频解码)其实等同于NVIDIA/AMD显卡中的Dual-StreamDecode(双流解码),它能在播放HD/BD时让GPU同时处理两个不同视频流,以降低CPU占用率,比如你可以一边观看正片,一边浏览一些拍摄花絮等。
.支持xvYCC色域标准
高显示能力一直是影像产品的最高目标,以显示色域来说,过去sRGB的范围对于未来的视讯是太过于狭窄,无法满足在HDTV环境下所追求的表现,最新的一代色域标准xvYCC也就应运而生。
xvYCC色域图
xvYCC标准是经国际电工委员会(IEC)认可并于2006年作为国际标准发布的最新一代广色域标准,其色彩范围不仅大大超越NTSC色域范围,更可以达到传统标准(sRGB)的两倍,几乎可以代表自然界中存在的颜色。
当符合xvYCC标准的显示产品在播放同样符合xvYCC标准的内容时,能够忠实还原自然物体表面的色彩。
普通色域和xvYCC广色域的对比(x.v.Color为SONY符合xvYCC标准的电视品牌)
要还原出更真实的自然色彩,不只是显示器或电视等终端的事,显示卡作为输入内容的源头更是责无旁贷。
Clarkdale的GPU核心以新一代的高清图形核心自居,也开始支持xvYCC标准。
.12bpcDP/HDMIcolorDepth
xvYCC广色域标准可以扩展有效范围以使色彩的显示达到或超过人眼所能识别的程度。
而colorDepth(色深)能增加RGB或YCbCr色域定义的范围内有效色彩的数目。
colorDepth是指一个像点可以有多少种色彩来描述,它的单位是bpp(bitsperpixel),由于一个像数颜色是由三原色混合而成,也可以用一种原色有多少色彩来描述,即bpc(bitspercolor)。
我们通常所说的增加16位、真彩24位等都是bpp单位,色深的位数越高,所能同屏显示的颜色就越多,相应的屏幕上所显示的图像质量就越好。
更多的色彩能消除屏幕上的色带,转换更平滑,色彩之间的渐变更细微,在黑色和白色之间展现更多倍的灰色阴影。
Clarkdale的图形核心能支持的12bpc(36bpp)色深输出,每种原色可以有212=4096种色彩,因此一共可以有40963=687.2亿种颜色。
数百亿种色彩丰富艳丽,层次丰富,并且也能够更准确的还原物体真实的色彩,达到惊人的程度,
更高的色深能让色彩间过度更自然平滑
由于色深增加会导致了显卡向显示设备传送数据量的增加,在高分辨下更为突出,不过从HDMI1.3开始能支持10bpc、12bpc和16bpc的RGB色深和色彩空间,而之前的HDMI版本最多只能支持到8bpc。
与Clarkdale配套的主板PCH(PlatformControllerHub)芯片原生支持DisplayPort和HDMI1.3输出,因此Clarkdale的图形核心支持的12bpc色深输出不成问题。
.DolbyTrueHD和DTS-HDMasterAudio
Clarkdale也开始支持DolbyTrueHD和DTS-HDMasterAudio这样的无损压缩音频输出,为高清播放“尽心尽力”,给消费者带来真正的高清娱乐体验,这也是业界内首款支持TrueHD和DTS-HD的集成解决方案。
DolbyTrueHD为lossless(无失真)的音效压缩制式,建于MLPLossless技术发展,TrueHD可让音响工程师独立针对电影内容更准确地将声音定位修正,以重现更真实的声效,最高可支持多达八个分离的24bit/96kHz全频带声道,在蓝光影碟中的码率最高为8Mbps。
DTS-HD中的DTS-HDMasterAudio(主体音频)也是无损压缩音轨,DTS宣称它是“bitforbit”的完整再现录音母带效果,是完全无损压缩,能达到了超高可变比特率——蓝光碟达24.5Mbps和HD-DVD至18.0Mbps,因此能对应音频的全部信息,7.1声道都达到96khz/24bit的取样率和深度。
DTS-HD这个环绕声音标准的出现将把我们带进真正意义的7.1声道输出新境界。
DoblyTrueHD和DTS-HDMA都需要借助庞大数据流量的帮助才可以实现相当高的取样率,因此用光纤或是同轴线缆进行传输已经显得捉襟见肘,HDMI等新一代接口就有了用武之地。
◆认识Clarkdale核心处理器
在前面的几节,我们粗略剖析了Clarkdale核心处理器在架构与功能上的一些改良,简单归纳如下:
这次的Clarkdale核心处理器横跨三个系列,即Corei5、Corei3和Pentium,虽然Corei5中还有Lynnfield核心的CPU,Pentium系列中的CPU更多,但Clarkdale核心处理器共同的特点是整合有GPU图形单元,所以比较容易区分。
Core系列处理器家谱
英特尔规划中的Core品牌系列目前按市场定位划分为Corei7、Corei5、Corei3三个系列,涵盖高中低三个档次,所有的Core处理器从技术规格上又细分为Bloomfield、Lynnfield和Clarkdale三种核心,一般读者可能容易犯晕,上面的图表能清晰的列出各型号与核心的关系。
Corei7/i5/i3间最简单的区分方法:
8线程的为Corei7,四线程且支持TurboBoost技术的则为Corei5,不支持TurboBoost的就是Corei3了。
Core系列处理器详细规格表
Clarkdale核心的处理器相比于其它两种核心,除了整合GPU和改用32nm制程外,在规格上最大的变化在于只有两个CPUCore,同时L3Cache也减少到了4MB,在性能上会低于Lynnfield和Bloomfield。
Clarkdale核心的Corei5处理器目前一共有四种型号,分别为Corei5-670/661/660/650,均支持超线程和TurboBoost技术;Corei3处理器暂时只有两款,即Corei3-540和i3-530,也支持超线程技术,但不支持TurboBoost,也不支持AES-NI,定位于Core家族中的入门产品;Clarkdale核心的Pentium处理器只有G6950这一款,不支持超线程和TurboBoost,也不支持AES-NI,L3Cache只有3MB,整合的GPU还不支持IntelClearVideo技术,定位相当低。
值得注意的是,Clarkdale处理器中集成的PCIE控制器只支持1x16模式,不能再像Lynnfield处理器那样可以拆分成2x8模式,所以在使用独立显卡时,不支持x8+x8的双卡互连。
Clarkdale核心的Corei5和Corei3处理器
GPU的核心频率上,除了Corei5-661为900MHz外,其它Core处理器显示频率频率均为733MHz,最低端的PentiunG6950显示核心频率只有533MHz。
◆双芯片解决方案确立主流地位
从Lynnfield处理器开始,英特尔就抛弃了过去的三芯片结构(CPU+GMCH+ICH),开始采用新的双芯片结构(CPU+PCH)。
在Clarkdale处理器中,CPU的整合度更高了,双芯片结构继续发扬光大,逐渐确立自己的主流地位。
英特尔新一代平台都将采用双芯片结构
新的H55/H57/Q57PCH芯片是为Clarkdale处理器量身定做的,其中针对消费级市场的H55/H57将取代现有的整合芯片组G45,针对商用市场的Q57将取代Q45。
在最初的计划中,H57、Q57包括胎死腹中的P57主板会加入Braidwood技术(TurboMemory进化版本),但由于技术不成熟,英特尔取消了Braidwood计划,这样所有5系列PCH芯片都不支持Braidwood技术,因此原本想和P55一起发布的P57主板直接“出师未捷身先死”。
H57和Q57虽然也不支持Braidwood技术,但还是保全了身家性命,它们和H55的区别在于一些技术的支持上,比如H57可以支持IntelRapidStorageTechnology(快速存储技术),Q57还支持商用版的IntelRemotePCAssistTechonlogy(PC远程协助技术)和IntelAnti-TheftTechnology(防盗技术)等。
*小资料:
Braidwood技术也就是TurboMemory改进版本,在PCH中内建有NVRAM控制器,透过NVRAM模块卡及主板上的Braidwood模块接口,将成为系统与储存接口的缓冲,令低端PC亦可拥有近似SSD的读写及储存性能,有效缩减系统启动及系统反应时间,提升性能。
◆英特尔H55芯片解析
英特尔H55将会以支持Clarkdale处理器的主流芯片出现,相应的H55主板亦将占据Core系列的大半壁江山。
由于同类的H57和Q57只是在技术支持上略有不同,因此不另作多述。
新的H55(包