Sandy Bridge移动处理器评测共12页文档.docx

上传人:b****7 文档编号:23958233 上传时间:2023-05-22 格式:DOCX 页数:11 大小:23.10KB
下载 相关 举报
Sandy Bridge移动处理器评测共12页文档.docx_第1页
第1页 / 共11页
Sandy Bridge移动处理器评测共12页文档.docx_第2页
第2页 / 共11页
Sandy Bridge移动处理器评测共12页文档.docx_第3页
第3页 / 共11页
Sandy Bridge移动处理器评测共12页文档.docx_第4页
第4页 / 共11页
Sandy Bridge移动处理器评测共12页文档.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

Sandy Bridge移动处理器评测共12页文档.docx

《Sandy Bridge移动处理器评测共12页文档.docx》由会员分享,可在线阅读,更多相关《Sandy Bridge移动处理器评测共12页文档.docx(11页珍藏版)》请在冰豆网上搜索。

Sandy Bridge移动处理器评测共12页文档.docx

SandyBridge移动处理器评测共12页文档

【SandyBridge】移动处理器【评测】

相比缺席移动平台的Bloomfield和沉沦许久的Arrandale,Intel的Tick-Tock钟摆又如约按照摩尔预言的频率摆动起来,SandyBridge来了,同步降临移动平台甚至让笔记本用户略微感觉有点受宠若惊。

从上面的路线图我们可以发现,移动处理器产品升级到SandyBridge,从主流级的i3到零售商用的i5,再到性能级的i7进展都很神速,基本同时更新换代,而入门性价比级的Pentium和Celeron则需要等到今年下半年。

当然大多普通消费者不会去看什么RoadMap和架构进化,他们关心的则是采用新处理器的笔记本产品什么时候买得到,比上代到底快多少?

我们也将在后面的性能测试部分回答这些问题。

在开始评测之前,让我们先了解一下SandyBridge产品本身的特质。

评测导读:

移动SandyBridge处理器解析从胶水到整合

从P6到SandyBridge微架构解析

更强的图形性能

更为丰富多彩的多媒体应用体验

更好得功耗控制

SandyBridge芯片组架构解析

评测平台和环境介绍

处理器理论性能测试

CINEBENCH性能测试

实际应用性能测试

QuickSync编码性能测试

游戏性能测试

测试结语

移动SandyBridge处理器解析从胶水到整合

SandyBridge则属于Tick的制程延续上一代的Arrandale的32nm工艺,而在处理器架构上做了较大的进化。

Lynnfield/Arrandale虽然首先将GPU集成到CPU中来,取消原有北桥架构,但我们不得不说Lynnfield/Arrandale的CPU和GPU则是二个Die,仅仅是在一个基板上而没有真正集成进去,胶水在一起。

从左到右依次为SandyBridge双核/四核和Arrandale,Arrandale的图像芯片并没有集成进CPU内部,而是两个Die,虽然Arrandale的CPU部分是采用的32mn制程工艺,但GPU部分则还是采用旧的45nm,以至于下部的GPU部分核心面积甚至大于上部的CPU部分。

而SandyBridge使得CPU和GPU整合入一个die,使得处理器功耗控制更好。

上一代的Arrandale采用多芯片封装

上一代的ArrandaleCPU核心通过MCP同图像核心相连,图像核心除开图像部分电路以外,还包含PCIe和内存控制器以及接口。

SandyBridge内部采用环形的连接,不同核心、LLC缓存、图像核心和外联部分之间相互都有96GB/S带宽,并且环形结构是否灵活,可以方便的扩大或者缩减规模达成不同配备。

而SandyBridge将图像处理器整合进CPUDie内部,不得不说是一个不小的进步(当然同AMD的Bobcat和Llano的"融合"还是存在差距)。

处理器左边部分为图形电脑,中间部分上部为处理器4个核心,而下部则为共享的L3缓存,右侧和下部则为内存控制器、DMI、其他IO接口和内存控制器I/O接口。

由于集成在一个Die,CPU和GPU直接的连接速率也都有很大的提升,同时也带来了GPU性能的更大进步的空间。

从P6到SandyBridge微架构解析

P6似乎听上去很遥远,那似乎还是在1995年,其实从1995年的PentiumPro,经历PentiumM、Core2Duo,一直到去年的Lynnfield/Arrandale,除开长流水线的Pentium4和Atom,在大部分时间intelx86架构的产品都还是采用的P6架构,直到最近的SandyBridge微架构才真正改变。

或许用一句话说:

SandyBridge的Corei和之前的Corei系列是完全不同的东西,是Tick-Tock策略发展Tock发生的最大改变。

分支预测单元和解码微操作缓存

x86从指令解释成处理器可以理解的微指令需要一个流程,之前的处理器都是通过32KL1指令缓存处理指令,再进行预编码进入指令队列,最后由解码器转换为处理器可以理解的微操作。

而SandyBridge增加了额外的L0解码微操作缓存,其容量有6KB大,大概可以储存1500条微操作,如果解码器发现指令在之前曾经转换那么它就会直接使用内部微操作进行替换而不需要重新解码。

而在前端的分支预测单元使用之前处理数据的地址和指向记录,在不增加数据结构复杂度的情况下提升分支预测的准确率,使得L0缓存大约有80%命中率,这样使得原有解码器的负载大大降低,同时直接方面高速的L0缓存,使得指令带宽更大,访问延迟也更低,甚至还利于降低处理器功耗。

乱序执行

SandyBridge和之前的NetBurst类似,在处理器里加入了物理寄存器文件。

在此之前改变排列微操作顺序,则需要将缓存的每个操作寄存器完全复制,这样不仅有过多无用的数据传输操作,而且还存在过度重复内容浪费大量的寄存器文件空间。

而SandyBridge的乱序阵列则可以同时"链接"168个微操作,而之前的Nehalem则需要利用记录缓存才能存储128个。

此外新的AVX指令集作为原有SSE的扩展,可以操作256位SIMD矢量寄存器,虽然这样操作的资源花费比较大,但SandyBridge的微架构还是有足够的性能处理,利用AIX指令集可以大幅提升处理的并行度和矢量计算的吞吐能力,购买SandyBridge笔记本请至豪脉,这对提升需要大量浮点计算的媒体处理、科学/金融计算还是有十分重要意义的。

乱序的微操作才有仲裁器分配到不同的端口,需要注意的是SandyBridge设置了两组端口用来载入和卸载储存地址,并和内存控制器相连,而第三个端口可以用来储存不变的数据,每个端口每个时钟周期可以处理16字节的吞吐,累计每个周期可以处理48个字节,使得其与L1缓存之间的吞吐相比之前提升了50%,从而大大提升了SandyBridge的内存控制器性能。

经过这样一个流程SandyBridge的微架构就跃然眼前了,展现在你我眼前的是一个高效、灵活,且低功耗的SandyBridge,当然这样的架构优势需要更多的实用来验证。

更强的图形性能

SandyBridge的GPU分为IntelHDGraphics2000和3000,其中较为高阶的IntelHDGraphics3000内置12个执行单元,基础频率为650MHz,而高负载频率更高达1.3GHz,并且支持QuickSync特性。

而2000规模仅为3000的一半,只有6个EU,并且不支持QuickSync。

当然IntelHDGraphics3000的性能提升不仅仅得益于规模和频率的提升,架构的改进也有很大的贡献:

得益于可配置的分区域缓存使得SandyBridge的图像部分有更高的带宽和更低的访问延迟。

更大的寄存器可以提升处理的并行度和对复杂Shader的处理能力,购买SandyBridge笔记本请至豪脉,而第二代的并行分支预测也进一步提高了缓存数据的命中率,使得新一代的IntelHDGraphics单个执行效能相比上一代的EU性能提高了一倍。

在API的支持方面SandyBridge的IntelHDGraphics在DirectX支持上由上一代的GMAHD支持的DX10略微升级到DX10.1(没有头提供对DX11的支持笔者也觉得不用遗憾,因为IntelHDGraphics即使支持DX11肯定也跑不动任何DX11游戏,其设计需求仅仅是为了满足普通消费者的一般需求)。

在桌面平台,intel对于集成核心处理较为吝啬,仅给高阶不锁倍频的2500K和2600K配备了IntelHDGraphics2000,但购买不锁倍频的K系列处理器玩家绝大部分都会购买独立显卡,而不会使用CPU内置的图像处理器,而需要更强大集成图像性能的普通处理器用户却的得不到更好性能的IntelHDGraphics3000,这不能不说有些尴尬,不过在移动平台上intel则大方的多,移动型的i3/i5/i7都配备了性能更好的IntelHDGraphics3000。

更为丰富多彩的多媒体应用体验

其实普通笔记本用户对于游戏的需求一般不会太高,反而更为重视多媒体应用体验,因此intel也注意了这点,大幅提升了SandyBridge多媒体体验。

在输出接口方面SandyBridge在提供了原生的DisplayPort支持之外,对于HDMI也支持最新的1.4a规范,支持画中画、源码支持等高阶功能。

除此之外intel自家的ClearVideoHD清晰视频技术、InTru3D技术和WiDI无线连接技术使得3D视频欣赏和无线拨号设备连接成为可能,全面提升了SNB笔记本平台的多媒体体验、使得SandyBridge平台笔记本在接上HDTV的后也能很好的充当HTPC的角色。

当然SandyBridge在媒体特性方面最大的进步是QuickSync快速编码功能。

视频编码一般流程为视频流输入-解码-预处理-编码-视频流输出,上一代预处理-编码步骤由CPU和执行单元完成,而SandyBridge则行增了Multi-FormatCodec(MFX多格式)编码器,其为固定功能的逻辑处理模块,并行度很高,对处理器进行深度优化,可以对MPEG2、VC-1和AVCH264等进行快速编码,而不再需要执行单元EU的参与,相比之前EU转码利用MFX效能将会大幅提升,具体的应用测试可以参看本文后面的测试部分。

更好得功耗控制

TurboBoost的加入,使得Arrandale平台的笔记本续航有所改善,但原有的一刀切的分段式频率和电压管理并不能很好的满足所有应用和使用环境对性能和功耗需求。

因此SandyBridge也改进了原有处理器的功耗控制,在SandyBridge之前的处理器将频率、电压控制仅仅分为几个简单状态进行调整,而SandyBridge全新的控制模型才采用全动态的线性响应模式。

处理器核心和图像核心集成在同一Die上,但SandyBridge依然可以依据不同应用的性能需求,分别调节CPU和GPU的频率和电压,使得性能和功耗都最优化。

如在一般桌面环境或者单纯网络浏览,改进的TurboBoost会使得CPU和GPU都维持在较低的频率和电压以提升续航,在打开应用瞬间则会提升单核心的频率以提升系统响应速度,而在文件压缩时,则会提升多核心的频率以提升处理器效能,而在游戏时,TurboBoost则会让GPU效能优先,同时也保持CPU位于较高的频率,在整体功耗控制在可以接受的范围内以获得最好的游戏性能。

SandyBridge芯片组架构解析

由于处理器SandyBridge内部集成图形芯片,并承担内存控制器、集成视频输出这些Conroe时代传统北桥所承担的功能,因此SandyBridge的整体系统架构较为简化,主要仅需要通过DMI和FDI同QM67或者HM65相连。

处理器内部的图形核心集成了eDP(集成DisplayPort)接口,相对于传统的机遇TMDS的LVDS接口,eDP由于是基于串行数据传输,在输出画质显示和带宽上更具优势,并且后继笔记本面板大多直接采用eDP接口,而不需要传统的TMDS电路,使得这部分的成本也可以有所降低。

CougarPointPCH则负责传统的外围设备连接,支持8个端口的PCIe、6组SATA(其中有两组为SATA6G)和14组USB2.0。

由于CougarPointPCH的设计缺陷,SATA2.0接口控制器在可靠性上存在缺陷,不过笔记本一般不会提供2组以上的SATA接口,因此使用2组没有问题的SATA6G就没有什么问题。

评测样品介绍

我们评测的SandyBridge笔记本是由intel提供的神舟工程样品,采用Corei52540处理器,具体产品规格如下:

神舟SandyBridge工程样品产品规格和测试环境

处理器Corei52540M2.6GHz3MBCache2C/4H

芯片组QM55GPUIntelHDGraphics3000

内存ADATA2GBx2DDR313339-9-9-25

硬盘SAMSUNGHM500JI500GB

屏幕14inch1366x768

系统Windows7Ultimatex64

驱动AESAVX

平台采用的Corei52540M则是第二代i5处理器,其为双核心、四线程,核心频率为2.6GHz,个睿频加速到3.3GHz,内置3MB缓存。

Corei52540M集成的图形处理核心为HDGraphics3000,具体i52540M规格如下:

i52540M产品规格

核心数2

线程数4

频率2.6GHz

睿频频率3.3GHz

缓存3MB

总线频率100MHz

倍频26

指令集AESAVX

制程工艺32nm

热设计功耗35W

内存支持双通道最大8GBDDR31066/1333

内存带宽21.3GB/S

图形芯片基本频率650MHz

图形芯片最高频率1.3GHz

图形输出接口eDP/DP/HDMI/SDVO/CRT

图形处理器特性QuickSyncInTRU3DWirelessDisplayFDIClearVideoHDPCIExpress接口PCIExpress2.01x16,2x8,1x8+2x4

封装37.5mmx37,5mm(rPGA988B);31mmx24mm(BGA1023)

处理器理论性能测试

我们采用SiSoftwareSandraProfessionalBusiness2011进行处理器理论性能测试,重点考察处理器的整数/浮点运算、多媒体指令集、AES/SHA解密运算性能和内存整数/浮点带宽。

由于Corei52540M同其前辈i5540M二者在定位、定价、频率上都很接近,本次性能测试大多项目我们都会将二者进行直接对比,以探究全新的SandyBridge在性能上有多大的提升。

整数/浮点运算、多媒体指令集i52540M和i5540M大概有20%-50%不等的性能优势。

解密性能由于i52450M增加了AES指令集,性能优势高达110%。

而内存带宽测试由于SandyBridge内存控制器的改进,配合双通道DDR31333性能相比原有Arrandale架构的i5540M要高上80%以上,甚至还要高于桌面平台的Bloomfield三通道内存的性能,前面数学运算性能和多媒体性能的提升也很大程度得益于内存带宽的提升。

CINEBENCH性能测试

虽然CINBENCH是基于Cinema4D渲染软件的性能测试程序,但我们关心的并不仅仅是3D渲染性能,我们更多的是考量的是多线程性能和单线程效能,具体的测试成绩如下:

CineBenchR10的测试,i52540M相对540M的单线程和多线程性能为135%和126%,产生这个差异的主要原因是R10的多线程渲染线程分配机制不够灵活,影响了多线程的效率。

而R11.5则采用更为小的渲染线程分配机制,提升了并行度,i52540M相对540M的单线程和多线程性能均为127%。

另外我们注意到i5540M虽然多线程性能相比更高阶的四核乃至八核在整体上有较大的差距,但其在单线程效能上则十分出色,单线程1.25pts的性能不仅远远优于Arrandale,甚至在效能上优于3.33GHz的Nehalem-EP的W5590,这很大程度要得益于睿频技术,多线程渲染频率为3GHz,而单线程由于其他核心处于空闲,TurboBoost则是工作的单核心频率提升至3.3GHz.当然3.3GHz的3MB缓存的移动处理器可以在效能上干掉3.33GHz8MB缓存6.4GBQPI三通道内存的Nehalem-EP的W5590还是实属不易,这说明全新架构的SandyBridge在计算效能上的提升还是颇为巨大的。

实际应用性能测试

实际应用性能测试部分我们主要测试SandyBridge在WinRAR文件压缩,Photoshop图片处理和Mathermatica科学计算方面的性能。

WinRAR我们采用4.0内置的性能测试功能。

Photoshop图片处理我们使用最新的CS5版本,运行speedtest脚本,进行一系列图片缩放、旋转和滤镜操作,模拟真实实际PS应用的性能。

科学计算性能我们采用Mathermatica7内置的benchmark进行。

SandyBridge在一般应用性能的表现基本同其在理论测试中一直,用户的日常工作也会得益于SandyBridge的性能进化。

QuickSync编码性能测试

前面我们已经花费了不少笔墨介绍QuickSync编码,但QuickSync效能究竟和软件支持如何,相信这是用户更为关心的实际问题。

我们使用CyberLink出品的MediaEspresso6.5对QuickSync进行了性能测试。

最新版的MediaEspresso6.5已经在第一时间提供了对QuickSync技术的支持

测试我们选择从Apple上下载《变形金刚》的155MB容量的1080P宣传片,压制成1280x720H264视频编码AAC音频编码的影片,分别开启和关闭QuickSync进行性能测试。

在使用QuickSync后,压制时间从使用CPU压制的128秒减到17秒,速度提升了652%,QuickSync在效能上不仅相对于处理器压制有很大优势,并且其在性能上还远远优于使用NVIDIACUDA硬件编码的效能。

由于采用MediaEspresso6.5不同的编码方式生成的目标文件在码流上有所区别,我们并不能进行画质对比测试。

游戏性能测试

虽然笔者认为用笔记本玩游戏是自虐,但仍然有很多朋友关注SandyBridge的游戏性能,使得这部分仍然是不个或缺的环节。

CAPCOM的MTFramework引擎是最早支持DX10的引擎,其在《失落的星球》和《鬼泣4》都有很不错的表现,《生化危机5》也继续沿用了MTFramework引擎,我们选用《生化危机5》作为测试项目,其在很大程度可以反映HDGraphics3000在CAPCOM引擎架构下的处理效能,本次测试我们采用DX101366x768中等设定1xAA1xAF进行测试。

HAWX2(《鹰击长空2》)是Ubisoft开发的空战模拟游戏,其全面支持DX11,并使用Tessellation进行地形绘制,大幅提升游戏对于地形细节的表现,不过由于HDGraphics3000在API支持规格上的限制我们仅使用DX10渲染路径。

《生化危机5》和《鹰击长空2》在中设定下,从上一代的不可玩速度提升到可玩速度,使得HDGraphics3000用户可以去尝试一些新近游戏成为可能。

《魔兽世界》是其在底层还是基于老旧的DX8/9API,但考虑到其超高人气度本次测试将其作为测试项目,我们选用国服血精灵的新建角色的Flyby动画作为测试场景,虽然其负载相比大多游戏情况都轻,但其可以方便的重复使得测试结果更为精确。

HDGraphics3000在1366x768HQ1xAA1xAF的设定下平均帧数为35FPS,基本可以满足正常游戏的需要。

而3Dmark05,由于Shader的负载相当于前面几个游戏大幅加大,得益于HDGraphics3000Shader运算性能的提升,使得3Dmark05HDGraphics3000的性能优势十分明显。

尽管更多的执行单元和更高的频率使得SandyBridge集成的HDGraphics3000相比前代GMA在效能上是巨大的,但这个性能其实也仅能满足较为简单游戏的性能需求,指望其独挑大梁是不现实的

测试结语

从我们的性能测试方面,SandyBridge架构即使在产品频率和缓存规格上保持与上代产品先进,其性能也有明显的提升,单位频率效能的提升让我们感觉十分精细,特别是内存控制器效能的改进,使得移动版的SanyBridge效能甚至远远高于三通道的Bloomfield。

单从产品效能,竞争对手的产品对上代的Arrandale都追赶莫及,而SandyBridge则将差距继续扩大化,使得竞争对手根本无力在正面应对。

而Intel在价格策略上并没有因为压倒式的性能优势而提升售价,则以与上代持平的价格惠及用户,使得广大消费者仅需花费不多的金钱即可以获得更佳的性能

强调媒体创作能力是SandyBridge进化的一重要特点

当然,我们关注的不仅仅是单纯的处理器性能,SandyBridge的HDGraphics3000集成图像核心得益于更多的执行单元、更高的频率和更高效的架构,使得SNB的3D性能相比前代GMA提升也是巨大的,能够更好的满足入门级用户的性能需求,同时更为强大的多媒体功能也给用户带来了更佳的娱乐体验。

再回答开始的话题,直面用户需求,搭载SandyBridge产品在购置成本基本于上代平衡,而性能更好,这样"厚道"的加量不加价毫无疑问对于有购机计划的用户有很大吸引力,当读者读到本文的时候,Intel下游合作厂商已经为用户准备好了丰富的选择。

当然,竞争对手产品也许在单纯蛮力的速度比拼上并不是IntelSandyBridge的对手,但其也会利用自己同时作为CPU和GPU提供商的优势,将两者"融合"起来,这相比SandyBridge的"整合"层次更高,同样是我们不可否认的,相信届时Bobcat和Llano则会给SandyBridge带来一些麻烦。

特别声明:

1:

资料来源于互联网,版权归属原作者

2:

资料内容属于网络意见,与本账号立场无关

3:

如有侵权,请告知,立即删除。

希望以上资料对你有所帮助,附励志名言3条:

1、常自认为是福薄的人,任何不好的事情发生都合情合理,有这样平常心态,将会战胜很多困难。

2、君子之交淡如水,要有好脾气和仁义广结好缘,多结识良友,那是积蓄无形资产。

很多成功就是来源于无形资产。

3、一棵大树经过一场雨之后倒了下来,原来是根基短浅。

我们做任何事都要打好基础,才能坚固不倒。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1