02GHz主频差距可有可无至强E31220和E31240对比评测.docx
《02GHz主频差距可有可无至强E31220和E31240对比评测.docx》由会员分享,可在线阅读,更多相关《02GHz主频差距可有可无至强E31220和E31240对比评测.docx(26页珍藏版)》请在冰豆网上搜索。
02GHz主频差距可有可无至强E31220和E31240对比评测
0.2GHz主频差距可有可无?
至强E3-1220和E3-1240对比评测
服务器作为一种定制化的工具,各类别之间相差甚大,即使是同一系列的服务器,由于配置(包括处理器、内存、硬盘、Raid卡等等)差异,在性能上也会体现出很大的区别。
处理器作为重要的组成部分之一,采购过程中,人们都习惯性的选择主频更高的,而对其中有多大的区别或许并不了解,IT168将通过对同一台服务器不同的处理器进行测试,为广大用户提供选购参考,今天我们采用的测试服务器为HPDL120G7,测试的处理器为E3-1220和E3-1240。
惠普ProLiantDL120G7是一款采用1U高度的机架式服务器,搭载了至强E3处理器平台。
惠普ProLiantDL120G7服务器前后视图
前置USB接口和状态指示灯
惠普ProLiantDL120G7的前面板设计比较简单,提供了4个3.5英寸的硬盘位,可以支持SATA或SAS硬盘,后面板设计也比较简单。
惠普ProLiantDL120G7开箱图
惠普ProLiantDL120G7的内部空间非常宽敞。
它内部有4个风扇用来散热,其中3个负责给处理器、内存等关键部件散热,1个用作阵列卡的散热。
为了有效提升散热效果,惠普ProLiantDL120G7服务器在处理器和内存部分还有一个导风罩,可以更好的促进空气流动。
惠普ProLiantDL120G7配备的电源
惠普ProLiantDL120G7标配了台达400W电源,对于E3这样低功耗的平台来说,400W已经足够。
惠普ProLiantDL120G7服务器内部拆解
至强E3-1220处理器
至强E3-1240处理器
这次我们对比的是Intel至强E3平台下的两款处理器,分别为E3-1220和E3-1240,其中E3-1240处理器,主频为3.3GHz,具备4核心8线程,TDP为80W;而E3-1220处理器主频为3.1GHz,4核心4线程,TDP同样为80W,为了单纯的比较主频对于服务器性能的影响,特意将E3-1240的超线程功能关掉,因而两颗处理器测试中均为4核心4线程,特此说明。
惠普ProLiantDL120G7服务器内存
应对我们测试的要求,惠普ProLiantDL120G7服务器一共配置了4条4GBDDR3ECC内存,总容量16GB对于日常的E3处理器应用来说已经完全够用。
西部数据WD5003ABYX
惠普ProLiantDL120G7服务器采用了西部数据WD5003ABYX硬盘,容量为500GB。
测试中我们使用这些硬盘组建了RAID5阵列。
惠普ProLiantDL120G7服务器配备的阵列卡
惠普ProLiantDL120G7服务器提供了一个P212阵列卡,并提供了对应的内存和电池。
这块阵列卡可以实现RAID5、RAID6等常用阵列和RAID0、RAID1等基本阵列。
服务器扩展槽位置
惠普ProLiantDL120G7服务器提供了4个扩展槽,分别是PCI-EX16、PCI-EX8和PCI-EX4。
板载的显示芯片
板载的英特尔千兆网络芯片
惠普特色的iLO3远程管理芯片
服务器测试环境介绍
为了进行网络产品的测试,IT168评测中心专门组建了网络实验室,并搭建了一个有60台客户端的网络测试环境,通过控制端并利用专业的网络测试软件,可以构建出多样化的网络访问模型,能够产生真实的多用户网络应用环境。
可以对服务器类设备进行不同应用下的高压力性能测试,以直观的结果反映出服务器产品在用于不同应用时其真实的性能状况。
我们采用千兆交换机作为测试环境的交换设备,60台单路服务器作为客户端,能产生足够大的网络访问压力,因而可以测试服务器类设备在实现不同应用时的极限性能。
网络实验室控制台
千兆交换机,120个千兆网口
用于产生用户访问压力的塔式服务器
服务器测试工具介绍
对于服务器性能方面的考察,我们主要分为子系统测试和应用性能测试。
在子系统测试中我们按处理器、内存以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。
处理器子系统测试
对服务器处理器子系统的考察,我们主要采用的是业界公认的SPECCPU2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。
SPECCPU2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。
此外SiSoftwareSandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。
也可以用作不同处理器间运算效率的比较。
SPECCPU2006v1.1
SPEC是标准性能评估公司(StandardPerformanceEvaluationCorporation)的简称。
SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPECCPU2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPECCPU2000。
和上一个版本一样,SPECCPU2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPECCPU2006中对SPECCPU2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPECCPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPECCPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPECCPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。
SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了IntelC++11.1.034Compiler、IntelFortran11.1.034Compiler这两款SPECCPU2006必需的编译器,通过最新出现的QxS编译参数,IntelCompiler10版本开始支持对IntelSSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。
我们另外安装了MicrosoftVisualStudio2003SP1提供必要的库文件。
按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。
我们根据被测系统选择实际可同时处理的线程数量,最后得到SPECratebase测试结果(基于base标准编译,SPECbaserate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPECCPU2006需要大量的系统物理内存,我们的SPEC测试在64位的WindowsServer2008R2下完成,对于每个运算核心,最低配置1.5GB内存。
内存子系统测试
对于内存子系统的考察,也是利用SiSoftwareSandra来实现,在该软件中有相应组件可进行内存带宽、内存延迟等方面的测试。
SiSoftwareSandrav2011
SiSoftwareSandra是一款可运行在32bit和64bitWindows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。
从2007开始,Sandra的Arithmeticbenchmarks增加了对SSE3&SSE4SSE4的支持,在Multi-Mediabenchmark中增加了对于SSE4的支持,另外还升级了FileSystembenchmark和RemovableStoragebenchmark两个子项目。
对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftwareSandra2011对NUMA架构以及最新的Windows7/WindowsServer2008R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。
SiSoftwareSandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。
惠普ProLiantDL120G7服务器配置一览
平台信息服务器
产品名称
惠普DL120G7服务器
惠普DL120G7服务器
平台类型
单路SandyBridge-E3
单路SandyBridge-E3
处理器子系统
处理器型号
IntelXeonE3-1220
IntelXeonE3-1240
处理器架构
Intel32nmSandyBridge
Intel32nmSandyBridge
代号
SandyBridge
SandyBridge
处理器封装
Socket1155LGA
Socket1155LGA
核心/线程数量
4/4
4/4
主频
3.1GHz
3.3GHz
处理器指令集
MMX,SSE,SSE2,SSE3,
SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX
MMX,SSE,SSE2,SSE3,
SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX
外部总线
DMI
5.0GT/S
DMI
5.0GT/S
L1CodeCache
4×32KB8路集合关联
4×32KB8路集合关联
L1DataCache
4×32KB4路集合关联
4×32KB4路集合关联
L2Cache
4×256KB8路集合关联
4×256KB8路集合关联
L3Cache
8MB16路集合关联
8MB16路集合关联
服务器主板
型号主板
惠普ProLiantDL120G7
惠普ProLiantDL120G7
主板芯片组
惠普ProLiantDL120G7
惠普ProLiantDL120G7
北桥芯片特性
2×QPI
VT-dGen2
2×QPI
VT-dGen2
子系统内存
控制器内存
每集成双通道U-ECCDDR31333CPU
每集成双通道U-ECCDDR31333CPU
内存类型
4GBR-ECCDDR31333SDRAM×4条
4GBR-ECCDDR31333SDRAM×4条
存储子系统
磁盘控制器
LSIEmbeddedMegaRAIDSASRAIDController
LSIEmbeddedMegaRAIDSASRAIDController
磁盘控制器规格
4xSATA3Gb/s
MatrixRAID0/1/3/5
4xSATA3Gb/s
MatrixRAID0/1/3/5
控制器驱动
LSIMegaSR
13.06.0212.2009
LSIMegaSR
13.06.0212.2009
型号数量硬盘
LSIMegaSR
13.06.0212.2009
LSIMegaSR 13.06.0212.2009
规格硬盘
7200RPM
500GB
SATA3Gbps
16MBCache
7200RPM
500GB
SATA3Gbps
16MBCache
软件环境
操作系统
MicrosoftWindowsServer2008EnterpriseR2x64
MicrosoftWindowsServer2008EnterpriseR2x64
由于我们采用的是同一台服务器进行测试,并且关掉了E3-1240的超线程功能,因此,除了主频上的差异,其它并无区别。
处理器详细规格
至强E3-1240处理器是至强E3家族的中端产品,而E3-1220是E3系列的低端产品,下面我们通过CPU-Z软件来查看它的详细信息。
至强E3-1240处理器信息
至强E3-1220处理器信息
16GB内存容量
SisoftwareSandra2011处理器性能
SiSoftwareSandraProBusiness2011
产品名称
HPDL120G7
HPDL120G7
平台类型
单路IntelSandyBridge
单路IntelSandyBridge
处理器型号
至强E3-1240(关超线程)
至强E3-1220
ProcessorArithmeticBenchmark
处理器算术运算测试
总计本地功效
71GOPS
66.64GOPS
总计本地功效对比速度
19.22MOPS/MHz
19.64MOPS/MHz
DhrystoneiSSE4.2
103.54GIPS
97.44GIPS
DhrystoneiSSE4.2vsSPEED
28.04MIPS/MHz
28.73MIPS/MHz
WhetstoneiSSE3
48.63GFLOPS
45.57GFLOPS
DhrystoneiSSE3vsSPEED
13.17MFLOPS/MHz
13.43MFLOPS/MHz
ProcessorMulti-MediaBenchmark
处理器多媒体测试
总计多媒体功效
130.75MPixel/s
123MPixel/s
总计多媒体功效对比速度
35.41kPixels/s/MHz
36.28kPixels/s/MHz
Multi-MediaIntx16iSSE4.1
158.52MPixel/s
149.2MPixel/s
Multi-MediaIntx16iSSE4.1vsSPEED
42.94kPixels/s/MHz
43.99kPixel/s/MHz
Multi-MediaFloatx8iSSE2
107.84MPixel/s
101.51MPixel/s
Multi-MediaFloatx8iSSE2vsSPEED
29.21kPixels/s/MHz
29.93kPixels/s/MHz
Multi-MediaDoublex4iSSE2
58.56MPixel/s
54.86MPixel/s
Multi-MediaDoublex4iSSE2vsSPEED
15.86kPixels/s/MHz
16.17kPixels/s/MHz
Multi-CoreEfficiencyBenchmark
处理器效能测试
内联核带宽
8.63GB/s
8GB/s
内联核带宽对比速度
2.39MB/s/MHz
2.44MB/s/MHz
内联核延迟(越小越好)
39.2ns
42.0ns
内联核延迟对比速度(越小越好)
0.11ns/MHz
0.12ns/MHz
Java算数性能测试
总计Java功效
58.58GOPS
57GOPS
总计Java功效对比速度
16.31MOPSMHz
16.81MOPSMHz
DhrystoneJava
108.55GIPS
109.83GIPS
DhrystoneJava对比速度
30.22MIPS/MHz
32.38MIPS/MHz
WhetstoneJava
31.6GFLOPS
29.6GFLOPS
WhetstoneJava对比速度
8.80MFLOPSMHz
8.73MFLOPS/MHz
Java多媒体性能测试
总计多媒体Java功效
18MPixel/s
17MPixel/s
总计多媒体Java功效对比速度
4.88kPixels/s/MHz
4.99kPixels/s/MHz
多媒体整数x1Java
20.68MPixel/s
19.4MPixel/s
多媒体整数x1Java对比速度
5.60kPixels/s/MHz
5.72kPixels/s/MHz
多媒体浮点数x1Java
15.7MPixel/s
14.79MPixel/s
多媒体浮点数x1Java对比速度
4.25kPixels/s/MHz
4.36kPixels/s/MHz
多媒体双精度x1Java
16MPixel/s
14.76MPixel/s
多媒体双精度x1Java对比速度
4.32kPixels/s/MHz
4.35kPixels/s/MHz
.NETArithmeticBenchmark
.NET算术运算测试
总计.NET功效
21.32GOPS
19.77GOPS
总计.NET功效对比速度
5.77MOPS/MHz
6.00MOPS/MHz
Dhrystone.NET
15.26GIPS
14.15GIPS
Dhrystone.NETvsSPEED
4.13MIPS/MHz
4.30MIPS/MHz
Whetstone.NET
29.77GFLOPS
27.63GFLOPS
Whetstone.NETvsSPEED
8.06MFLOPS/MHz
8.39MFLOPS/MHz
.NETMulti-MediaBenchmark .NET多媒体测试
总计多媒体.NET功效
14.85MPixel/s
14MPixel/s
总计多媒体.NET功效对比速度
4.02kPixels/MHz
4.14kPixels/s/MHz
多媒体整数x1.NET
28.24MPixel/s
26.54MPixel/s
多媒体整数x1.NETvsSPEED
7.65kPixels/s/MHz
7.82kPixels/s/MHz
多媒体浮点数x1.NET
7.8MPixel/s
7.41MPixel/s
多媒体浮点数x1.NETvsSPEED
2.12kPixels/s/MHz
2.19kPixels/s/MHz
多媒体双精度x1.NET
15.63MPixel/s
14.74MPixel/s
多媒体双精度x1.NETvsSPEED
4.23kPixels/s/MHz
4.35kPixels/s/MHz
测试成绩中我们可以看到,由于存在0.2GHz的主频差距,两款处理器之间的测试成绩略微存在差距,经粗略计算,各项测试成绩基本与主频成正比。
SisoftwareSandra2011内存缓存性能
SiSoftwareSandraProBusiness2011
产品名称
HPDL120G7
HPDL120G7
平台类型
IntelSandyBridge
IntelSandyBridge
处理器型号
至强E3-1240(关超线程)
至强E3-1220
MemoryBandwidthBenchmark
内存带宽测试
总体内存性能
17.3GB/s
17.27GB/s
总体内存性能对比速度
13.29MB/sMHz
13.28MB/sMHz
整数B/FiSSE2内存带宽
17.3GB/s
17.27GB/s
整数B/FiSSE2内存带宽对比速度
13.30MB/sMHz
13.28MB/sMHz
整数B/FiSSE2内存带宽
17.29GB/s
17.27GB/s
整数B/FiSSE2内存带宽对比速度
13.29MB/sMHz
13.28MB/sMHz
MemoryLatencyBenchmark
内存延迟测试
内存延迟(越小越好)
75.3ns
76.6ns
内存延迟对比速度(越小越好)
0.06ns/MHz
0.06ns/MHz
速度因素(越小越好)
68.10
64
内部数据高速缓存
4clocks
4clocks
二级板载高速缓存
11clocks
11clocks
三级板载高速缓存
35clocks
35clocks
CacheandMemoryBenchmark 缓存及内存测试
缓存/内存带宽
95.33GB/s
91.86GB/s
缓存/内存带宽对比速度
27.18MB/s/MHz
27.73MB/s/MHz
速度因素(越小越好)
38.10
35.90
内部数据高速缓存
410.2GB/s
386GB/s
二级板载高速缓存
345.3GB/s
323.66GB/s
三级板载高速缓存
172.8GB/s
165GB/s
由于内存测试和主频关系不大,我们看到内存带宽及内存延迟几乎没有差距,只是在缓存测试中有一些区别。
SPECCPU2006处理器子系统性能测试
SPEC是标准性能评估公司(StandardPerformanceEvaluationCorporation)的简称。
SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPECCPU2006是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。
计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPECCPU2006的影响比较小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。
SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
为了运行SPECCPU2006测试,我们统一安装了WindowsServer2008Enterprisex64EditionSP1操作系统,在主流的x64处理器下,原生64应用要比32位下快。
我们还安装了VisualStudio2005SP1、IntelC++/FortranCompiler10.0.025编译器,对于支持SSE3指令集的处理器,我们使用了QxO编译指令进行了优化。
编译时未使用SmartHeap商业优化库。