手机主流处理器CPU参数及性能的总论暨高通联发科ARMWord文档下载推荐.docx

上传人:b****5 文档编号:19377336 上传时间:2023-01-05 格式:DOCX 页数:34 大小:3.35MB
下载 相关 举报
手机主流处理器CPU参数及性能的总论暨高通联发科ARMWord文档下载推荐.docx_第1页
第1页 / 共34页
手机主流处理器CPU参数及性能的总论暨高通联发科ARMWord文档下载推荐.docx_第2页
第2页 / 共34页
手机主流处理器CPU参数及性能的总论暨高通联发科ARMWord文档下载推荐.docx_第3页
第3页 / 共34页
手机主流处理器CPU参数及性能的总论暨高通联发科ARMWord文档下载推荐.docx_第4页
第4页 / 共34页
手机主流处理器CPU参数及性能的总论暨高通联发科ARMWord文档下载推荐.docx_第5页
第5页 / 共34页
点击查看更多>>
下载资源
资源描述

手机主流处理器CPU参数及性能的总论暨高通联发科ARMWord文档下载推荐.docx

《手机主流处理器CPU参数及性能的总论暨高通联发科ARMWord文档下载推荐.docx》由会员分享,可在线阅读,更多相关《手机主流处理器CPU参数及性能的总论暨高通联发科ARMWord文档下载推荐.docx(34页珍藏版)》请在冰豆网上搜索。

手机主流处理器CPU参数及性能的总论暨高通联发科ARMWord文档下载推荐.docx

然而,这部分理性如今却在逐渐消失。

一个被业内视为默认规则,而听起来又异常奇怪的现象是:

2012年之后的旗舰智能手机,没有几台能让CPU做到长时间满负荷工作不降频。

厂商不断地往手机里塞入更快、更强大的硬件,与此同时,却不得不限制它们的工作频率与工作时间。

你看到的产品手册上赫然写着“四核1.7GHz”,但实际使用中你永远无法得到这样的性能。

这方面的例子比比皆是,从Nexus4冷柜跑分暴涨30%,到K3V2的GPU频率缩水6成,大多数旗舰手机都无法发挥出它应有的性能。

来自Anandtech的著名测试:

把Nexus4扔进冰箱,结果跑分提升了20%以上!

根据第三方测试,目前的旗舰手机能以最高频率工作的时间少则数十秒,多的也只有几分钟,之后便不得不降低频率以缓解发热。

消费者听着“性能提升xx%”的宣传,花费高额费用抱着“四核1.7GHz”的手机回家,却只能享受30秒的快乐,这难道不是一种讽刺?

往一台手机里安装根本无法全速运行的“强大”处理器,与开头提到的往奇瑞上安装1000马力的发动机有什么区别呢?

下面的表格是一个实例:

LG为OptimusGPro配备了强大的骁龙600处理器,但持续高负载工作3分钟后,实际性能却不如搭载了上一代APQ8064芯片的SONYXperiaZ。

配置更高的新产品,在实际使用中却输掉了“性价比”,我们得到了配置,却没有得到性能。

你也许会说,反正价格没有更贵,能不能全速没啥损失,但这样的观点也是错误的。

记住:

你永远是在为手机的标称性能埋单,而不是为实际性能埋单。

八核手机即使只能发挥出四核手机的性能,它的价格也是“八核”级别的。

硬件上所有的成本最终都会以各种形式转嫁在消费者身上。

问题是:

我们为什么要为发挥不出来的性能埋单呢?

这样的趋势在2013年乃至更远的未来并没有缓解的迹象。

作为消费者,我们必须要明确自己的立场:

这种趋势是错误的,我们有必要制止它进一步恶化!

否则我们所付出的金钱将只能换来几个纸面上的数字,而“安装飞机发动机的自行车”迟早有一天要到来。

然而,指出错误很简单,纠正错误却很困难。

如果无法得到一个对于正确的评价标准,那么对于未来的分析也就没有意义,这就启发我们去寻找一些不会被技术所改变的东西,作为衡量正确与错误的标准。

接下来,我们将提出一个相对客观的评价标准,并以之为准绳,对2013-2014年市面上主流的手机处理器进行逐个分析。

“不可逾越之墙”

什么是技术所无法改变的事物?

对于智能手机而言,一是客观存在的物理定律,二是人的生理需求。

因为本文的主题是处理器,因此我们把目光集中在处理器系统上。

可以确定的是,只要技术还没有进步到手机可靠意念操作,那么人体对设备温度的可以接受上限就是确定的;

而只要手机还符合物理定律,在一定温度下它所能散发的热量也是固定的(不考虑主动散热,例如内置风扇),这就勾勒出了一条“生死线”——在舒适的前提下,一个确定尺寸的手机,所采用的硬件功耗,或者说处理器系统的功耗是有极限的,只要超越这条线,就必须要降低工作频率,否则将会无法阻止温度的上升,性能自然也就无从谈起。

因此我们认为,“手机的极限功耗不应该超过其最大可散热功耗”可以作为衡量产品的准绳。

长久以来,业界都习惯于用配置和价格的关系作为评价标准,但是如果联系到配置与性能脱节的现实,这个标准已经濒临失效,因此我们需要提出一个新的评判标准,不妨姑且将其称为“体效值”。

何谓体效值?

我们将体效值定义为设备体积与能耗系数的乘积,它代表了一台手机所可以连续提供的极限性能。

将这个参数与理论最大性能联合评价,能得出以下的结论:

如果系统的体效值小于最大性能,那么这套系统就必然是错误的,因为存在着浪费。

但是如果体效值大于最大性能,那么这套系统有可能陷入“性能不够用”的疑问。

最佳情况是体效值和最大性能一样,这意味着这套系统所蕴含的性能可以全部发挥,做到了设计可以得到的极限。

你可以把“体效值”简单理解为“每瓦特性能”。

手机绝对性能的测量相对简单,因此体效值中最关键的部分是“体”,即手机体积所能容纳的最大功率。

这方面目前没有明确的行业标准,因此我们需要做一些假设。

首先,我们假设在现在以与将来的一段时间内,手机将主要依靠外壳进行被动散热,不会像电脑一样引入风扇等主动散热手段。

其次,我们将人体感温度舒适上限设为40度,而耐受极限设为50度。

最后,我们将手机工作时环境温度设为25度,并且假定没有气流存在。

无外界对流时,手机的热量散发主要依靠空气的自然对流与本身的辐射。

假定手机的温度为介于舒适上限与耐受极限之间的45度,那么与环境温度的差值即为20度。

相对于手机这个体积的设备而言,四个边侧面的散热贡献可以忽略不计,主要的散热面为前后两个面。

计算时假定手机为垂直放置。

下面计算开始,首先计算对流散热量,我们选择iPhone5作为标准对象。

iPhone5的尺寸为123.8×

58.6×

7.6毫米,因此正面的面积为0.0073平方米。

垂直放置的情况下,iPhone5一个正面的传热系数为4.65W/(m2•℃),也就是说这样一个表面可以靠对流散发的热量是0.68W,由于有两个表面,因此靠机身自然对流可以散发的热量为1.36W。

考虑到还有侧边的存在,我们可以认为这个功率是1.5W。

接下来计算辐射热量。

由于iPhone5的材质是铝合金和玻璃,氧化铝合金的辐射率大约在0.3左右,而玻璃的辐射率大约是0.85,因此整体辐射率取0.6,那么在外壳温度整体为45度的时候,靠辐射可以散发的热量经过计算大约是1.16W。

也就是说,一台通体45度,垂直置于静态25度的环境中的iPhone5,可以散发的热量极限是2.66W。

实际环境中,考虑到用户体验,手机不会也不可能做到整机均匀发热,这无疑会降低手机的散热能力,但由于人体与手机的接触也可以带走一定的热量,因此两者互有增减,相信整体的散热功率不会与计算数值差距过大。

因此,大约2.66W就是iPhone5所能承受的最大整机功率(这里直接使用了整机功率,这是因为目前电子产品除了天线部分以外,消耗的电能绝大部分都转化成了热量,耗电量和发发热量基本相等)。

再来看看GalaxyS4。

由于计算的方式是一样的,因此过程就不给出了,唯一的不同是,作为塑料外壳的GalaxyS4,在热辐射效率上要远高于铝合金的iPhone5,具体来说在0.9左右(看来塑料机还是有一些好处的)。

结果直接给出,GalaxyS4在同等条件下的散热量为4.15W。

GalaxyS4旗舰安卓手机的代表,因此更大尺寸的机器我们就不计算了。

结果显而易见,对于iPhone5这种尺寸的手机而言,系统的极限功率是2.66W,而GalaxyS4尺寸的产品则为4.15W。

体积处于两者之间的产品,散热能力则介于它们之间。

至此,体效积中的体就已经有了结论。

因为这个参数是不会因为技术提升而改变的,所以它可以作为我们判定未来新技术与新可能的良好标准。

也就是说,对于一台5寸手机而言,我们可以得到的最大性能就是4.15W×

每瓦特性能,不论这台手机的理论性能有多么强大。

换句话说,只要一台5寸手机的整机最大功耗超过了4.15W,那么我们就一定可以判定:

它的性能无法发挥。

进一步的,对于一台手机而言,屏幕所占据的功耗大约从4寸的1.2W到5寸的1.8W不等,因此我们可以得出,极限散热功耗中,留给CPU、GPU、内存等计算系统的功耗上限,对于iPhone5尺寸的手机而言是1.5W左右,对于GalaxyS4尺寸的手机而言是2.5W左右。

需要说明的是,在计算散热量时,我们所关注的对象是手机外表面,至于内部是如何传热的,对结果不会有影响。

可能你会存在疑问,某手机内含热管,某手机拥有石墨散热膜,散热要好得多——这是错误的,辅助散热措施只是增加了手机内部的热传导效率,最终效果是提高手机整体的温度均匀性,而我们在计算的时候已经假定了这个数值是100%,也就是内部热传递设计为完美状态的极限结果。

至此,我们可以对智能手机“核战争”带来的问题给出一个精确的描述:

由于近年来手机配置的疯狂提升,导致手机的最大性能已经超越了体效值。

这个前提下,任何理论性能的提升都是纸面的,功耗已经成为了一堵不可逾越的墙。

在可以预见的未来,如果我们希望继续提升手机的性能,那就只能在能耗系数上下功夫。

带着这个结论,让我们来重新审视一番市面上的主流手机处理器。

产品审查:

高通骁龙800

首先我们来看一看高通。

之所以首先观察高通,是因为相对而言高通的产品是变化幅度最小的,因此我们可以借用的历史数据就最多。

在《四核处理器•上》成文时,高通的最新产品是S4ProAPQ8064。

而在我们撰写本文时,高通重新命名了它的产品线,S4Pro有了继任者骁龙600。

这是一颗和APQ8064区别很小的芯片,最大的提升在于内存从双通道LPDDR2533变成了双通道LPDDR31066,因此我们不打算深究这颗芯片。

高通的重头戏,以与下半年乃至明年的主打,将是骁龙800。

它拥有改进后的Krait400核心,主要改动是调整了内部缓存架构,降低异步设计带来的影响。

同时,骁龙800引入了HPM工艺,主频达到了2.3GHz,成为手机SoC中的一个超过2GHz大关的产品。

除此之外,骁龙800还集成了新的Adreno330GPU,性能与规模再次翻倍。

文件压缩速度,骁龙600的Krait300内核同频性能甚至不如CortexA7

相信看过之前的文章后,现在的你已经不会被上面充满诱惑力的宣传所击倒。

是的,我们再次重复一遍:

绝对性能的提升没有意义,决定用户体验的是体效值,或者说每瓦特性能。

那么骁龙800的每瓦特性能有没有提升呢?

首先我们来看一看CPU部分。

由于缓存的增强,Krait400核心的执行效率必然会得到一定的提升,但是Krait核心从本质上来说依然是一个“增肥”版的CortexA9,它所面对的最大问题其实是由于指令队列的不足,导致架构的IPC受限。

Krait的后端就像是规模巨大的工厂,而经过持续的升级,Krait的前端已经从小港口变成了大型码头——但是连接它们的依然只是一条省道。

这样的架构也许可以在理论测试中获得极高的成绩,但是在实际变幻莫测的应用代码面前,往往无法发挥应有的效率,根据某些第三方测试,在诸如视频解码、文件压缩与解压缩等应用中,Krait300核心的同频性能有时会不如CortexA9甚至A7。

这虽然不足以定性的给这个架构下结论,至少也可以说明一部分的问题。

因此,综合来看,Krait系列核心的能耗,恐怕是比较悲观的,即APQ8064的执行效率并不如CortexA9,Krait400核心虽然经过了两次升级,但是考虑到Krait300的实际表现,我们认为其执行效率至多只能达到略高于A9的水平。

也就是说,Krait400架构效率上并没有大幅超越CortexA9。

那么产品效率呢?

在这之前笔者需要稍微岔开一些话题。

不知道你是否发现,我们在对比效率的时候往往都会和CortexA9相比,准确来说是和SAMSUNGExynos4412相比。

为何要用它作为基准?

这并不是因为偏心或是对于三星有着额外的好感,原因很简单,那就是根据之前我们对手机极限功耗的定义,在那样的功耗限制之下,Exynos4412是体效值与绝对性能之间最接近的产品:

Exynos4412的核心,工作在1.4GHz时单颗功耗约为440mW,1.6GHz约为600mW,总功耗即为1.8W与2.4W。

因此Exynos4412是一个极好的标准——如果有产品的效率比4412高,它就可以发挥出比4412更加优越的实际性能,否则就只能在降频中工作。

在骁龙800以外的产品中,高通采用的是28LPSiON/Poly工艺,这会导致漏电增加,继而降低能耗比。

在上篇中我们引用外媒Anandtech的结论,得知28LP工艺的骁龙APQ8064,运行在1.5GHz的频率下,单个核心的功耗大约是700mW。

而到了骁龙800,高通终于引入了先进的HKMG技术,将工艺更换为了28HPM。

那么,这个工艺是否能提升骁龙800的能耗比?

根据TSMC对于28HPM的工艺描述,我们认为这个答案同样也许是比较悲观的,因为28HPM本质上是用来提升性能的工艺,它的主要目的是让骁龙800得以运行在使用28LP的骁龙600所无法达到的高频下,但是处理器本身的漏电并不会因此而减小。

台积电四种28纳米工艺的区别

我们粗略估计,运行在2.3GHz下的Krait400核心,即便只考虑频率的提升,单个核心满载的功率也将超过1W,四核心的总功耗则会远超2.5W的散热功耗上限。

至于能耗比,在低频段,骁龙800的能耗比也许可以略超龙600,但是总体来说我们并不认为骁龙800在CPU部分的能耗比会大幅领先于CortexA9,也就是说骁龙800的体效值将明显小于极限性能。

按照我们之前的分析,骁龙800在手机上的长期性能表现就将不会比CortexA9提升太多(短期性能表现,例如基准测试,会因为设备的热容以与温度滞后效应而大幅提升,但是只要工作足够长——不超过三分钟——的时间后,性能将会降低到CortexA9水平)。

使用工具监控骁龙APQ8064的CPU频率变化,运行2分钟以后,CPU频率降低到了1GHz以下

那么GPU部分呢?

这方面的问题可能会比CPU更加严重。

高通Adreno300系列GPU的超低能耗比已经是众人皆知的问题,其严重程度远超CPU。

由于GPU相对于CPU而言是低频大规模电路,因此它对于漏电的敏感程度要远高于CPU,对于频率的敏感程度则不如CPU。

骁龙800所集成的Adreno330相对于Adreno320而言规模提升了一倍,因此功耗的提升幅度自然也不会小到哪里去,我们假定Adreno330可以借助HPM工艺,完全避免功耗的提升,它的能耗比能有多高?

使用工具监控骁龙600的CPU频率变化,Krait300核心根本无法维持全速工作

对于这个问题,我们可以通过一个粗略的测试来判断。

GalaxyS4和配备了骁龙600的手机,在3Dmark中的得分基本是一样的,但是根据耗电量得出的整机功耗估值方面,GalaxyS4所具备的SGX544MP3GPU的功耗几乎只有Adreno320的15%甚至更低,换句话说就是SGX544MP3的能耗比几乎是Adreno330的7倍——实际上,根据粗略测试的结果,Adren320的功耗已经达到了大约6W,不论这个数字是否精确,Adren320早已远远超过了2.5W,甚至4.15W的散热功耗极限。

性能翻倍dreno330即使维持功耗不变,也将和CPU一样,在实际工作中也将永远不可能发挥出其最大性能,它的体效值同样远远小于理论最大性能。

最终,我们对于骁龙800的预期表现是比较悲观的。

我们认为,在CPU部分,配备骁龙800的产品,并不能让用户得到远超四核心CortexA9——如宣传、测试以与参数上那样——的实际体验,而GPU方面则更会远远不如SGX544MP3,不论理论测试有多么强大。

骁龙800并没能有效提升能耗比,因此装有骁龙800的产品,其体效值将远远小于宣传的性能,作为结果,消费者购买的大部分参数和数字,将会永远停留在纸面上——当然,还有基准测试软件里。

Tegra4与Tegra4i

虽然都属于Tegra4家族,但是实际上Tegra4和Tegra4i的核心并不一样:

前者基于CortexA15,而后者基于改进版CortexA9。

对于后者我们不会多加论述,我们将主要关注前者。

如同Tegra3,Tegra4也引入了nVIDIA自行设计的vSMP4+1技术。

因此对于Tegra4的效率分析,将会分为两个部分:

4核部分与附加单核部分。

首先是4核部分。

Tegra4的所有核心都是典型的CortexA15架构,工艺使用了TSMC28HPL,因此对于这一部分的分析我们可以找到一个极好的参照物,那就是Nexus10所配备的Exynos5250。

后者是一枚双核CortexA15、32nmHKMGLP工艺、工作频率1.7GHz的SoC。

根据已有的测试结果,Exynos5250的CPU功耗为4W,也就是说单核功耗为2W。

这项对于Exynos4412的440/600mW而言是一个相当大的数值,这也意味着CortexA15的性能必须要四倍于CortexA9,才可以维持效率的一致。

NV做到了吗?

很明显,也很遗憾,没有。

CortexA15的性能提升幅度远远没有功耗提升幅度大,两者之间的差距导致了CortexA15的每瓦特性能相对于CortexA9来说有着至少一半的下降。

那么回头来看看Tegra4。

由于核心是一样的,我们只需要对比工艺。

TSMC28HPL相对于三星32nmHKMGLP,究竟有没有性能和漏电方面的提升我们很难判断,但是大体上两者属于同一时代的同一水准工艺,相信差距并不会过大,我们假设台积电的28LP工艺总体能耗比三星降低30%——这已经几乎是同一代工艺可以存在的最大差距——这也远不足以抵消CortexA15和CortexA9近乎200%的差距,更何况Tegra4的主频高达1.9GHz,这进一步降低了它的功耗可以低于2W/核心的可能性。

这也就意味着,即便只有一颗核心工作,Tegra4的功耗就已经逼近了4寸手机的散热功耗极限,而四核同时工作,如果不加限制,CPU部分的总功耗必将轻松突破8W。

Tegra4功耗有多大NV很清楚,所以给自家的Shield游戏机装上了风扇!

既然能耗比如此之低,那么技术有何改变、理论性能有何提升、在哪里提升就完全没有意义了。

在手机上,Tegra4的四枚CortexA15所能发挥出的长期性能,除了极少数情况下,可以几乎肯定的说,将远不如一个设计优秀的四核CortexA9处理器。

那么辅助的拌核部分呢?

NV没有公布拌核的细节资料,我们假设它工作在1GHz,由于HPL工艺带来的低漏电,预计可以让这枚核心的功耗降低到0.6W左右,大约等同于一颗1.6GHz的CortexA9。

在这个工作条件下,CortexA15的能耗比和CortexA9比较接近,因此它们具备了接近的体效值。

但是此时的Tegra4,绝对性能只有四核CortexA9的四分之一,体效值远远高于绝对性能,这也就意味着此时的Tegra4会因为过慢而无法满足用户需求。

综上所述,Tegra4不论在哪个模式下,所能提供的最大性能都难以超越四核心CortexA9处理器,把这样一颗处理器做进手机唯一的意义也许只有一个——想方设法让手机坚持满载运行三分钟,跑出一个惊世骇俗的基准测试分数,给手机发烧友作茶余饭后跑分攀比的资本,就好比购买超级跑车上下班,除了炫耀以外没有任何意义。

至于Tegra4的GPU部分,由于目前资料较少,所以无法给出分析对比。

当然我们也需要明白,Tegra4的悲剧并不全是由于Tegra4本身或是nVIDIA的技术实力导致的,究其根本,元凶还是CortexA15核心过低的能耗比。

这也决定了不仅是nVIDIA,其他任何试图在产品中引入标准CortexA15架构的厂家,例如未来的华为海思K3V3,最终都将难逃“性能超不过A9”的魔咒。

对于手机等便携式设备而言,CortexA15毫无疑问是一个失败的设计,也无怪乎高通和苹果在几年前就决定放弃这个架构,自行以CortexA9为基础发展自己的强化核心。

这也从另一个方面看出,至少在目前可以看到的ARM产品中,CortexA9依然是可以提供最强实际性能的产品,即便它已经问世超过了2年。

最后提一下Tegra4i。

相信NVIDIA规划这样一个产品,也是因为NV实际上非常明白CortexA15是一颗怎样的核心。

因此,我们甚至可以理解为,Tegra4i才是针对手机市场所推出的高性能产品。

改进的CortexA9r3p1核心可以带来最多15%的同功耗性能提升,也就是更高的体效值与实际性能。

但是Tegra4i却如同骁龙800一般选择了HPM工艺,并且因为需要集成基带而无法在2013年上市,这对于Tegra4i和NVIDIA而言无疑是彻头彻尾的悲剧,尤其是如今CortexA12箭在弦上的情况下。

如果说CortexA15可以看作ARM在被成功冲昏了头脑之后的大跃进,那么后者就可以看作是ARM在大跃进失败后的反省之作,肩负了CortexA9正统继任者的使命。

对于它,我们在后面予以讨论,这里暂不多言。

三星Exynos5Octa

最后来谈一谈技术最为复杂,同时争议也最大的三星Exynos5Octa(Exynos5410)。

这个芯片最大的特色就是整合了ARM的big.LITTLE技术,内部集成了8个核心——四个CortexA15为一组,四个CortexA7为一组,从而成为了手机上第一枚超越四核的片上系统。

也许你会提出质疑,NV的Tegra3和Tegra4实际上也拥有5个核心,为什么它不能算作是五核SoC呢?

原因很简单,因为Tegra多出来的那一枚核心其实设计上是作为四个主核心其中之一的映射,在实际工作中系统是识别不出这一颗核心的。

但Exynos5Octa不同,它的八颗核心在某些情况下是可以同时运行的,因此可以称之为八核SoC,虽然实际情况下这样的工作模式不一定会被用上,关于这点,即Exynos5Octa是否是伪八核,同样也是围绕这颗芯片的众多争议中最大的一个,对此后面我们会详细讨论。

除了big.LITTLE以外,Exynos5Octa本质上是一颗非常典型的处理器,它拥有标准的CortexA15核心、标准的ARM系统IP,支持的规格与系统配置也一如三星以往的风格,顶级而不顶尖。

LPDDR31600的内存支持与12.8GB/s的理论带宽在手机SoC中实为翘楚,而PowerVRSGX5

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 公共行政管理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1