AI芯片制造行业华为分析报告.docx
《AI芯片制造行业华为分析报告.docx》由会员分享,可在线阅读,更多相关《AI芯片制造行业华为分析报告.docx(15页珍藏版)》请在冰豆网上搜索。
AI芯片制造行业华为分析报告
2017年AI芯片制造行业华为分析报告
2018年1月
目录
一、全球首个手机AI芯片麒麟970发布,AI芯片产业迈出重要一步................................................................................................................4
1、华为发布全球首款移动AI芯片......................................................................4
2、AI技术授权来源:
AI独角兽寒武纪备受关注.............................................6
3、AI芯片从云端走向终端..................................................................................9
二、智能芯片是人工智能的根本..........................................................11
1、人工智能市场热度不断提高..........................................................................11
2、CPU、GPU难以满足深度学习计算任务,AI芯片应运而生....................12
3、AI芯片的三条技术路径:
GPU、FPGA和ASIC.......................................14
三、云计算业务成华为第四大BG.......................................................16
1、CloudBU升至华为旗下一级组织................................................................16
2、脱离现有IPD流程,构建云业务新商业模式..............................................17
四、中国公有云市场增长强劲..............................................................18
1、需求和技术双重促进使得云服务成为生产力工具......................................18
2、政策推动行业发展,中国公有云市场增长潜力巨大..................................19
3、中国公有云IaaS格局未定.............................................................................21
五、从企业服务切入公有云,华为竞争优势显著..............................22
1、品质优秀、品牌影响力强大..........................................................................22
2、公有云和私有云优势互补..............................................................................23
3、企业级IT生态较为完善,政企市场优势突出.............................................23
六、相关企业..........................................................................................25
华为近日发布了全球首款移动AI芯片麒麟970。
并且,公司发布消息,华为云CloudBU现已调整为一级部门,与企业BG、运营商BG、消费者BG并列。
1.华为发布全球首款移动AI芯片,标志着AI计算从云端走向终端迈出关键一步。
从随时性、实时性和隐私性等角度考虑,不可能将所有的人工智能任务都放在云端进行,AI本地处理能力也不可或缺。
与服务器端AI设计不同的是,麒麟970选择了具有高能效的异构计算架构来大幅提升AI的算力,新的计算架构及计算单元对于机器学习任务处理性能(相对于手机CPU)提升了数十倍,最高可达到传统处理器25倍速度,50倍能效。
2.人工智能市场热度不断提高,智能芯片是承载计算功能的基础部件,对人工智能未来的发展起到决定性作用。
随着AI市场热度不断提升,CPU、GPU难以满足深度学习复杂的计算任务,AI芯片应运而生。
当前人工智能芯片主要分为GPU、FPGA和ASIC。
如今科技巨头华为发布全球首款移动AI芯片,抢先占领科技制高点,为其未来业绩腾飞奠定了坚实的基础。
3.华为云CloudBU成华为第四大BG。
公司首次同意该部门不用执行公司统一的IPD流程,这意味着CloudBU在一定程度上可以脱离华为现有IPD流程和管理体系,根据云业务的特点,构建新的商业模式、管理流程,为未来云业务的发展奠定了重要基础。
4.中国公有云市场增长强劲。
据IDC预计,2020年之前公有云市场以每年32.2%的速度增长,2020年规模将超过50亿美元,行业增长潜力巨大。
并且目前中国公有云IaaS格局未定,除阿里云外,其它公有云的市占率均在10%以下。
5.微软公有云Azure的强势崛起表明从企业服务切入公有云是一条可行的道路,与微软类似,华为在企业级服务方面同样具备优势:
1)品质优秀、品牌影响力大2)公有云和私有云优势互补3)企业级IT生态较为完善,政企市场优势突出。
一、全球首个手机AI芯片麒麟970发布,AI芯片产业迈出重要一步
1、华为发布全球首款移动AI芯片
德国当地时间9月2日,华为在柏林IFA2017大展上举办新品发布会,正式发布了传闻已久的新一代旗舰级芯片——麒麟970,同时这也是全球首款内置神经元网络单元(NPU)的人工智能处理器。
在手机侧,由于具备随时性、实时性和隐私性等重要特点,AI本地处理能力就变得尤为重要,当前手机侧的性能问题已经成为阻碍移动AI技术发展的最大掣肘。
与服务器端AI设计不同的是,麒麟970选择了具有高能效的异构计算架构来大幅提升AI的算力,以应对与数据中心完全不同的挑战。
在麒麟970之前,华为在自主研发SoC的道路上走了十年,麒麟970在性能上取得了六大突破:
第一:
领先工艺:
TSMC10nm,55亿个晶体管,而堆砌晶体管往往是提升性能的一个非常直接的表现。
作为对比,2017年初发布的高通骁龙835晶体管数量为30亿,2016年9月随着iPhone7/7Plus亮相的苹果A10Fusion晶体管规模为33亿。
此次麒麟970集成的晶体管数量达到了55亿,功耗大幅下降了20%。
第二:
NPU:
HiAI移动计算架构,相比四个Cortex-A73核心,处理同样的AI任务,大约50倍能效和25倍性能优势。
第三:
CPU:
CPU继续沿用大小核设计,由4×Cortex
A73@2.4GHz,加上4×CortexA53@1.8GHz,相比上一代16nm工艺的麒麟960能效提升20%。
第四:
GPU:
首发MaliG72MP12,图形处理性能提升了20%,能效提升近50%。
同时它还集成了4.5GLTECat.18基带芯片,峰值速度高达1.2Gbps。
第五:
摄影升级:
升级自研双ISP,人工智能场景识别、人脸追焦、智能运动场景检测,夜拍效果增强。
第六:
网络升级:
4.5GLTECat.18,1.2Gbps峰值下载数据,能在全球范围内实现各运营商的最高速率组合。
2、AI技术授权来源:
AI独角兽寒武纪备受关注
寒武纪科技(Cambricon)获得了一亿美元A轮融资,是目前国内人工智能芯片领域初创公司所获得的最高融资记录,也使得这家公司逐渐走入了更多人的视野。
麒麟970的AI技术授权就来源于寒武纪,该公司由计算所体系结构国家重点实验室的两位研究员陈云霁和陈天石联合创立。
进入计算机所后,哥哥主攻芯片,是研究“龙芯”的成员,目前仍在计算机所担任研究员,弟弟主攻人工智能,成立公司后任CEO一职。
寒武纪在人工智能领域研究成果突出:
2013年研制了全球首个深度学习处理器,相关工作获得了处理器架构领域顶级会议ASPLOS的最佳论文奖,这也是亚洲机构首次获得这样的荣誉。
2016年3月,寒武纪-1A(Cambricon-1A)问世,这也是全球首个商用深度神经网络处理器IP(IntellectualProperty),可集成至各类终端SoC芯片中,并在世界互联网大会上获颁“领先科技成果”,在人工智能领域备受关注。
寒武纪联合创始人陈云霁表示:
寒武纪1A可以解决两个方面的问题:
一是显著提升计算机系统在人工智能领域的运算效能,可以超过传统中央处理器和图形处理器芯片两个数量级;二是终端产品的离线智能化,“尤其是后者,让很多用户数据不必上传,保证了信息安全。
”最新推出的寒武纪-1A商用智能处理器,集成到终端SoC芯片,每秒可处理160亿个虚拟神经元,每秒峰值运算能力达2万亿虚拟突触,性能比通用处理器高两个数量级,功耗降低了一个数量级。
而最新开发的神经网络处理器指令集DianNaoYu则是参照RISC(精简指令集)设计思想,所有指令长度都是64bit,有效简化指令译码器的负担,减少功耗以及芯片面积。
一条指令既可以完成一组神经元处理,优化了计算数据在芯片上的传输,模拟实验表明,采用DianNaoYu指令集的深度神经网络处理器相对X86指令集处理器有两个数量级的性能提升。
麒麟970作为首款集成寒武纪芯片的商用产品,集合了寒武纪和华为两大重量级厂商的核心技术,这对未来中国人工智能芯片的发展意义重大。
同时,华为的业务涵盖运营商、企业、终端等,随着科技迅速发展,人工智能的应用场景将遍及电信、安防、消费、工业等各行各业。
此次华为与寒武纪强强联手抢先占领技术制高点,有利于促进公司“AI+”业务发展、增强客户体验,助力公司未来更上一层楼。
3、AI芯片从云端走向终端
人工智能芯片大概有两个应用场景,一个是用于云端服务器的高功耗高计算能力的芯片。
另外则是应用于终端(手机、平板等移动设备)的人工智能芯片。
服务器端负责AI算法的芯片的设计思路类似于“超级计算机”,一方面要支持尽可能多的网络结构以保证算法的正确率和泛化能力;另一方面必须支持高精度浮点数运算,峰值性能至少要达到Tflops(每秒执行10^12次浮点数运算)级别,所以功耗非常大;而且为了能够提升性能必须支持阵列式结构(即可以把多块芯片组成一个计算阵列以加速运算)。
谷歌推出了用于人工智能的TPU,英伟达推出了基于GPU的人工智能芯片,以及英特尔、微软等在云端AI芯片的研发上进展颇多。
然而,移动端的芯片特别注重低功耗、高能效比,而反观AI应用需要大运算和数字处理能力,两者之间的距离让这个领域难有成功商用的例子。
究其原因,主要在于移动端对多项性能指标要求严格,体积、性能、功耗、散热等等缺一不可。
首先,由于谷歌TPU芯片需要进行大量复杂的运算,但可依靠大面积的芯片来实现这种运算力。
反观智能手机,受限于面积、提及的因素,无很好的拓展性。
摆在华为麒麟970面前的问题是,因此,如何在方寸之间实现高性能、拥有支持大量的AI运算能力成为终端AI芯片成功与否的关键问题。
此次华为麒麟970制程工艺实现升级,采用TSMC10nm工艺,
集成55亿个晶体管,功耗大幅下降了20%。
同时,NPU采用HiAI移动计算架构,相比四个Cortex-A73核心,处理同样的AI任务,大约50倍能效和25倍性能优势,在有限的体积内实现性能的大幅提升。
其次,散热和续航同样是需要攻克的难题。
保障处理器速度的两大限制是发热和逻辑门的延迟,只有保障了芯片的散热问题,才能更好发挥其性能。
Google使用TPU的方式是将载有TPU的板子插在数据中心机柜的硬盘驱动器插槽里来使用,这样的做法既满足了TPU芯片使用时的电源问题,同时也不涉及高速运算中的散热问题。
但对于移动端的芯片来说,华为麒麟970要在方寸之间的芯片上来兼顾性能、功耗及散热问题,同时还需要考虑手机的续航问题。
通常来说,在芯片晶体管数量相同的情况下,更先进的制程可以降低芯片的核心面积,有助于降低成本,并且更加有效地控制发热和功耗。
而此次的10纳米工艺令功耗大幅下降了20%,并且同样有望使得麒麟970的续航表现更好。
最后,人工智能的体验同样也是重要的考量因素。
例如在摄影领域,华为实现了进一步的升级。
NPU可以帮助手机更精准和快速地识别拍摄场景,让手机选择最合适的图像处理算法,在双摄背景虚化时,让手机对边缘虚化的处理更准确,并且可以显著提高渲染的速度,降低功耗。
从现实角度考虑,不可能将所有的人工智能任务都放在云端进行,随时性、实时性和隐私性等重要特点决定了AI本地处理能力也不可或缺。
此次麒麟970芯片的发布标志着AI计算从云端走向终端迈出关键一步,未来随着AI产业的不断推进,用于终端的AI芯片有望迎来重要的发展机遇,产业链上相关企业也将享受到行业高增长带来的红利。
二、智能芯片是人工智能的根本
1、人工智能市场热度不断提高
根据麦肯锡最新的数据显示,人工智能初创企业的数量在这两年呈现了爆发式的增长。
到2016年增长到了389家,一直保持着两位数的增长。
人工智能企业的融资额,到2016年发展到了50亿美元;人工智能企业的并购数量在2016年达到了85家;而人工智能企业的股权融资数量达到了658家,人工智能市场热度不断提升。
2、CPU、GPU难以满足深度学习计算任务,AI芯片应运而生
首届“青城山中国IC生态高峰论坛”上,魏少军教授发表了题为《人工智能大潮中的芯片发展思路》的主题演讲,教授认为:
人工智能主要分为三个层次:
第一个层次叫应用,第二个层次是方法,第三个层次是工具。
从芯片的角度来说,显然归属于工具。
中国有一句古话,叫做“工欲善其事,必先利其器”。
魏少军教授认为,智能芯片是人工智能的根本。
深度学习不仅在传统的语音识别、图像识别、搜索/推荐引擎、计算广告等领域证明了其划时代的价值,也引爆了整个人工智能生态向更大的领域延伸。
由于深度学习的训练(training)和推断(inference)均需要大量的计算,人工智能界正在面临前所未有的算力挑战,而其始作俑者,是摩尔定律的失效。
由于结构所限,CPU性能近年来未能呈现如摩尔定律预测的定期翻倍。
当前CPU解决深度学习任务,成本高、效率低。
例如:
2012年吴恩达在领导的GoogleBrain的猫脸识别项目建立的神经网络内部有10亿个节点,总共动用了1.6万个CPU,耗时长达7天;
Labropoulos博士在Nextplatform文章中指出,当前深度学习的训练在小的计算机集群中需要花费数周及上月的时间。
由于DNN处理时需要对海量数据进行大规模并行计算,传统CPU在进行深度学习计算需要花费大量时间和能耗、占用大量硬件资源,因此具有数量众多计算单元和超长流水线、具备强大并行计算能力与浮点计算能力的GPU,成为了深度学习模型训练的标配。
GPU可以大幅加速深度学习模型的训练速度,相比CPU能提供更快的处理速度、更少的服务器投入和更低的功耗,并成为深度学习训练层面的事实工具标准。
但是,随着人工智能产业链的火速延伸,GPU并不能满足所有场景(如手机)上的深度学习计算任务,GPU并不是深度学习算力痛点的唯一解。
算力的刚需促使人工智能芯片应运而生。
以华为这次发布的人工智能芯片麒麟970为例:
该芯片采用10nm先进工艺,内置八核CPU。
麒麟970与以往手机芯片最大的区别在于首次集成了神经网络专用硬件处理单元来提升AI任务的计算能力:
在处理同样的AI应用任务时,新的异构计算架构拥有大约50倍能效和25倍性能优势。
3、AI芯片的三条技术路径:
GPU、FPGA和ASIC
当前人工智能芯片主要分为GPU、FPGA和ASIC。
首先是GPU。
目前GPU的计算能力要比CPU高很多倍。
从全部图形芯片市场来看,英特尔目前占比71%,英伟达占比16%,AMD占比13%。
而目前,人工智能使用的主要是分立式GPU。
从分立式GPU市场来看,英伟达占比71%,AMD占比29%。
所以英伟达在分立式GPU市场产品中占有绝对的优势,其产品广泛应用于数据中心的人工智能训练。
但是,无论是GPU还是CPU,这两个领域都无法在移动设备上使用,其原因在于功耗过大。
目前主要是互联网企业在使用这些设备,
不过,互联网企业也不仅仅使用GPU产品,他们也使用其他的一些人工智能芯片。
此外,人工智能芯片的第二个发展方向就是FPGA和ASIC。
FPGA所实现的人工智能芯片,能够在相同的情况下,功耗下降到GPU环境的20%。
FPGA的优点在于:
具有硬件可编程的特点,可针对AI计算进行二次硬件开发。
实现同样的功能时,硬件编程特性使得FPGA的速度快于在通用电路CPU或GPU上执行软件程序。
但是目前FPGA主要存在着几大缺陷:
(1)配置信息量大:
通常为几兆到十几兆字节;
(2)静态编程:
一旦配置完毕,不可更改。
如果要改变FPGA的功能,只能下电或在线重新载入配置信息;
(3)逻辑不可复用:
所有电路必须全部装入FPGA,复用性为零;
(4)面积效率低:
每个LUT只能实现一位运算,面积效率只有5%。
一个千万门级的FPGA只能实现几十万门的逻辑电路;
(5)需要特种工艺:
FPGA往往需要最先进的制造工艺,且需对工艺进行特别调整;
(6)电路设计技术:
应用者必须具备电路设计知识和经验;
(7)成本高昂:
目前的FPGA价格在几十到几万美元一片。
而ASIC是固化了的特定功能的芯片,其优点在于:
单位成本低、速度高,但缺点在于不具有可编程特性,无法进行二次开发,因此灵活性弱于FPGA。
因此,一般来说,ASIC用于大型项目,而对于需要快速投放市场且支持远程升级的小型项目,FPGA则更为适合。
机器智能是长久以来人类追求的目标,也是近期科学研究的热点。
而机器智能中,芯片是承载计算功能的基础部件,对人工智能未来的发展起到决定性的作用。
随着AI市场热度不断提升,对基础部件—芯片的要求也将越来越高,产业链上相关企业未来的发展潜力巨大。
科技巨头华为发布全球首款移动AI芯片,抢先占领科技制高点,为其未来业绩腾飞奠定了坚实的基础。
三、云计算业务成华为第四大BG
1、CloudBU升至华为旗下一级组织
华为CloudBU于今年四月成立,定位于云服务产业端到端管理的经营单元,负责构建云服务竞争力,对云服务的商业成功负责,
CloudBU的成立被业界视为华为正式进军公有云的象征,此前CloudBU为华为二级部门,隶属于该公司的产品与解决方案部。
调整以后,云业务部门CloudBU升为一级部门,获得更大的业
务自主权。
至此,云计算业务成为华为继运营商BG、企业BG和终端BG之后的第四大业务单元。
调整后,CloudBU将有自己的HR部门、CTO办公室、战略与业务发展部和财经管理部门,这意味着华为云部门获得更大的自主权,减少来自其它部门的掣肘。
并且,此次调整并没有涉及核心管理层。
在CloudBU成立之初,华为IT产品线总裁郑叶来就开始兼任华为CloudBU总裁,这也保证了前后管理方式和力度的一致性,为企业未来云业务的发展奠定了良好基础。
2、脱离现有IPD流程,构建云业务新商业模式
华为在文件中特别写明:
“部门管理并执行CloudService流程,执行DSTE、MTL、MBS-管理联盟关系、MBS-管理网络安全、管理BT&IT-管理IT服务流程。
”这应该是华为内部首次有部门不用执行公司统一的IPD流程,意味着CloudBU在一定程度上可以脱离华为现有IPD流程和管理体系,根据云业务的特点,构建新的商业模式、管理流程。
IPD不仅仅是个流程,还包括根据流程设定的组织结构,组织定位和运作机制等一整套的管理体系。
此次文件的提出表明CloudBU可以脱离华为现有体系,来自行构建“CloudService”,也意味着华为高层对于云业务的本质认识跨越了传统IT大厂们纷纷折戟的障碍:
此前,在以IBM为代表的大厂的艰难转型进程中,除了微软几乎没有一家传统大IT厂商在云上转型成功。
重要原因之一是:
没有一家愿意放手让云业务以相对独立的姿态去成长,而是继续沿袭原有的管理模式和考核机制,结果就是难以适应云业务崭新的商业和发展模式。
此次华为打破传统业务流程和管理思维,因地制宜,构建新的商业模式与管理流程,为未来云业务的发展奠定了重要基础。
四、中国公有云市场增长强劲
1、需求和技术双重促进使得云服务成为生产力工具
近年来,云计算产业逐渐兴起,需求和技术两方面形成双重驱动。
需求方面:
移动互联网和物联网产生的数据量越来越大、数据维度越来越多,而数据也越来越受到重视,这导致计算量急剧增长且弹性变大;移动互联网给人们带来的使用习惯又是随时随地接入,导致瘦终端理念的兴起。
技术方面:
Web2.0和HTML5先后撑起了前端应用(SaaS);
芯片技术、虚拟化技术等托起了底层架构(IaaS);Hadoop、Spark等大数据工程以及机器学习、深度学习撑起了中间层(PaaS)的数据处理。
云服务按部署模式可分为公有云、私有云、社区云和混合云。
公有云对一般公众开放,由公有云服务商提供服务;私有云是为一个用户/机构单独使用而构建的,可以由该用户/机构或第三方管理;社区云通常是有共同利益(如任务、安全需求、政策、遵约考虑等)并打算共享基础设施的组织共同创立的云;而混合云则是同时接入以上两种或两种以上的云服务,且实现统一化管理。
此次的华为CloudBU自今年四月成立以来就被业界视为华为正式进军公有云的象征,此次云业务部门CloudBU升为一级部门,足见公司发展公有云的雄心壮志。
2、政策推动行业发展,中国公有云市场增长潜力巨大
自2010年以来,云计算政策持续利好。
仅是近两年,就有大量促进云计算发展的政策文件颁发,推动着行业快速发展。
根据IDC发布的报告,与美国相比,中国目前云市场仍处于扩张阶段。
2015年,中国公有云市场规模为14.42亿美元,而美国已达500.81亿美元,中国仅为美国市场规模的3%,行业发展空间巨大。
据IDC的报告,IaaS市场依然是规模最大并且增速最快的基础市场:
2015年IaaS市场总规模达到8.37亿美元,年度同比增长率高达70.7%。
随着头部客户转型的示范效应显现,越来越多的企业会加入到这次云计算浪潮中来。
据IDC预计,2020年之前企业对IaaS的需求依然强烈,复合年增长率达到36.6%,PaaS平台的复合年增长率为38%,SaaS为28%,整个公有云市场以每年32.2%的速度增长,2020年规模