人工智能行业研究报告文档格式.docx
《人工智能行业研究报告文档格式.docx》由会员分享,可在线阅读,更多相关《人工智能行业研究报告文档格式.docx(22页珍藏版)》请在冰豆网上搜索。
根据GS首席经济学家JanHatzius所说:
「大体上而言,AI看起来似乎比上一次创新浪潮更有可能在统计数据中捕捉到更有价值的东西,人工智能可以降低成本,减少对高附加值生产类型的劳动投入。
举个例子,这些在商业部门成本节约上的创新可能比在iPhone中增加应用程序的可用性和多用性更利于统计学家去捕获有价值的东西。
考虑人工智能对商业部门的成本结构的广泛影响,我有理由相信它会被统计学家接受,并且会出现在整体生产力数据中。
尖端技术。
AI和机器学习在速度上的价值有利于构建一种在建设数据中心和网络服务时让硬件更便宜的趋势。
我们认为这可能推动硬件,软件和服务支出的市场份额的大幅度改变。
例如,在「标准」数据中心计算资源上运行的AWS工作负载的成本低至$0.0065/小时,而在使用AI优化过的GPU上运行的成本为0.900美元一小时。
竞争优势。
我们看到了AI和机器学习具有重新调整每个行业的竞争秩序的潜力。
未能投资和利用这些技术的管理团队在和受益于战略智能的企业竞争时,有很大可能会被淘汰掉,因为这些技术可以让企业的生产力提高,并为它们创造资本效益。
在第41页开始的短文中,我们将研究这些竞争优势是如何在医疗保健、能源、零售、金融和农业等领域发展起来的。
创办新公司。
我们发现了150多家在过去十年中创建的人工智能和机器学习公司(附录69-75)。
虽然我们相信人工智能的大部分价值都掌握在具有资源、数据和投资能力的大公司手中,但我们也期望风险投资家、企业家和技术专家可以继续推动新公司的创立,从而促进实质性的创新和价值创造,即使最后创业公司会被收购。
当然我们也不能忽视人工智能巨头(人工智能领域的谷歌或Facebook)的出现。
在接下来的篇幅中,我们将深入探讨AI的技术,历史,机器学习的生态系统以及这些技术在行业和领头公司中的应用。
什么是人工智能?
人工智能是做出能够以人类智能的方式学习并解决问题的智能机器和计算机程序的理工科。
传统而言,该领域包括自然语言处理与翻译、视觉感知与模式识别,以及决策制定。
但该领域以及应用的复杂度都在急剧扩展。
在此报告中,我们的大部分分析集中在机器学习(人工智能的一个分支)与深度学习(机器学习的分支)上。
我们强调两点:
简言之,机器学习是从样本和经验(即数据集)中进行学习的算法,而不是依靠硬编码和预先定义的规则。
换言之,也就是开发者不再告诉程序如何区分苹果和橘子,而是向算法输入数据(训练),然后自己学习如何区分苹果和橘子。
深度学习的重大发展是人工智能拐点背后的主要驱动。
深度学习是机器学习的一个子集。
在大部分传统的机器学习方法中,特征(即有预测性的输入或属性)由人来设计。
特征工程是一大瓶颈,需要大量的专业知识。
在无监督学习中,重要特征并非由人预定义,而是由算法学习并创造。
为了更加明了,我们不注重真人工智能、强人工智能或通用人工智能这样的概念,它们意味着复制人类智能,也经常出现在流行文化中。
虽然已经有了一些有潜力的突破,比如谷歌DeepMind的AlphaGo系统,我们还是更注重立即有实在经济的人工智能发展。
为何人工智能发展加速?
深度学习能力的极大发展是如今人工智能拐点背后的催化剂之一。
深度学习的底层技术框架——神经网络,已经存在了数十年,但过去5到10年的3种东西改变了深度学习:
1.数据。
随着全球设备、机器和系统的连接,大量的无结构数据被创造出来。
神经网络有了更多的数据,就变得更为有效,也就是说随着数据量增加,机器学习能够解决的问题也增加。
手机、IoT、低成本数据存储和处理(云)技术的成熟使得可用数据集的大小、结构都有了极大增长。
例如,特斯拉收集了780mn英里的驾驶数据,而且通过他们的互连汽车,每10小时就能增加100万英里的数据。
此外,Jasper有一个平台,能让多家汽车制造商和电信公司进行机器间的交流,这家公司于今年2月份被Cisco收购。
Verizon在8月份做了类似的投资,宣布收购Fleetmatics,Fleetmatics做的是将汽车上的远程传感器通过无线网络连接到云软件。
未来,5G网络的上线将会加速数据生成与传输的速率。
据IDC的DigitalUniverseReport显示,年度数据生成预期到2020年达到44zettabytes,表明我们正在见证应用这些技术的使用案例。
图1:
年度数据生成预期到2020年达到44zettabytes
2.更快的硬件。
GPU的再次使用、低成本计算能力的普遍化,特别是通过云服务,以及建立新的神经网络模型,已经极大的增加了神经网络产生结果的速度与准确率。
GPU和并行架构要比传统的基于数据中心架构的CPU能更快的训练机器学习系统。
通过使用图像芯片,网络能更快的迭代,能在短期内进行更准确的训练。
同时,特制硅的发展,比如微软和XX使用的FPGA,能够用训练出的深度学习系统做更快的推断。
另外,从1993年开始超级计算机的原计算能力有了极大发展(图2)。
在2016年,单张英伟达游戏显卡就有了类似于2002年之前最强大的超级计算机拥有的计算能力。
图2:
全球超级计算机的原计算性能,以GFLOPs测试
成本也有了极大的降低。
英伟达GPU(GTX1080)有9TFLOPS的性能,只要700美元,意味着每GFLOPS只要8美分。
在1961年,串够IBM1620s每提供1GFLOPS需要的钱超过9万亿。
图3:
每单位计算的价格有了极大下降
3.更好、更普遍可用的算法。
更好的输入(计算和数据)使得更多的研发是面向算法,从而支持深度学习的使用。
例如伯克利的Caffe、谷歌的TensorFlow和Torch这样的开源框架。
比如,刚开源一周年的TensorFlow,成为了GitHub上有最多forkedrepositories的框架。
虽然不是所有的人工智能发生于普遍可用的开源框架中,但开源确实在加速发展,而且也有更多先进的工具正在开源。
方向
虽然本报告的重点是人工智能的发展方向以及公司如何把握这个方向,但是了解人工智能对我们生活的影响程度也是很重要的。
在线搜索。
就在一年多以前,谷歌透露,它们已经开始将大量的搜索工作移植到了RankBrain(一个人工智能系统),使其和链接(links)以及内容(content)成为了谷歌搜索算法的三个最重要的标志。
推荐引擎。
Netflix,亚马逊和Pandora都在使用人工智能来确定推荐什么样的电影和歌曲,突出哪些产品。
5月,亚马逊开源了它们的深度可扩展稀疏传感网络引擎(theDeepScalableSparseTensorNetworkEngine(DSSTNE),简称「Destiny」),它被用于产品推荐,同时可以被扩展以实现超越语言和语言理解以及异议识别的目的。
人脸识别。
Google(FaceNet)和Facebook(DeepFace)都投入了大量的技术来确定您的照片中的人脸和真实的人脸是不是几乎完全吻合。
1月,苹果采取了进一步措施,购买了Emotient(一个致力于通过读取人的面部表情来确定其情绪状态的AI创业公司)显然,这些技术远远不止于对照片进行标记。
虽然个人助理应用产品有无数的用户,比如苹果的Siri,信用贷,保险风险评估,甚至天气预测。
在接下来的篇幅中,我们探讨企业该如何使用这些技术来加速增长,降低成本和控制风险。
从这些技术及其使用这些技术的应用的发展速度来看,它们充其量不过可以为公司和投资者提供一些方向,以保持他们的竞争力。
加强未来的生产率
美国的劳动生产率在90年代中期的快速增长和过去十年的缓慢增长和之后,近年来已经停止增长了。
我们认为,就像20世纪90年代互联网技术被广泛采用那样,消费类机器学习和人工智能的扩散有可能大幅度地改变全球产业的生产范式。
在整个行业中,我们发现在自动化的促使下,劳动时间减少了约0.5%-1.5%,同时,由于AI/ML技术带来的效率增益,到2025年,这些技术将对生产力增长产生高达51-1154个基点(bps)的影响。
虽然我们期望AI/ML可以随着时间同时提高生产率的分母和分子,不过我们认为最重要的是,早期的影响将是低工资任务的自动化,即以更少的劳动时间推动类似的产出增长水平。
我们的基本案例AI/ML驱动提高了97个基点,这意味着2025年的增长生产率中的1.61%将由IT贡献,比1995-2004年高出11个基点(图9,10)。
图9:
生产力分析;
单位百万美元,假设2019年之后GDP线性增长
生态系统:
云服务,开源在未来的AI投资周期中的关键受益人
我们相信,在未来的几年中,一个公司利用人工智能技术的能力将成为体现公司在所有主要行业竞争力的一个属性。
虽然战略会因公司规模和行业而有所不同,但如果管理团队不会把重心放在领导人工智能和在此基础上的利益上,那么未来产品创新、劳动效率和资本杠杆都会存在落后的风险。
因此,我们认为公司需要投资这些新技术以保持竞争力,同时这将导致对人工智能所以依赖的人才、服务和硬件的空前的需求。
作为比较,20世纪90年代技术驱动的生产力繁荣推动了相应的激增。
增加对技术的资本支出导致了新的企业和业务的增加来捕获这些资本支出。
在不可避免的行业整合发生之前,成立软件、硬件和网络公司开始发生转变。
下图13突出了软件行业内的这种模式。
在1995-1999年期间,在通货膨胀调整后,市值在20亿美元到50亿美元之间的公共软件公司的数量几乎增加了两倍,在2000年代中期才得到巩固。
图13:
伴随20世纪90年代生产力激增的驱动者生态系统(enablerecosystem)
图14:
这十年来,投资人工智能的风险资本出现了暴增
我们看到了由AI驱动的生产率具有产生下一个相似的繁荣周期的潜力,可以通过利用这些潜力,把软件、硬件、数据和服务提供商作为商业投资来创造价值。
如上图14所反映的那样,与AI相关的初创企业的风险投资在这十年中急剧增加。
AI企业投资的繁荣现象的巨大潜力也开始推动整合。
尤其是云平台对AI相关人才进行了大量投入,自2014年以来,谷歌、亚马逊、微软和Salesforce共进行了17项与AI相关的收购(下图)。
在上下文中对AI和ML技术的发展和历史技术周期的比较中,我们看到了前者的一些益处。
与过去50年的其他主要技术的周期一样,计算(和摩尔定律)一直是进步的抑制剂和推动者。
例如,在系统架构方面,我们目睹了从大型机系统转变为客户端-服务器模型的整个过程,并且近年来已经开始被云/移动模式所取代。
这种进化的驱动因素是计算能力、存储容量和带宽的改进。
每个转换都伴随着应用开发的转变,包括各种新编程语言的出现和演变(见图表15)和各种可能的应用程序各种的类型。
如上下文中所提及的一样,AI这个概念已经存在几十年了,其中神经网络的概念出现在20世纪60年代,虽然直到最近几年,计算能力才开始让神经网络能在实际环境中使用。
我们相信我们正处于AI平台的早期阶段,就如同20世纪50年代大型机才开始商业化到21世纪的智能手机和云的商业化。
随着平台曲线的变化(我们认为它正在发生),应用程序、工具和服务驱动者(enabler)会爆炸式增长,我们将在下面更详细地讨论。
图15:
人工智能的发展可以与历史上的系统架构和编程语言的采用的技术革命相比,尽管我们认为我们目前仍然处在人工智能发展和应用的早期阶段
stack的演变过程以及和AI之间的对应关系
蓝色=专有供应商,橙色=开源,绿色=云服务(注意:
一些供应商,如IBM和Microsoft都是专有服务和云服务)
图17:
生产中的机器学习:
如何在机器学习管道中利用各种开源和云技术
图18:
机器学习管道中的关键开源项目。
可用的项目\支持公司和风险投资
图表20:
人工智能即服务(AI-as-a-Service(AI-aaS))概览:
机器学习API正在被开发以解决水平和垂直使用案例
图表21:
水平AI-aaS产品和定价:
来自云平台的AI-aaS产品示例
中国人工智能现状
iResearch预测,2020年,中国人工智能市场将从2015年的12亿人民币增长至91亿人民币。
2015年,约14亿资本(年增长率76%)流入了中国的人工智能市场。
在政府政策方面,中国的国家发展改革委员会(发改委)和其他相关政府机构于2016年5月18日发布了《「互联网+」人工智能三年行动实施方案》。
《方案》指出了人工智能领域发展的六大保障措施,包括资金支持、标准体系、知识产权保护、人才培养、国际合作和组织实施。
《方案》提出,到2018年,中国的人工智能基础资源与创新平台、产业体系、创新服务体系、标准化体系应基本建立。
发改委期望中国人工智能产业整体与国际同步,系统级别(system-level)的人工智能技术和应用要位于市场领先位置。
中国已经做出一些重大举措,而且根据提及「深度学习」和「深度神经网络」的被引用期刊论文数量,2014年,中国已经超越美国(Exhibit23)。
中国拥有世界领先的语音和视觉识别技术,其人工智能研究能力也令人印象深刻(Exhibit24)。
XX于2015年11月发布的DeepSpeech2已经能够达到97%的正确率,并被《麻省科技评论》评为2016年十大突破科技之一。
另外,早在2014年香港中文大学开发的DeepID系统就在LFW数据库中达到了99.15%的面目识别正确率。
Exhibit23:
提到「深度学习」或者「深度神经网络」的期刊文章
Exhibit24:
至少被引用一次的、并提到「深度学习」或者「深度神经网络」的期刊文章
中国的互联网巨头XX、阿里巴巴和腾讯(BAT)正在领导中国的人工智能市场,同时数以百计的初创公司也正渗透到这一产业中,并在各种人工智能细分市场及应用领域建立服务模型。
目前,中国的人工智能领域包括:
基本服务,如数据资源和计算平台;
硬件产品,如工业机器人和服务机器人;
智能服务,如智能客户服务和商业智能;
以及
技术能力,如视觉识别和机器学习。
根据iResearch,目前,语音和视觉识别技术分别占中国人工智能市场的60%和12.5%。
在中国,所有和人工智能相关的公司中,71%专注于开发应用。
其余的公司专注算法,其中,55%的公司研究计算机视觉,13%研究自然语言处理,9%致力于基础机器学习。
我们认为,人工智能前沿的重要参与者可能会继续来自美国和中国。
XX:
2015年9月,XX「度秘」:
声控人工智能个人助理(整合进XX移动搜索应用)
2015年11月,XXDeepSpeech2:
包含一个大型神经网络的语音技术,通过样本学会将声音与语词联系起来
2015年12月,XX无人车:
XX无人车在北京道路上完成测试,并在硅谷设立自动驾驶部门(ADU)
2016年8月,XX「DuSee」:
为移动设备打造的AR平台(整合进XX搜索和地图移动应用),在搜索广告方面有着广泛应用
2016年9月,XX大脑:
官方介绍,XX的人工智能平台
2016年9月,PaddlePaddle:
XX近期开源的深度学习工具包
2016年10月,XX移动应用8.0:
新升级的移动搜索应用,内含一个整合了智能搜索和个性化新闻推荐的系统,其背后采用了人工智能、自然语言处理和深度学习技术
阿里巴巴:
2015年7月,阿里小蜜「阿里小秘书」:
虚拟人工智能客服,据公司2016年10月报告,问题解决率已达到80%
2015年8月,DTPAI:
基于阿里云的服务,用来处理机器学习过程,被该公司称为是中国的第一个人工智能平台
2016年6月,阿里妈妈光学字符识别:
该技术获得文档分析与识别国际会议(ICDAR)RobustReading比赛第一名
2016年8月,阿里云ET:
一套综合的人工智能解决方案套件,包括视频、图像和语音识别技术
腾讯:
2015年6月,优图:
腾讯为开发者开放了其面部识别技术,以及优图科技的其他核心技术
2015年8月,腾讯TICS实验室:
2015年腾讯设立的智能计算和搜索实验室,专注于四个方面:
搜索、自然语言处理、数据挖掘和人工智能
2015年9月,Dreamwriter:
腾讯上线中国第一个新闻报道机器人
2015年11月,WHAT实验室:
微信-香港科技大学人工智能联合实验室,于2015年11月26日成立
人工智能生态:
关键参与者
使用案例与潜在机会
创新人工智能的驱动者:
谷歌、亚马逊
谷歌在做些什么?
谷歌的搜索算法在过去二十年里进展迅速。
从1998年的PageRank到2015年的RankBrain,基于链接的网络排名已经进化成人工智能驱动下的查询匹配系统,后者能够不断适应那些独特的搜索(占谷歌所有搜索的15%)。
在云技术方面,公司五月份公布了针对平台的定制化硬件加速器方面取得的进展,一种定制化的ASIC,亦即TPU,这一进展对2015年开源的机器学习软件库TensorFlow进行了补充。
过去三年中,在与人工智能相关的收购战中,公司也当仁不让。
被收购的公司中,最知名的当属DeepMind,它提升了Alphabet的神经网络功能并已经将其应用于各种人工智能驱动的项目中。
为何重要?
在搜索中使用算法,谷歌可谓先行者。
将自然语言处理应用到配备用户搜索意图和可欲结果方面,公司一直处于领先地位,这也不断加强了公司在该领域的竞争优势。
在进一步推进人工智能领域的融合。
在促进人工智能一体化(AIintegration)方面,公司的开源应用TensorFlow已经为其他云平台以及研究社区利用公司资源提供了先例。
同时,谷歌正通过自身优势,比如TPU,充分利用开源世界为公司提供竞争优势,尽管其机器学习库是开源的。
因为DeepMind,公司提升了端到端的强化能力;
2015年末击败职业围棋选手的AlphaGo。
将人工智能带到更为广泛的研究社区,同时也通过软硬件方面的自身优势进行创新,谷歌是最好例子。
亚马逊在做什么?
亚马逊正在公司内部和云端使用机器学习技术。
2015年4月,公司发布AmazonML,这款机器学习服务能够为对云数据的使用提供机器学习功能(无需之前的客户经验)。
公司紧随谷歌的开源步伐,今年5月开源了DSSTNE,一个针对推荐深度学习模型的的库。
通过改善搜索、定制化产品推荐以及语音识别、增加有质量的产品评价,公司内部也在使用机器学习改善端到端的用户体验。
为什么重要?
借助AWS,亚马逊成为全球最大的云服务商,可能也是最成熟的人工智能平台。
借助AmazonML,公司成为作为服务的人工智能(AI-as-a-service)生态系统的领先者,将复杂的推理能力带到之前几乎没有机器学习经验的公司办公室当中。
无需基于定制的复杂应用,AWS用户就能使用机器学习训练模型,评估以及优化潜力。
亚马逊推荐引擎使用了机器学习,在匹配用户意图以及可欲结果方面,具有竞争优势,也为公司创造了商机。
公司正更加高效地利用收集到的数据合理化用户购物体验,也让电子商务体验更具互动性。
随着DSSTNE的开源,亚马逊也与其他科技巨头一起,推动科技社区的人工智能进步。
苹果在做什么?
去年,苹果已经成为最活跃的人工智能公司收购商,比如VocalIQ,Perceptio,Emotient,Turi,以及Tuplejump。
几乎同时收购了VocalIQ和Perceptio,公司请来了JohnathanCohen,当时还是英伟达CUDA库以及GPU加速软件项目的负责人。
近期,据报道,公司请来RuslanSalakhutdinov担任人工智能研究总监,这也标志着公司人工智能战略的转型。
在此之前,公司最初人工智能成果之一是Siri,第一款嵌入移动技术的虚拟助手,2014年,其语音识别技术被移入神经网络系统。
直到去年,苹果已经取得相对专有的机器学习成就;
2015年10月,BloombergBusinessweek报道,在大众消费方面,苹果研究人员还没发过一篇与人工智能有关的论文。
不过,这一策略转型多少与新的、与人工智能相关的雇佣与收购有关,科技记者StevenLevy在Backchannel的一篇报道强调公司已经在人工智能领域活跃一段时间了。
特别是,公司收购Turi突出了公司要按规模推进非结构数据和推论,以及开放给更为广泛的人工智能研究社区。
这次收购,配以基于收购公司技术的较