人工智能行业研究报告Word文档下载推荐.docx

资源描述

人工智能行业研究报告Word文档下载推荐.docx

《人工智能行业研究报告Word文档下载推荐.docx》由会员分享，可在线阅读，更多相关《人工智能行业研究报告Word文档下载推荐.docx（13页珍藏版）》请在冰豆网上搜索。

人工智能行业研究报告Word文档下载推荐.docx

凡是使用机器代替人类实现认知、识别、分析、决策等功能，均可认为使用了人工智能技术。

作为一种基础技术，理论上讲人工智能能够被应用在各个基础行业（如AI+金融、AI+医疗、AI+传统制造业等），同时也有其如机器人这样具体应用行业的概念。

本报告将以2017年上半年为时间节点，对包括发展驱动力、巨头布局、投融资情况、预测的市场规模等在的人工智能行业到目前为止的整体发展情况做简要分析，并对包括数据标记、语音识别、语义识别、计算机视觉等技术领域以及安防、医疗、金融等应用场景在的细分领域及其典型企业进行简析，探索人工智能领域未来发展趋势和可能的投资/创业机会。

行业驱动力

技术驱动：

算法和计算力是主要驱动力

在AI发展的不同阶段，驱动力各有侧重，我们可以将AI的发展划分为三个阶段：

技术驱动阶段集中诞生了基础理论、基本规则和基本开发工具。

在此阶段，算法和计算力对AI的发展起到主要推动作用。

现在主流应用的基于多层网络神经的深度算法，一方面不断加强从海量数据库中自行归纳物体特征的能力，一方面不断加强对新事物多层特征提取、描述和还原的能力。

对算法来说，归纳和演绎同样重要，最终目的是提高识别效率。

最新ImageNet测试结果显示，AI错误率低达3.5%，而人类对同一数据库识别错误率在5.1%，理想情况下，计算机图像识别能力已超越人类。

如上图所示，每年在ImageNet测试中错误率最低的算法模型都不尽相同（从NEC到ResNet），这也反映了人们对于算法的不断探究、更迭过程。

计算力的三驾马车：

芯片、超级计算机、云计算

提高识别效率除依靠算法之外，也离不开计算力的支持。

计算力可以分三个维度展开：

芯片、超级计算机、云计算。

芯片：

人工智能领域作为一个数据密集的领域，传统的数据处理技术难以满足高强度并行数据的处理需求。

为解决此问题，继CPU之后，相继出现了GPU、NPU、FPGA、DSP等“AI”芯片。

1999年，Nvidia公司发布了全球首款图片处理芯片GPU；

2016年，寒武纪发布了全球首款深度学习专用处理器芯片NPU，芯片的更迭、进步可从根本上提高计算性能。

超级计算机：

其基本组成组件与个人电脑的概念无太大差异，但规格与性能则强大许多，是一种超大型电子计算机。

我国自主超级计算机“神威·

太湖之光”，其处理器为众核CPU“申威26010”，整台“神威·

太湖之光”共包含40960块处理器；

打败世石的AlphaGo共包含1202个CPU和176个GPU；

打败柯洁的升级版AlphaGo使用到了TPU，但数量只有4颗。

可以发现，真正用于人工智能的超级计算机芯片还只是处于CPU、GPU层，如何将更适用于网络神经算法的NPU、FPGA等芯片量产化并融合入超级计算机芯片矩阵，是在人工智能发展的第一阶段—技术驱动阶段应该重点努力的方向之一。

云计算：

与主要应用于密集型计算的超级计算机不同，云计算依靠其灵活的扩展能力主要应用于社交网络、企业IT建设和信息化等数据密集型、I/O密集型的领域。

我们分析认为，当AI跨越入第二阶段—数据驱动阶段后，算法和计算力将变成人工智能领域的基础设施—“水、电、煤”。

就目前看来，多项算法开源平台已将AI算法引入统一、公用阶段，运算力也必将向同样的趋势发展。

云计算则是一个初步尝试，未来，计算力的发展方向或将是云计算和超级计算机技术结合，为企业提供既可密集运算又可灵活扩展的计算服务，将人工智能赋能全行业。

数据驱动：

描绘个性化画像；

场景驱动：

给予决策支持

人工智能发展的第二个阶段，算法和计算力已基本不存在壁垒，数据将成为主要驱动力，推动人工智能更迭。

此阶段，大量结构化、可靠的数据被采集、清洗和积累，甚至变现。

例如，大量的数据基础上可以精确地描绘消费者画像，制定个性化营销方案，提高成单率，缩短达到预设目标的时间，推动社会运行效率提升。

到了人工智能发展的第三个阶段，场景驱动作为主要驱动力，不仅可以针对不同用户做个性化服务，而且可在不同的场景下执行不同的决策。

此阶段，对数据收集的维度和质量的要求更高，并且可实时根据不同的场景，制定不同的决策方案，推动事件向良好的态势发展，帮助决策者更敏锐的洞悉事件根本，产生更精准更智慧的决策。

人工智能产业链综述

AI产业链主要包括技术支撑层、基础应用层和方案集成层

正如报告开头所述，人工智能是指使用机器代替人类实现认知、识别、分析、决策等功能，是一门综合了计算机科学、生理学、哲学的交叉学科。

完整的人工智能产业链可以分为技术支撑层、基础应用层和方案集成层，或者说应用场景层。

技术支撑层主要由AI芯片、传感器等硬件和算法模型（软件）和两部分构成。

其中传感器与IoT的感知层相似，包括GPU、FPGA、NPU等在的AI芯片负责运算，算法模型则负责训练数据。

基础应用层的技术则是为了让机器完成对外部世界的探测，主要由计算机视觉、语音识别等感知层和语义识别等认知层构成，这些技术是机器能够做出分析判断的基础。

此外，在感知与认知技术之下还有数据标注作为其底层支撑。

方案集成层是集成了某种或多种基础应用技术的、面向如工业、自动驾驶、家居、仓储物流、金融、医疗等不同应用场景的产品或方案。

本篇报告将主要围绕AI中基础应用层和方案集成层，即应用场景层进行分析。

语音识别：

语音识别过程虽存在难点，但目前技术已趋于成熟

语音识别是将语音转换为文本的技术，是自然语言处理的一个分支。

前台主要步骤分为信号搜集、降噪和特征提取三步，提取的特征在后台由经过语音大数据训练得到的语音模型对其进行解码，最终把语音转化为文本，实现达到让机器识别和理解语音的目的。

根据公开资料显示，目前语音识别的技术成熟度较高，已达到95%的准确度。

然而，需要指出的是，从95%到99%的准确度带来的改变才是质的飞跃，将使人们从偶尔使用语音变到常常使用。

语音识别作为一种一维时域信号，在实际操作中主要有两个难点。

首先是数据的获取、清洗。

语音识别需要大量细分领域的标准化语料数据作为支撑，尤其是各地方言的多样性更是加大了语料搜集的工作量。

据媒体消息，苹果iOS10.3版本中Siri已支持话。

第二个难点是语音特征的提取，目前主要通过具备多层神经网络的深度学习来解决，多层的神经网络相当于一个特征提取器，可对信号进行逐层深化的特征描述，最终从部分到整体，从笼统到具象，做到最大程度地还原信号原始特征。

语音识别虽市场庞大但已出现领航者，留给创业公司的机会不多

据ResearchandMarkets研究报告显示，全球智能语音市场将持续显著增长，预计到2020年，全球语音市场规模预计将达191.7亿美元。

根据Capvision报告显示，从语音行业市场份额角度来看，全球围，由Nuance领跑，国则是科大讯飞占据主导地位。

企业案例：

科大讯飞

科大讯飞专注于ToB的语音识别技术，目前已领跑中文语音市场

科大讯飞创办于1999年，主要从事智能语音及语言技术、人工智能技术研究，软件及芯片产品的开发，而应用集成则由下游的开发商或客户自己完成。

根据公开资料显示，科大讯飞是目前我国少数掌握核心技术的语音领域企业之一，已于2008年5月在证券交易所挂牌上市。

科大讯飞拥有六大核心技术，分别是语音识别、语音合、自然语言处理、语音评测、声纹识别和手写识别。

其中更重要的是其同时拥有语音合成和语音识别，能够把“听”和“说”组合起来。

此外科大讯飞还提出讯飞超脑计划，瞄准语音理解力市场。

随着人工智能热度高涨，科大讯飞等企业技术得以规模性落地

科大讯飞以讯飞超脑、AIUI为核，积极打造基于讯飞开放平台的AI生态，面对不同场景，推出覆盖全行业的语音产品及服务，深耕智慧教育、智慧城市、智慧汽车、智慧医疗以及智慧家居五个行业，全方位挖掘G端、B端及C端客户。

随着全球围人工智能热度的高涨，语音识别作为其中重要的技术应用层落地项目也愈加多元化。

科大讯飞在智慧教育、智慧城市、智能家居、智能汽车、机器人等领域规模化的应用，促进了其营收近几年持续稳定走高，尤其是在教育行业，科大讯飞构建了智慧考试、智慧校园、智慧课堂、智慧学习等一体化的智慧教育产品体系，2017年智慧课堂产品有望成为其在教育行业收入和毛利的重要增长点。

Nuance＆云知声

Nuance领衔全球市场，云知声重点布局家居领域

从世界围来看，Nuance是全球最大的独立语音识别公司之一。

Nuance于1994年成立于美国麻省伯灵顿，并于2000年4月在纳斯达克上市。

Nuance曾为苹果、三星提供语音支持服务，在语音识别领域一度处于垄断地位，后随深度算法的普及，各巨头逐渐开始自主研发语音识别技术，差距逐渐缩小。

但直到今天，其发布的DragonDrive（声龙驾驶）——互联汽车语音和容平台，仍为众多知名车企提供着车载语音技术支持，如梅赛德斯-奔驰、戴姆勒、宝马、丰田、雷克萨斯、荣威等汽车品牌。

此外，还有重点布局家居领域的语音企业—云知声。

云知声于2012年6月创办于，目前融资轮次为B+，是智能语音领域新锐玩家。

据官方数据显示，云知声目前已覆盖了476个城市，覆盖用户超过1.8亿，代表客户有网易易信、锤子手机、乐视超级电视等。

语义识别：

解决“听得懂”的语义识别领域中，新进入者仍具有一定机会

语义识别是人工智能的重要分支之一，解决的是“听得懂”的问题。

其最大的作用是改变人机交互模式，将人机交互由最原始的鼠标、键盘交互转变为语音对话的方式。

此外，我们认为目前的语义识别行业还未出现绝对垄断者，新进入的创业公司仍具备一定机会。

语义识别是自然语言处理（NLP）技术的重要组成部分。

NLP在实际应用中最大的困难还是语义的复杂性，此外，深度学习算法也不是语义识别领域的最优算法。

但随着整个AI行业发展进程加速，将为NLP带来长足的进步。

语义识别技术拥有多样性的应用领域以及行业参与者

我们认为，基于语音识别和语义识别的智能语音交互技术在车载场景中存在刚需，也会成为最先爆发的领域之一。

并且，随着车联网的纵深化发展，相关硬件趋于免费，依靠语音交互天然流量入口，做个性化增值服务将是未来车载领域的主要盈利点。

从1996年至今，国至今仍在运营的人工智能公司接近400家1。

从下图可看出，自然语言处理（NLP）无论在创业热度、获投数量还是获投金额都处于细分领域的前三。

据GlobalMarketInsights数据，预计到2024年市场规模达到110亿美元。

科技巨头乐衷于收购，小而美的企业更偏好细分场景

科技巨头尤其是微软早在2008年就已开始布局语义技术领域。

对于巨头来说，自主研发耗时久、投入高，同时效果也是未知的，直接收购是多数巨头选择的最快方式。

关于语义识别领域的创业公司，国代表企业有出门智能360、出门问问、三角兽、蓦然认知等。

其中，三角兽的智能语音交互功能已被应用在Rokid、锤子手机、威马汽车等产品上。

此外，由于自然语境和细分行业语境下，同一名词可能具备不同含义，因此除了行业通用型的语义识别公司之外，还存在一些深耕细分场景的公司，例如律师行业国外有基于IBMWatson的ROSS，国有无讼、法律谷等。

计算机视觉：

计算机视觉主要研究如何使机器具备“看”的能力

计算机视觉（putervision，简称CV）是指用计算机来模拟人的视觉系统，实现人的视觉功能，以适应、理解外界环境和控制自身运动。

主要解决的是物体识别、物体形状和方位确认以及物体运动判断这三个问题。

计算机视觉识别系统通常需要三个过程：

目标检测、目标识别、行为识别，分别解决了“去背景”、“是什么”、“干什么”的问题。

计算机视觉在技术流程上，首先要得到实时数据，此步骤可通过一系列传感器获取，少部分数据可直接在具备MEMS功能的传感器端完成处理，大部分数据会继续传输至大脑平台，大脑由运算单元和算法构成，在此处进行运算并给出决策支持。

动态人脸识别是最热领域，金融和安防是最热场景

计算机视觉应用场景可分为两大类：

图像识别和人脸识别，每类又可继续划分为动、静共四个类别，基本覆盖了目前计算机视觉的各项应用场景。

其中动态人脸识别技术是目前创业热度最高的细分领域，尤其是金融和安防场景，是其重点布局场景。

国，计算机视觉领域的企业最早出现在1997年，2014年出现创业高潮，企业平均年龄在3.9岁。

下表格为该领域目前存续的具备代表性的创业公司。

各细分领域成熟度相差大，其中人脸识别未来几年市场潜力巨大

计算机视觉作为一种人工智能的基础技术应用，使用场景多样，市场潜力巨大。

其中人脸识别领域在2016年已接近百亿规模，中国市场在全球围扮演着十分重要的角色。

由此可见，计算机视觉各细分领域的成熟度目前相差较大。

人脸识别、指纹识别等所在的生物特征识别领域相对来说技术成熟度、工业化程度较高。

在物体和场景识别方面，由于识别的物体种类繁杂，表现形态多样，技术成熟度较低。

对于计算机视觉而言，其主要瓶颈在于受图片质量、光照环境的影响，现有图像识别技术较难解决图像残缺、光线过爆、过暗的图像。

此外，受制于被标记数据的体量和数量，若无大量、优质的细分应用场景数据，该特定应用场景的算法迭代很难实现突破。

商汤科技

专注计算机视觉算法研发，推动视觉技术融入各行各业

商汤科技创办于2014年11月，位于，2017年4月完成了赛领资本领投的战略投资6000万美元。

商汤科技专注于核心算法开发，通过视觉技术赋予计算机视觉感知和认知的能力，业务覆盖金融、商业、安防、互联网+等行业，意图为企业提供低门槛的计算机视觉技术，打造“商汤驱动”的人工智能商业生态。

商汤科技的核心能力在于其能够自主开发原创深度学习模型，其自有的高性能算法库相对行业开源平台库，较大程度提高了算法效率，带来2-5倍的性能提升。

性能的提升直接导致的是极降低了计算机视觉硬件门槛，例如一般情况下双目、深度摄像头才具备视频处理能力，但利用商汤科技的算法模型，单目摄像头也具备此能力。

此外，商汤科技自身构建了具备200块GPU能力的DeepLink超算平台，过去耗时1个月的运算，现在只需5-6个小时即可完成。

硬件门槛降低+计算能力提升，使得大部分企业快速接入计算机视觉技术成为现实。

作为算法层企业，商汤科技通过与京东、小米、新浪微博等应用层级公司合作，使得自己的算法可以很好地融合多类细分领域的特点，快速移植复制到各行各业。

除此之外，商汤还在技术层与多家企业合作，例如，商汤科技与科大讯飞合作研发具备人脸+语音双重识别的产品；

与英伟达合作研发适用于深度学习的GPU芯片，该芯片可实时处理双路视频，为智慧视频提供支持。

商汤科技诞生于中文大学的多媒体实验室，团队成员主要由两部分构成，其一是来自MIT、斯坦福、大学、清华大学等高校及其实验室的科研人员；

其二是来自谷歌、XX、微软、阿里巴巴等产业界的商业人员。

商汤科技意图将实验室最新成果与商业变现之间的时空差距缩到最低限度。

2017年4月，商汤科技宣布完成了新一轮的战略融资，将进一步加速商业化布局。

触景无限

触景无限专注嵌入式感知模组的研发，试图在前端解决感知问题

除商汤科技这类依靠算法作为计算机视觉解决方案的流派之外，还存在触景无限这类专注于前端嵌入式硬件并搭载软件的打法。

触景无限成立于2010年，提供嵌入式智能感知平台——视觉卡，并于2017年3月完成A+轮5000万元人民币融资。

触景无限视觉卡基于英伟达、英特尔等嵌入式芯片，融合了人脸识别、物体识别、双目测距、GPS、TOF、IMU等多种传感器、数据处理平台和压缩算法模型，提供的嵌入式智能感知平台，具备体积小、功耗低、实时图像处理、处理能力高、多目摄像头支持、通用API接口等特点。

例如基于深度学习的人脸识别技术运行在视觉卡上能达到每帧100ms的速度（分辨率为1080P时的检测+识别速度），在1:

1人证比对的情况下识别率大于99%，在1:

50000的情况下识别率大于90%。

通过该视觉卡，信息处理可以直接在前端完成，帮助前端硬件完成“感”与“知”的融合。

在具体产品方面，截止2017年6月，触景无限视觉卡已完成两代视觉卡的研发，其中一代V10X系列已于2016年底实现量产，二代V20X系列亦于日前发布。

相较于一代，二代基于Intel-Movidius芯片研发，芯片体积更小（一元硬币大小），功耗更低（低至2瓦），处理速度更强（约1Tflops）。

两代视觉卡产品均可用于安防、无人机、机器人、智能家居、智能汽车辅助驾驶等领域。

人工智能的应用场景层

AI+医疗：

融合目前主要体现在智能设备和识别诊断两方面

人工智能在医疗领域的应用，我们认为主要体现在“软”和“硬”两方面。

“硬”指的是主要用于医院、诊所的医疗或辅助医疗的智能型服务机器人。

种类包括手术机器人、假肢机器人、康复机器人、心理康复辅助机器人、个人护理机器人和智能健康监控系统等六大类。

手术机器人领域代表公司IntuitiveSurgical成立于1995年，其产品达芬奇手术机器人是目前全球围应用最广泛、技术水平最高的手术机器人之一。

达芬奇手术机器人属于人机协作型机器人，主要由医生控制台、机械臂系统、三维成像系统三部分构成。

手术实施过程中，主刀医师不与病人直接接触，而是通过三维视觉系统和动作定标系统操作控制，由机械臂以及手术器械模拟完成医生的技术动作和手术操作。

目前，整个手术机器人行业正在由大型开放性手术向人体微创精细型手术转型。

手术机器人行业急需打破垄断，降低成本，普惠国人

就全球而言，目前医疗机器人的研发与销售仍主要集中在北美地区。

截至2016年6月，达芬奇手术机器人全球累计安装3745台，其中美国2474台，全球累计完成手术300万例。

达芬奇手术机器人是国唯一获批上市的医疗机器人，截至2016年12月，全国各地共引进了59台，2016年度共完成手术11445例，历年总计完成手术22917例，国渗透率极低。

随着我国老龄化进程加速和中产阶级的崛起，人们对医疗的精准度、无痛化等要求逐步攀升，同时也由于医疗人员的稀缺，中国的医疗机器人的需求空间非常大。

据OFweek消息，2021年，全球手术机器人市场规模将达200亿美元，手术机器人国产化已迫在眉睫。

AI+医疗衍生出的识别诊断领域中，数据是关键

在AI与医疗的软性结合上，具体应用包括诊前的疾病预防、健康管理；

诊中的辅助诊断、医学图像处理；

诊后的虚拟医护助手等。

目前，发展较为成熟的领域有医学影像识别和智能诊断等。

算法和数据是医学影像识别和智能诊断的技术基础，其中，医疗垂直领域的图像算法和自然语言处理技术已可基本满足行业需求，而数据方面例如医学影像数据、电子病历等，存在各医院之间信息不流通、企业与医院之间合作不透明等问题，使得技术发展与数据供给之间存在矛盾。

但随着全球医疗保健进入数字化拐点，可授权使用的数据量得以快速增长，另一方面也由于医疗机器人这类新的医疗数据终端的逐步普及，都将为智慧医疗行业带来新的发展契机。

政策鼓励+需求爆发，大健康领域或将出现更多创业者加入

基于数据的稀缺性，拥有一手医疗数据、和政府、医疗机构有大量渠道的创业公司将会建立起壁垒。

或者通过对拥有数据的企业进行全资收购也是快速壁垒的好方式。

目前，AI+医疗的软性应用方面的主要玩家国外有IBMWastson，国有碳云智能、推想科技等。

2015年，国务院发布《关于印发全国医疗卫生服务体系规划纲要（2015年—2020年）》，提出推动惠及全民的健康信息服务和智慧医疗服务，推动健康大数据的应用，逐步转变服务模式。

IDC预计，2017年国医疗行业IT花费市场规模将达到336.5亿元，2012至2017年的年复合增长率为14.5%，增速高于中国IT市场的平均增速，需求旺盛。

整体而言，医疗“软”市场急需医疗数字化、开放化，“硬”市场需要大量创业者加入共同开发医疗机器人这片国蓝海。

AI+金融：

AI技术的融入，赋予了金融行业更多想象力

从信息技术变革角度来看，金融历经金融IT、互联网金融到金融科技三大发展阶段。

金融IT，通过IT软硬件实现传统金融机构办公和业务电子化；

互联网金融，利用互联网实现资产端、交易端、支付端、资金端等互联互通，达到信息共享和业务撮合；

金融科技，通过大数据、云计算、人工智能、区块链等最新技术，提高金融业务的智能化。

人工智能与金融的结合可从以下三方面展开说明

生物特征识别功能。

一方面活体验证降低了隐藏风险，一方面远程身份验证提升了工作效率。

千人千面、精准营销。

基于大数据、机器学习、标签计算，实现实时精准画像描绘，提供个性化营销是未来趋势之一。

进一步还可发展为智能投顾、辅助量化交易等。

大数据征信、普惠金融。

基于大数据的征信系统弥补了中小型企业的征信空白，扩大了客户围的同时，也提升了金融机构的风控能力。

平安科技

平安科技从金融领域的高频需求出发，主攻远程身份验证业务

平安科技成立于2008年，是平安集团旗下的全资子公司，拥有超过4000名专业IT技术人员和IT管理专家，基于母公司金融背景和需求理解，深挖人工智能在金融行业的应用，主要应用于基于人脸识别的远程身份验证，例如远程开户、绑卡核身、账户登录、分期购物、人脸考勤、人脸支付等业务场景。

平安科技以深度学习、神经网络为基础，精准定位人脸和快速面部特征信息提取完成身份验证，具备人脸检测、人脸比对、活体检测和去网纹等多项能力，目前累积使用已超过2.5亿人次。

平安科技人脸识别已服务逾百家合

展开阅读全文