1、人工智能时代来人工智能时代来 作者: 日期: 人工智能时代来临-机械制造论文人工智能时代来临 文/袁晓雨、雷涛 人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。人们常常把人工智能与机器人、科幻小说联系在一起,而机器人只是人工智能的容器,并不是必备载体。实际上,人工智能已在我们生活中随处可见。 随着互联网的普及尤其是移动互联网在近十年来的快速发展,人们的生活方式被极大改变,但当市场热切期望移动互联网能够催生出更多新应用和商业模式时,移动互联网的发展却由
2、于技术水平的不足而遭遇瓶颈。如移动互联网仅完成了人与人或人与信息的对接,却无法提供精准服务,生产、运输、消费等各方面都面临智能化程度不足带来的障碍。 为突破瓶颈,新一轮技术风暴已经诞生,未来数十年IT产业发展的焦点将是人工智能,因为只有人工智能才能够为“万物互联”时代的一切应用提供完美解决方案。人工智能将成为继移动互联网后的下一个爆点。 人工智能发展已步入黄金时代 纵观人工智能近百年的发展,从图灵首次预言智能机器的可能性开始,人工智能经历两次低谷、三次繁荣,两次低谷或是由于当时的计算机内存和处理速度不足以解决实际问题,或是由于人们对人工智能的发展方向的不确定而进入低谷,但最终人工智能依然被成功
3、的应用在技术产业中。2010年以来,随着大数据、云计算、深度学习等基础支撑技术能力的显著提升,人类掌握了机器人时代的更多选择权,人工智能的发展已步入黄金时代。 首先,需对人工智能范畴做些明确。人们常常把人工智能与机器人、科幻小说联系在一起,但实际上人工智能已在我们生活中随处可见,而机器人只是人工智能的容器,并不是必备载体。比如Siri背后的软件和数据是人工智能,Siri说话的声音是人工智能的人格化体现,但Siri本身并没有机器人这个组成部分。 人工智能的概念很宽泛,按照人工智能的实力可分为以下三大类。一是弱人工智能。在特定领域等同或者超过人类智能或效率的机器智能。二是强人工智能。各方面都能和人
4、类比肩的人工智能。三是超人工智能。在包括科学创新、通识和社交技能等各个领域都超越人类的人工智能。 人工智能的革命就是从弱人工智能,通过强人工智能,最终达到超人工智能的过程。目前人类生活中弱人工智能无处不在,比如Siri、垃圾邮件过滤器、谷歌翻译、电商网站上的商品推送、谷歌无人驾驶汽车等。 人脑与电脑的最大差别在于,一些我们认为困难的事情,如微积分、金融市场策略、翻译等,对于电脑来说都十分容易;但一些人类认为容易的事情,如视觉、动态、移动、直觉,对于电脑来说却是十分困难。而要达到人类级别的智能,电脑必须要理解更高深的东西,比如微小的脸部表情变化预示为什么喜欢这个而不喜欢那个,要达到这样的水平首先
5、在硬件方面要增加电脑处理速度,其次在软件方面要让电脑变得智能。 美国发明家、未来学家Kurzweil估算出人脑的运算能力是1016 cps(calculations per second,每秒计算次数,描述运算能力的单位),即1亿亿次计算每秒。现在世界上最快的超级计算机,中国的天河二号,运行能力已达到3.4亿亿次,已经超过人脑,但由于其成本高、规模大、功耗高,使其并不能被商业广泛应用。Kurzweil认为考虑电脑发展程度的标杆是指1000美元能买到多少cps,当1000美元能买到人脑级别的1亿亿运算能力的时候,强人工智能就成为生活的一部分。而目前1000美元能买到10万亿cps(人脑的千分之一
6、),根据加速回报定律,科技的进步将呈指数型增长,按照这个速度,到2025年1000美元就可以买到和人脑运算速度抗衡的电脑了。 软件的创新和硬件的快速发展是同步的。人工智能就其本质而言,是对人的意识、思维信息的过程模拟,有两种方式可以实现:一是结构模拟,仿照人脑的结构机制,制造出“类人脑”的机器;二是功能模拟,撇开人脑的内部构造,对其功能过程进行模拟。据统计人类中枢神经系统中约含1000亿个神经元,每个神经元平均有7000个突触。IBM在2014年8月发布名为“TrueNorth”的神经元芯片,使用4096个内核模拟超过百万个人脑神经元和2.56亿个神经突触,其能力已相当于一台超级计算机,但功耗
7、却只有65毫瓦。这是完全从底层模仿了人脑结构,并用普通的半导体材料制造出的类人脑芯片,被认为是计算机史上最伟大的发明之一。同样以加速回报定律推算,指数级增长的开端或许比较漫长,但后期发展会比较显著。 搭建人工智能底层技术网络 深度学习带来人工智能的正循环 深度学习(Deep Learning)的概念源于人工神经网络的研究,其动机在于建立、模拟人脑进行分析学习的神经网络。深度学习采用的模型为深层神经网络(Deep Neural Networks,DNN)模型,即包含多个隐藏层(Hidden Layer)的神经网络,利用模型中的隐藏层,通过特征组合的方式,逐层将原始输入转化为浅层特征、中层特征、高
8、层特征直至最终的任务目标。通过深度学习可以完成需要高度抽象特征的人工智能任务,如语音识别、图像识别和检索、自然语言理解等。 传统机器学习通过标记数据和有监督学习完成,这意味着如果想让机器学会如何识别某一特定对象,就必须认为干预对样本进行标注,那么随着所需处理数据量的增大,外界对其支持和帮助也就更大,同时计算机结果的准确性也会受到影响。对于传统算法,越来越多的数据将成为负担,也容易达到极限或产生错误的结果。但深度学习是从未经标记的数据展开学习,更接近人脑的学习方式,可以通过训练之后自行掌握概念,这将大幅提高计算机处理信息的效率,并且深度学习算法可以做到传统人工智能算法无法做到的事情,而且输出结果
9、会随着数据处理信息量的增大而更加准确。 人工智能在长达半个世纪的发展中并不顺利,直到深度学习在近五年取得突破性进展,才将人工智能带上一个新的台阶。目前深度学习在几个主要领域都获得了突破性的进展:在语音识别领域,深度学习用深层模型替换声学模型中的混合高斯模型(GMM),获得了相对30%左右的错误率降低;在图像识别领域,通过构造深度卷积神经网络(CNN),将Top5错误率由26%大幅降低至15%,又通过加大加深网络结构,进一步降低到11%;在自然语言处理领域,深度学习基本获得了与其他方法水平相当的结果,但可以免去繁琐的特征提取步骤。 大数据为人工智能训练提供资源积累 与人类学习思考的过程类似,机器
10、学习也是在不断学习和训练的过程中才能变得更加智能,大量原始数据则为机器学习提供训练素材,正是基于对数据的不断挖掘和有效关联,机器才能形成新的认知。目前全球90%以上的数据都是在最近几年产生的,尤其是随着移动互联网、移动终端和数据感应器的出现,全球数据以超出想象的速度在快速增长。在过去的几年中,全球数据以年均58%的速度增长。根据IDC的预测,2020年全球数据总量将超过40ZB(1ZB等于1万亿GB),这一数据量是2011年的22倍,相当于人均将产生约5700GB数据。 成本低廉的并行计算助力人工智能 人类思考是一个并行的过程,数以亿计的神经元同时放电以创造出大脑皮层用于计算的同步脑电波,人工
11、智能软件搭建的类神经网络也需要许多不同的进程同步运行。神经网络的每一个节点都大致模拟了大脑中的一个神经元,其与相邻的节点互相作用,以明确所接收的信号。一项程序要理解某个口语单词,就必须能够听清不同音节彼此之间的所有音素;要识别出某幅图片,就需要看到其周围像素环境内的所有像素,这就是深层次的并行任务。但在GPU出现之前,标准计算机的处理器都仅能一次处理一项任务。 图形处理单元(Graphic Processing Unit,GPU),与CPU功能类似,但GPU是专为执行复杂的数学和几何计算而设计的,它可以满足高密度的视觉以及并行需求,在这个过程中每秒钟都有上百万像素被多次重新计算。2005年,G
12、PU芯片产量提升带来并行计算价格大幅下降。2009年,计算机科学家吴恩达(Andrew Ng)首次提出可以将GPU芯片用于并行运行神经网络。这一发现使得神经网络能容纳上亿节点间的连接。传统处理器需要数周才能计算出拥有1亿节点的神经网的级联可能性,而一个GPU集群在一天内就可完成,效率得到极大提升。随着GPU大规模生产带来价格下降,使其得到广泛的商业化应用。 全球人工智能产业发展明显加速 人工智能技术的研究和发展不仅决定了计算机、互联网技术的未来发展方向,同时也将引发众多传统产业结构的深刻变革。科学家普遍期待人工智能成为人类进入知识经济时代后,下一次生产力飞跃的突破口。国际金融危机以后,欧美国家
13、回归前沿科学的战略布局,更加重视人工智能技术的研究。特别是在人工智能基础研究、人脑研究、网络融合、3D智能打印等领域不断有研究突破。同时各大互联网巨头加快布局,2014年人工智能领域共完成40笔交易,投资总额达到3.09亿美元,比2013年增加302%。 藏于冰山下的巨大空间 目前人工智能技术主要应用在游戏、电商、广告等行业,但对于人工智能的发展空间来说,这只是冰山一角。人工智能技术与机器人和大数据的联系,将会大幅拓宽传统产业的互联网之路,使互联网对于传统企业的互联网化渗透的更加深入,由此产生的万亿规模市场空间将被逐步打开。此外,我国产业结构调整和人工智能升级方向高度重合,面对未来5年、10年
14、乃至30年的影响,将产生百倍的溢出效应。人工智能不仅是中国IT行业的发展趋势之一,也极有可能是中国科技与国际科技水平的首次齐头并进,共同研究开发这片蓝海。 人工智能产业链剖析 从发展路径及阶段上看,实现人工智能需经历三个阶段:计算智能(能存会算)、感知智能(能听会说、能看会认)和认知智能(能理解会思考)。从产业链上看,人工智能产业链包括基础技术支撑、人工智能技术及人工智能应用三个层次。其中:基础技术支撑,由数据中心及运算平台构成,即计算智能阶段,包括数据传输、运算、存储等;人工智能技术,是基于基础层提供的存储资源和大数据,通过机器学习建模,开发面向不同领域的应用技术,包含感知智能及认知智能两个
15、阶段。感知智能如语音识别、图像识别、自然语音处理和生物识别等,认知智能如机器学习、预测类API和人工智能平台;人工智能应用,主要为人工智能与传统产业相结合实现不同场景的应用,如无人驾驶汽车、智能家居、智能医疗等领域。 人工智能技术层:从人机交互到智能分析 人工智能技术层是从感知到思考再到最终决策行动的过程,是联通原始数据到最终应用的必然过程,包含感知智能和认知智能两个阶段。感知智能连接的人、信息和物理世界,通过传感器、搜索引擎和人机交互来获取建模必须的数据。从技术路径上看,我们目前处于由感知智能向认知智能进化的阶段,感知智能仍然是当下重要突破的领域。以语音识别、人脸识别为代表的感知智能技术是实
16、现人机交互的首要步骤,也是实现智能应用的必备条件,目前相关技术已逐步成熟并商业化落地,随着人工智能应用的快速推进,市场空间将被逐步打开。 2009年以来,借助机器学习领域深度学习研究的发展,以及移动互联网普及带来语料大数据的积累,语音识别技术取得显著进步,并开始从实验室走向市场。人机交互由键盘输入向语音输入的转变是必然趋势,所有信息设备终将实现“能听会说”,未来十年内语音识别技术应用将更加广泛。 目前语音识别在移动终端上的应用开始普及,语音对话机器人、语音助手、互动工具等层出不穷。国内外很多互联网公司纷纷投入资源在此方面的研究和应用,目的是通过语音交互的新颖和便利模式迅速占领客户群。但在语音识
17、别中,训练数据的匹配和丰富性是推动系统性能提升的重要因素之一,而语料的标注和分析需要长期的积累和沉淀,随着大数据时代的来临,大规模语料资源的积累将提到战略高度。 图像识别是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。识别过程包括图像预处理、图像分割、特征提取和判断匹配。简单地说,图像识别就是计算机像人一样读懂图片内容。图像识别的意义在于,我们不仅可以通过图片搜索更快的获取信息,还可以产生一种新的与外部世界交互的方式。此前我们利用科技工具探寻外部世界的流程是:人眼捕捉目标信息、大脑将信息进行分析、转化为机器可以理解的关键词、与机器交互获得结果。而当图片识别基础参与后,这个过程就可以简化为:人眼借助机器捕捉目标信息、机器和互联网直接对信息进行分析并返回结果。图像识别使摄像头成为连接人和世界信息的重要入口之一。 人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术,用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行识别的一系列相关技术。人脸识别的优势在于其自然性和被测个体难以察觉的特点,但人脸的相似性和易变性加大了识别难度。目前人脸识别技术已广泛应用于政府、金融、军队、工厂、教育、医疗等领域,随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多领域。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1