人工智能机器人技术发展报告Word文档下载推荐.docx
《人工智能机器人技术发展报告Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《人工智能机器人技术发展报告Word文档下载推荐.docx(19页珍藏版)》请在冰豆网上搜索。
现代机器人的起源则始于二十世纪40-50年代,美国许多国家实验室进行了机器人方面的初步探索。
二次世界大战期间,在放射性材料的生产和处理过程中应用了一种简单的遥控操纵器,使得机械抓手就能复现人手的动作位置和姿态,代替了操作人员的直接操作。
在这之后,橡树岭和阿尔贡国家实验室开始研制遥控式机械手作为搬运放射性材料的工具。
1948年,主从式的遥控机械手正式诞生于此,开现代机器人制造之先河。
美国麻省理工学院辐射实验室(MITRadiation
Laboratory)1953年研制成功数控铣床,把复杂伺服系统的技术与最新发展的数字计算机技术结合起来,切削模型以数字形式通过穿孔纸带输入机器,然后控制铣床的伺服轴按照模型的轨迹作切削动作。
上世纪50年代以后,机器人进入了实用化阶段。
1954年,美国的GeorgeC.
Devol设计并制作了世界上第一台机器人实验装置,发表了《适用于重复作业的通用性工业机器人》一文,并获得了专利。
GeorgeC.Devol巧妙地把遥控操作器的关节型连杆机构与数控机床的伺服轴连接在一起,预定的机械手动作一经编程输入后,机械手就可以离开人的辅助而独立运行。
这种机器人也可以接受示教而能完成各种简单任务。
示教过程中操作者用手带动机械手依次通过工作任务的各个位置,这些位置序列记录在数字存储器内,任务执行过程中,机器人的各个关节在伺服驱动下再现出那些位置序列。
因此,这种机器人的主要技术功能就是“可编程”以及“示教再现”。
上世纪60年代,机器人产品正式问世,机器人技术开始形成。
1960年,美国的ConsolidatedControl公司根据GeorgeC.Devol的专利研制出第一台机器人样机,并成立Unimation公司,定型生产了Unimate(意为“万能自动”)机器人。
同时,美国“机床与铸造公司”(AMF)设计制造了另一种可编程的机器人
Versatran(意为“多才多艺”)。
这两种型号的机器人以“示教再现”的方式在汽车生产线上成功地代替工人进行传送、焊接、喷漆等作业,它们在工作中表现出来的经济效益、可靠性、灵活性,使其它发达工业国家为之倾倒。
于是Unimate和Versatran作为商品开始在世界市场上销售,日本、西欧也纷纷从美国引进机器人技术。
这一时期,可实用机械的机器人被称为工业机器人。
在机器人崭露头角于工业生产的同时,机器人技术研究不断深入。
1961年,美国麻省理工学院Lincoln实验室把一个配有接触传感器的遥控操纵器的从动部分与一台计算机连结在一起,这样形成的机器人可以凭触觉决定物体的状态。
随后,用电视摄像头作为输入的计算机图像处理、物体辩识的研究工作也陆续取得成果。
1968年,美国斯坦福人工智能实验室(SAIL)的J.McCarthy等人研究了新颖的课题——研制带有手、眼、耳的计算机系统。
于是,智能机器人的研究形象逐渐丰满起来。
上世纪70年代以来,机器人产业蓬勃兴起,机器人技术发展为专门的学科。
1970年,第一次国际工业机器人会议在美国举行。
工业机器人各种卓有成效的实用范例促成了机器人应用领域的进一步扩展;
同时,又由于不同应用场合的特点,导致了各种坐标系统、各种结构的机器人相继出现。
而随后的大规模集成电路技术的飞跃发展及微型计算机的普遍应用,则使机器人的控制性能大幅度地得到提高、成本不断降低。
于是,导致了数百种类的不同结构、不同控制方法、不同用途的机器人终于在80年代以来真正进入了实用化的普及阶段。
进入80年代后,随着计算机、传感器技术的发展,机器人技术已经具备了初步的感知、反馈能力,在工业生产中开始逐步应用。
工业机器人首先在汽车制造业的流水线生产中开始大规模应用,随后,诸如日本、德国、美国这样的制造业发达国家开始在其他工业生产中也大量采用机器人作业。
上世纪80年代以后,机器人朝着越来越智能的方向发展,这种机器人带有多种传感器,能够将多种传感器得到的信息进行融合,能够有效的适应变化的环境,具有很强的自适应能力、学习能力和自治功能。
智能机器人的发展主要经历了三个阶段,分别是可编程试教、再现型机器人,有感知能力和自适应能力的机器人,智能机器人。
其中所涉及到的关键技术有多传感器信息融合、导航与定位、路径规划、机器人视觉智能控制和人机接口技术等。
进入21世纪,随着劳动力成本的不断提高、技术的不断进步,各国陆续进行制造业的转型与升级,出现了机器人替代人的热潮。
同时,人工智能发展日新月异,服务机器人也开始走进普通家庭的生活。
世界上许多机器人科技公司都在大力发展机器人技术,机器人的特质与有机生命越来越接近。
最近,波士顿动力公司在机器人领域的成就已经成为人们的焦点,其产品机器狗Spot和双足人形机器人Atlas都让人大为惊叹。
Spot的功能十分先进,可以前往你告诉它要去的目的地,避开障碍,并在极端情况下保持平衡。
Spot还可以背负多达四个硬件模块,为公司提供其他多款机器人完成特定工作所需的任何技能;
Atlas已经掌握了倒立、360度翻转、旋转等多项技能,继表演跑酷、后空翻等绝技之后,Atlas又掌握了一项新技能—体操,再次让我们大开眼界。
图10-1波士顿动力机器人Spot与Atlas
经过几十年的发展,机器人技术终于形成了一门综合性学科——机器人学
(Robotics)。
一般地说,机器人学的研究目标是以智能计算机为基础的机器人的基本组织和操作,它包括基础研究和应用研究两方面内容,研究课题包括机械手设计、机器人动力和控制、轨迹设计与规划、传感器、机器人视觉、机器人控制语言、装置与系统结构和机械智能等。
由于机器人学综合了力学、机械学、电子学、生物学、控制论、计算机、人工智能、系统工程等多种学科领域的知识,因此,也有人认为机器人学实际上是一个可分为若干学科的学科门类。
同时,由于机器人是一门不断发展的科学,对机器人的定义也随着其发展而变化,目前国际上对于机器人的定义纷繁复杂,RIA、JIRA、NBS、ISO等组织都有各自的定义,迄今为止,尚没有一个统一的机器人定义。
1.3人才概况
●全球人才分布
学者地图用于描述特定领域学者的分布情况,对于进行学者调查、分析各地区竞争力现况尤为重要,下图为机器人领域全球学者分布情况:
图10-2机器人全球学者分布
地图根据学者当前就职机构地理位置进行绘制,其中颜色越深表示学者越集中。
从该地图可以看出,美国的人才数量优势明显;
欧洲也有较多的人才分布;
亚洲的人才主要集中在我国东部及日韩地区;
其他诸如非洲、南美洲等地区的学者非常稀少;
机器人领域的人才分布与各地区的科技、经济实力情况大体一致。
此外,在性别比例方面,机器人领域中男性学者占比90.7%,女性学者占比9.3%,男性学者占比远高于女性学者。
机器人领域学者的h-index分布如下图所示:
900
800
700
600
500
400
300
200
100
>
6050-6040-5030-4020-30<
20
h-index
图10-3机器人学者h-index分布
从上图可以看出,大部分学者的h-index分布在中低区域,其中h-index在
20-30区间的人数最多,有836人,占比41.3%,小于20区间的人数最少,只有
3人。
●中国人才分布
我国专家学者在机器人领域的分布如下图所示。
通过下图我们可以发现,京津地区在本领域的人才数量最多,其次是珠三角和长三角地区,相比之下,内陆地区的人才较为匮乏,这种分布与区位因素和经济水平情况不无关系。
同时,通过观察中国周边国家的学者数量情况,特别是与日韩等地相比,中国在机器人领域学者数量较少。
图10-4机器人中国学者分布
中国与其他国家在机器人领域的合作情况可以根据AMiner数据平台分析得到,通过统计论文中作者的单位信息,将作者映射到各个国家中,进而统计中国与各国之间合作论文的数量,并按照合作论文发表数量从高到低进行了排序,如下表所示。
表10-1机器人领域中国与各国合作论文情况
合作国家
论文数
引用数
平均引用数
学者数
中国-美国
445
6606
15
756
中国-日本
90
998
11
196
中国-加拿大
69
761
128
中国-新加坡
62
586
9
123
中国-德国
57
780
14
98
中国-英国
50
1270
25
94
中国-法国
41
860
21
63
中国-澳大利亚
27
351
13
45
中国-瑞典
246
12
中国-意大利
18
318
33
从上表数据可以看出,中美合作的论文数、引用数、学者数遥遥领先,表明中美间在机器人领域合作之密切;
此外,中国与欧洲的合作非常广泛,前10名
合作关系里中欧合作共占4席;
中国与英国合作的论文数虽然不是最多,但是拥有最高的平均引用数说明在合作质量上中英合作达到了较高的水平。
1.4论文解读
本节对本领域的高水平学术会议及期刊论文进行挖掘,解读这些会议和期刊在2018-2019年的部分代表性工作。
这些会议和期刊包括:
IEEEInternationalConferenceonRoboticsandAutomationIEEE/RSJInternationalConferenceonIntelligentRobotsandSystemsRobotics:
ScienceandSystems·
ARoboticsConference
IEEETransactionsonRobotics
我们对本领域论文的关键词进行分析,统计出词频Top20的关键词,生成本领域研究热点的词云图,如上图所示。
其中,机器人(robotics)、鲁棒性(robustness)、动作(motion)是本领域中最热的关键词。
1.4.1论文题目:
RoboticPick-and-PlaceofNovelObjectsinClutterwithMulti-AffordanceGraspingandCross-DomainImageMatching
中文题目:
通过多affordance抓取和跨域图像匹配完成杂乱环境下对新物体的捡放操作
论文作者:
AndyZeng,ShuranSong,Kuan-TingYu,ElliottDonlon,FrancoisR.Hogan,MariaBauza,DaolinMa,OrionTaylor,MelodyLiu,EudaldRomo,NimaFazeli,FerranAlet,NikhilChavanDafle,RachelHolladay,IsabellaMorona,PremQuNair,DruckGreen,IanTaylor,WeberLiu,ThomasFunkhouser,AlbertoRodriguez
论文出处:
IEEEInternationalConferenceonRoboticsandAutomation,2018
论文地址:
https:
//ieeexplore.ieee.org/abstract/document/8461044研究问题:
人类可以在仅掌握少量先验知识的前提下识别和抓取陌生目标物,这一能力一直是机器人研究的灵感来源,也是很多实际应用的核心。
为此,提出一种能在杂乱环境下对新目标物进行识别和捡放操作的机器人系统,整个系统可直接用于新目标物(在测试过程中首次出现),而无需额外的数据收集或重新训练,如下图所示。
研究方法:
专门设计该机器人识别捡放系统,该系统由两部分组成:
1)具有四个基础行为的多模式抓取框架,该框架使用深度卷积神经网络(ConvNets)来预测场景
affordance,而无需事先对目标物进行分割和分类。
2)跨域图像匹配框架,用于通过将抓取的对象与产品图像进行匹配来识别抓取的对象,该框架使用了
ConvNet架构,该架构可直接用于新目标物而无需重新进行训练。
这两部分互相配合,可以在杂乱的环境中完成对新目标物的抓取操作。
机器人吸取和抓取的affordance预测如下图所示,考虑各个视角的RGBD图像,可通过一个全卷积残差网络估算出每张图片的吸取affordance。
然后,将预测汇总在3D点云上,并基于表面法线生成向下吸取或侧向吸取的建议。
并行地,我们将RGB-D图像合并为RGB-D高度图,将其旋转16个不同的角度,并估计每个高度图的水平抓取。
这有效地生成了针对16个不同抓取角度的affordance图,从中可得到向下抓取和其他抓取的建议。
新物体的识别框架如下图所示。
训练一个双流的卷积神经网络,其中一个流计算得到产品图像的2048维特征向量,而另一个流计算得到观察图像的2048维特征向量,并对两个流进行优化,以使相同图像的特征更加相似,反之则不同。
在测试期间,已知对象和新对象的图像都映射到公共特征空间上。
通过在相同的特征空间找到与其最近的特征来匹配来识别它们。
研究结果:
提出一种系统,该系统能够以很少的先验信息(少数产品图片)来拾取和识别新对象。
该系统首先使用与类别无关的affordance预测算法在四种不同的抓取动作元之间进行选择,然后通过将抓取的对象与它们的产品图像进行匹配来识别抓取的对象。
通过评估证明,该机器人系统可以拾取并在杂乱无章的环境中识别出新物体。
1.4.2论文题目:
UsingSimulationandDomainAdaptationtoImproveEfficiencyofDeepRoboticGrasping
使用仿真和领域适应来提高深度机器人抓取的效率
KonstantinosBousmalis,AlexIrpan,PaulWohlhart,YunfeiBai,MatthewKelcey,MrinalKalakrishnan,LauraDowns,JulianIbarz,PeterPastor,KurtKonolige,
SergeyLevine,VincentVanhoucke
IEEEInternationalConferenceonRoboticsandAutomation,2018论文地址:
//ieeexplore.ieee.org/document/8460875
研究问题:
收集带注释的视觉抓取数据集以训练现代机器学习算法可能是非常耗时的。
一个替代方法是使用现成的模拟器来合成数据,这样就可以自动产生这些数据的真实标注。
不幸的是,仅基于模拟数据训练的模型通常无法泛化到现实世界。
研究如何将随机模拟环境和域适应方法应用到真实场景,训练一种抓取系统,可以通过原始RGB图像中进行规划,抓取新的目标物。
研究模拟环境中的3D目标模型、模拟的场景和模拟的动力学如何影响机器人最终的抓取性能,以及将模拟与真实场景集成以实现最大程度的迁移。
具体方法如上图所示。
(a)为像素级的域适应模型GraspGAN的概述。
从仿真器中得到的图像元组xs并输入到生成器G中,生成真实版本的图像xf,鉴别器D获得未标注的真实世界图像xt和xf,并经过训练以区分它们。
真实的和经过适应的图像也被送到抓取预测网络C中,一同进行并行训练。
因此,生成器G从鉴别器D和预测器
C中获得反馈,以使适应的图像看起来更加真实并保持其语义信息;
(b)为生成器G和鉴别器D的体系结构;
(c)为DANN模型,其中C1包含7个卷积层,
C2包含9个卷积层。
研究将模拟数据合并到基于学习的抓取系统中的方法,以提高抓取性能并减少数据需求。
通过使用合成数据和域适应,仅使用少量随机生成的模拟数据,就可以达到给定性指标的50倍。
还表明,仅使用未标注的真实数据和GraspGAN的方法,就可以在没有任何真实数据标注的情况下获得与真实世界相同的抓取性能。
1.4.3论文题目:
Dex-Net2.0:
DeepLearningtoPlanRobustGraspswithSyntheticPointCloudsandAnalyticGraspMetrics
Dex-Net2.0:
利用合成点云进行鲁棒抓取和分析抓取指标的深度学习
BohgJeffreyMahler,JackyLiang,SherdilNiyaz,MichaelLaskey,RichardDoan,XinyuLiu,JuanAparicioOjea,andKenGoldberg
Robotics:
ScienceandSystems,2017论文地址:
//arxiv.org/pdf/1703.09312.pdf研究问题:
为了减少采用深度学习进行鲁棒机器人抓取策略学习所需的数据收集时间,探索了从670万点云,抓取姿态和抓取指标的合成数据集进行训练,这些数据是从DexNet1.0的数千个三维模型中以随机姿势在桌子上生成的。
利用得到的数
据集Dex-Net2.0训练抓取质量卷积神经网络(GQ-CNN)模型,该模型可快速从深度图像预测抓取成功的概率,其中抓取被指定为相对于RGB-D传感器的夹持器的平面位置、角度和深度。
研究基于深度点云的处于桌面上的单刚体的平行爪抓取规划问题。
学习一个函数,它以一个候选抓取和一个深度图像作为输入,并输出一个鲁棒性的估计值,或者在传感和控制的不确定性下的成功概率。
DexNet2.0的架构如下图所示。
GQ-CNN是抓取质量卷积神经网络,它是经离线训练的,使用由670万个合成点云、相关鲁棒抓取指标的数据集Dex-Net
1.0数据集,可从深度图像预测鲁棒候选抓取。
当一个物体呈现给机器人时,深度相机会返回一个三维点云,识别出一组几百个候选抓取点。
GQ-CNN迅速确定了最稳健的抓取位姿,并由ABBYuMi机器人执行操作。
开发了一个抓取质量卷积神经网络(GQ-CNN)体系结构,它可以预测基于点云模型抓取的稳定性,并在Dex-2.0数据集上对其进行训练,它是一个包含670万点云、平行抓取和稳定性抓指标的数据集。
在1000多个物理评估中,发现Dex-Net2.0抓取规划器是一种可靠的、速度比基于点云配准方法快3倍的,并且在
40个新目标的测试集上具有99%的精度的抓取规划器。
1.4.4论文题目:
DeepPredictivePolicyTrainingusingReinforcementLearning
深度预测策略的强化学习训练方法
AliGhadirzadeh,AtsutoMaki,DanicaKragicandMartenBjorkman.
ScienceandSystems,2019论文地址:
//arxiv.org/pdf/1903.11239.pdf研究问题:
由于感知运动过程的固有延迟,机器人任务学习最好通过预测动作策略来实现。
然而,训练这样的预测策略是具有挑战性的,因为它涉及到在整个动作过程中找到运动激活的轨迹。
本文中,提出一个基于深度神经网络的数据高效深度预测策略训练(DPPT)框架,将图像观测映射到一系列的运动激活。
该体系结构由三个子网络组成,分别称为感知层、策略层和行为层。
感知层和行为层迫使我们对视觉和行为进行抽象分别用合成训练样本和模拟训练样本训练数据。
策略层是一个较小的子网络,具有较少的参数来映射抽象流形之间的数据。
使用策略搜索强化学习的方法对每个任务进行训练。
通过在PR2机器人上训练熟练抓取和投球的预测策略。
下图表示在机器人抛掷ball过程的瞬间图。
由感知层、策略层和行为层组成的深度预测策略体系结构如下图所示。
作为网络输入,给出了一个中心RGB图像。
感知层将图像数据抽象为与任务相关的对象对应的若干空间位置。
策略层将抽象状态随机映射到操作流形中的一个点。
最后,针对给定的采样动作,行为层生成一长轨迹的电机指令,并应用于机器人连续T个时间步长。
文章证明了所提出的结构和学习框架的适用性。
该方法的有效性通过以下事实得到了证明:
这些任务仅使用180次真