多移动机器人编队控制.docx

资源描述

多移动机器人编队控制.docx

《多移动机器人编队控制.docx》由会员分享，可在线阅读，更多相关《多移动机器人编队控制.docx（22页珍藏版）》请在冰豆网上搜索。

多移动机器人编队控制.docx

多移动机器人编队控制

基于Multi-Agent的多机器人编队控制

摘要：

多移动机器人协调是当前机器人技术的一个重要发展方向。

多移动机器人之间的协调与合作将大大提高机器人行为的智能化程度，完成由单个机器人难以完成的更加复杂的作业。

多移动机器人协调技术的研究对提高机器人的智能化水平及加快机器人的实用化进程具有重要的理论研究意义和实用价值。

本文结合多智能体技术对多机器人编队控制进行了研究，同时根据具体的多机器人系统，进行了仿真实验。

验证了多智能体技术在机器人编队控制系统中的应用，完成了小规模的编队控制。

关键词：

多智能体；多机器人；编队控制；协调控制；模糊控制

Multi-robotFormationControlBasedonMulti-Agent

Abstract:

Theproblemofmulti-robotcooperationandcoordinationiscentraltomobilerobotics.Cooperationandcoordinationwillimprovetheintelligentperformanceofrobotsandcancompletelotsofimpossiblemissionsforsinglerobot.Theresearchonmulti-robotcooperationandcoordinationisofgreatacademicandappliedsignificance.Themulti-robotformationisdevelopedcombinedwiththemulti-agenttechnologyinthisdissertation,andthesimulationisdonewiththemulti-robotsystem.Theapplicationofmulti-agentisverifiedinthemulti-robotformationcontrolthroughasmallsystemadoptthefomationcontrol.

Keywords:

Multi-agent;Multi-robot;Formationcontrol;Coordinationcontrol;Fuzzycontrol

1.国内外机器人系统发展现状

自80年代末以来，基于多智能体系统理论研究多机器人协作受到了普遍的关注，从军事领域到工业与民用领域，从星际探险到海底考察，从比赛到教学，都取得了不同程度的进步。

近年来，在IEEER&A,IROS等著名的国际机器人学术会议上，几乎每次会议都有多智能体协作机器人系统的专题。

一些机器人学术刊物出版了有关多智能体机器人的研究专辑。

一些研究项目，如ACTRESS,CEBOT,GOFER,SWARM等，已进行了多年[1]。

目前，国内关于群体机器人系统的研究刚刚起步，基本上还处于基础技术的研究阶段，这方面的研究成果报道比较少。

中科院沈阳自动化所机器人开放研究实验室是国内研究多机器人技术较早也较全面的科研单位。

（1）CEBOT（CellularRoboticSystem）

CEBOT是一种自重构机器人系统（Self-ReconfigurableRoboticSystem），它的研究是受生物细胞结构的启发，将系统中众多的具有相同和不同功能的机器人视为细胞元，这些细胞元可以移动，寻找和组合。

根据任务或环境的变化，细胞元机器人可以自组织成器官化机器人，多个器官化机器人可以进一步自组织，形成更加复杂的机器人系统。

细胞结构机器人系统强调是单元体的组合如何根据任务和环境的要求动态重构。

因此，系统具有多变的构型，可以具有学习和适应的系统智能（GroupIntelligence），并具有分布式的体系结构[3]。

（2）ALLANCE/L-ALLANCE系统

ALLIANCE是由美国学者Parker提出的用于研究异质、中小规模、独立性强的、疏松配合关系的机器人协调的一种结构。

通过传感器信息和精确的广播（Broadcast式通讯）来感知自身的行动效应和其他机器人的行动。

每个机器人是基于行为控制的。

L-ALLIANCE是该结构的扩展，通过再励学习来调整行为控制器的参数[4]。

（3）CooperativeRobotics实验系统

美国OakRidge国家实验室的LynneE.Parker博士在多Agent协作、自主Agent体系结构、多Agent通讯等方面做了许多工作[11~17]。

例如人机协作，移动机器人协作，多Agent协作，智能Agent体系等。

他们研究的协作机器人是集成了感知、推理动作的智能系统，着重研究在环境未知且在任务执行过程中环境动态变化的情况下，机器人如何协作完成任务。

（4）SociallyMobile和TheNerdHerd实验系统

美国USC大学的学者如M.J.Mataric等在基于行为的多机器人协作方面做了许多工作。

他们采用自下而上的路线，基于行为的方式研究分析、设计机器人群行为的表现，在多机器人学习、群体行为、协调与协作等方面展开工作[3]。

（5）中科院沈阳自动化所机器人开放研究实验室

主要面向发展具有感知、思维和动作能力的先进机器人系统，研究机器人学基础理论方法、关键技术、机器人系统集成技术和机器人应用技术。

我国机器人学领域著名科学家蒋新松院士曾任实验室主任。

实验室现任主任为沈阳自动化研究所所长王越超研究员。

图1.1CEBOT（CellularRoboticSystem）图1.2CooperativeRobotics实验系统的CESAREmperor

图1.3沈阳自动化所多机器人系统

2.多智能体系统的分类

Agent作为智能计算实体，能自主完成一定任务。

但是，实际中所有的系统都是分布式的，个体的知识、能力都是有限的，面对一些复杂的问题，如具有分布式数据或知识，或要求分布式控制的系统，不得不采用多个Agent协作系统。

通过适当的体系结构将个体组织起来，不仅能够弥补个体的不足，而且能使整个系统的能力超过任何单个个体的能力，这样的系统称为多智能体系统（Multi-AgentSystem，MAS）[1]。

多智能体系统的体系结构主要研究如何将多个单智能体组织为一个群体并使各个智能体有效地进行协调合作，从而产生总体解决问题的能力。

多智能体系统是由大量具有环境观察、任务规划和操作功能的智能体组成。

为了把这些智能体组织成一个复杂的系统，来有效的完成某些预定任务，需要一个合适的控制结构。

多智能体系统的体系结构可从不同的角度来划分。

2.1根据系统中智能体之间的相对关系来划分

按照系统中多智能体之间的相对关系，通常多智能体系统可以分为如下几种结构：

（1）完全型网络结构

通信对等和信息的局部化是该类型结构的主要特点。

该结构体系要求各智能体均具有通信和控制功能模块，并且要保存系统内所有智能体成员的信息和知识，还要求保持所有智能体之间的通讯链路。

对于解决复杂的问题、或结构复杂的系统来说，完全型网络结构体系的效率会大大降低，并呈现出一种无组织的状态[2]。

（2）层次型网络结构

在该类型系统结构中，智能体被分为不同的层次，在同一层上的智能体彼此不能够直接进行通信，而需要经过其上一层智能体来完成。

上一层智能体负责其下一层智能体的决策和控制。

该结构中智能体不需要保存系统内所有的智能体信息，只需要保存下一层智能体的相关信息和知识，该结构尽管在通信上不如完全网络型简略，但结构层次分明，管理方便[2]。

（3）联盟型网络结构

系统内的智能体按照某种方式（通常按照距离远近、智能体功能等）来划分为不同的智能体联盟。

在各联盟内部都存在一个协助智能体，它负责不同联盟之间的通信。

不同联盟之间处于对等的关系，类似于完全网络型各智能体之间的关系[2]。

图2.1完全型网络结构图2.2层次型网络结构

图2.3联盟型网络结构

2.2从多智能体协调系统的体系结构来划分

多智能体协调系统的体系结构是整个系统执行协调合作任务的基础，决定了系统的能力和局限性。

多智能体协调系统的体系结构分为集中式（Centralized）、分散式（Decentralized）和分布式（Distributed）三种。

协调（Coordination）是指智能体对自己的局部行为进行推理，并估计其他智能体的行为，以保证协作行为以连贯的方式进行的一个过程。

（1）集中式（Centralized）控制结构

系统由一个智能体集中控制整个系统，它是一种规划与决策的自上而下Top-Down式的层次控制结构，其层的数量和复杂性决定了系统响应所需的时间和行为决策的质量。

系统的协调性较好，但实时性、动态性较差，对环境变化响应能力差，集中式系统由一个核心智能体和多个与之在结构上分散的、独立的协作智能体构成。

核心智能体负责任务的动态分配与资源的动态调度，协调各协作智能体间的竞争与合作。

该类系统较易实现系统的管理、控制和调度。

（2）分散式（Decentralized）控制结构系统

各智能体具有高度智能自治能力，各智能体自行处理信息、自行规划与决策、自行执行自己的任务，与其它智能体相互通讯来协调各自行为而没有任何集中控制单元.这种结构有较好的容错能力和可扩展性，但对通讯要求较高（多边通信），且多边协商效率较低（各有各的算法，思路不统一），无法保证全局目标的实现。

（3）分布式（Distributed）控制结构系统

其介于上述两者之间，是一种全局上各智能体等同的智能分布一分层式结构而局部集中的结构方式。

这种结构方式是分散式的水平交互与集中式的垂直控制相结合的产物，其由彼此独立、完全平等、无逻辑上的主从关系的、能够自律的一组智能体构成。

各智能体按预先规定的协议，根据系统的目标、状态与自身的状态、能力、资源和知识，利用通信网络相互间协商与谈判，确定各自的任务，协调各自的行为活动，实现资源、知识、信息和功能的共享，协作完成共同的任务以达到整体目标。

在该类系统中，各智能体在结构和功能上彼此独立，都以同样的方式通过网络通信相互发生关系，具有良好的封装性，因此使系统具有很好的容错性、开放性和扩展性。

既提高了协调效率，又不影响系统的实时性、动态性、容错性和扩展性[5]。

图2.4集中式、分散式、分布式控制系统结构

3.多机器人控制系统模型

系统控制结构明确了系统中具有不同职能的个体相互间的控制关系。

与MAS体系结构相同，多移动机器人系统的控制结构也分为集中和分散两种类型，其中分散式又可分为分层式和分布式。

为了实现多移动机器人系统动态和灵活的控制，借鉴MAS体系结构的研究，这里设计了一种多移动机器人协调控制系统模型。

图3.1智能控制器结构

该系统控制结构的上层是由中央控制器、避障模块、多移动机器人路径规划、任务规划模块、人机界面和通讯模块组成。

它的核心是中央控制器，它负责调用其它的智能体以及对其各个智能体进行协调控制。

下层是具有一定智能的各个机器人组成。

中央控制器由四个系统（知识库系统、模型库系统、数据库系统及总控系统）构成。

其中总控系统控制着其它三个系统的连接与调用。

知识库系统从数据库系统中取得事实进行推理,从而决定从模型库中调用何种模型进行计算并确定模型中的一些参数。

选定的模型从数据库中获得初始数据进行运算并将运算结果送回数据库。

4.多机器人系统中的信息交互

在目前的多机器人系统中，由于考虑到现场的复杂性与系统的灵活性，普遍采用无线通信来完成多机器人之间的数据交互。

在无线通信领域存在有多种通讯方式，各种通讯方式有各自的特点，根据具体的通讯系统，采用不同的无线通讯手段。

在我们试验系统中采用的是无线局域网（WLAN），无线局域网利用了无线多址信道和宽带调制技术来提供统一的物理层平台，并以此来支持计算机和相关设备之间的数据通信，并为通信的移动化、个性化和多媒体应用提供了可能。

因此在多机器人协调控制中，无线局域网完全能满足通讯与可靠性的要求[2]。

4.1无线局域网络

无线局域网的设备通常有以下几种：

无线网卡（终端）、无线接入点（AccessPoint接入端）、无线网桥（点对点传输设备）

图4.1基于无线网桥的无线局域网设置

该系统是以对Pioneer3H8-AT机器人的改造基础上形成的HEBUT2机器人和另一台同结构的机器人为平台进行研究的。

本系统中的各机器人之间的通信系统是建立在以WLAN为基础，利用基站和多移动机器人进行一点对多点的通讯。

在我们的多机器人系统中，我们采用了802.11b协议，具体的协议定义与通信帧的结构可以参考802.11b的国际标准。

在无线通信的建立上可以借助与多种专用的软件来编程实现，在我们的系统中采用了另外一种方法，即在VisualC++环境下应用WINSOCK控件进行网络编程。

WINSOCK控件提供了访问TCP和UDP网络服务的方便途径。

采用TCP协议可以提供双向的、可靠的、有序的和无重复投递的数据流。

TCP允许创建和维护与远程计算机的连接，连接两台计算机就可彼此进行数据传输。

用户数据文报协议（UDP）是一个无连接协议。

采用UDP协议，支持双向的数据流，但计算机并不建立连接，不保证有序、可靠或无重复的投递。

在使用中，采用TCP协议的编程模型应用最为广泛，因为面向连接协议提供了一系列的数据纠错功能，可以保证在网络上传输的数据及时、无误地到达对方，Internet上的多数服务（WWW、FTP、Telnet、SMTP）就是靠此协议运转的。

采用UDP协议由于不用建立连接，传输比连接协议快，无数据纠错功能，不保证数据的可靠传递。

比较上述的TCP和UCP两种通信协议后，本项目采取了TCP协议进行通信。

4.2WINSOCK使用的主要函数

Server端使用的主要函数：

Bind（）函数指定用于TCP连接的LocalPort和LocalIP。

Listen（）函数设置侦听模式。

该方法仅适用于TCP连接。

Accept（）在处理ConnectionRequest事件时用这个方法接受新连接。

SendData（）用于数据的发送。

Close（）关闭与对方的连接。

Client端使用的主要函数：

Connect（）要求连接到远程计算机。

GetData（）得到远程计算机上的数据。

图4.2WINSOCK通信流程

4.3无线网络应用层协议

多移动机器人系统利用WLAN建立的通信是建立在TCP/IP协议栈上的应用层的协议，协议中的主要是利用底层的TCP/IP协议规定特定格式的字符串，这些字符中包含着：

各机器人的当前的状态信息；主控端对各机器人的遥操作信息；各机器人上的传感器信息。

包括了两组共6个颜色传感器的开关量信息，以及车体上的两组共6个超声传感器返回的测距信息。

还包括了GPS接收机接收到的位置信息，以及条码传感器采集回来的位置信息等内容。

4.4在通信系统中的应用

多移动机器人的通信系统中分为了移动机器人端和控制台端两部分。

但在网络结构上，移动机器人端为服务器端（server），而控制台端为客户端（client），这中分配方式的原因有以下几点。

⑴移动机器人端的PC一旦启动后就没有办法在对其进行操作了。

由于移动机器人的移动端PC并没有安装显示器，以及键盘鼠标等输入设备，所以一旦开启PC后，移动机器人自动进入WINME操作系统，然后自动启动编写好的程序，等待终控端的连接，所以要将移动端作为server端。

⑵移动机器人通信系统的可扩展性。

移动机器人的通信系统中可涉及的通信对象并不只有一个移动机器人，所以控制端的连接要有选择性，通信也要有选择性。

终控端可以同时连接多个移动机器人，并进行多机的同时控制。

5.多机器人系统编队避障控制

所谓队形控制就是指多个移动机器人在前进的过程中,保持某种队形,同时又要适应环境（例如障碍物）约束的控制技术。

队形保持控制一般分为两步:

首先根据当前环境确定各机器人的目标位置；然后根据一定的控制策略生成控制命令，驱动机器人以一定队形驶向目标位置。

路径规划主要涉及的问题包括：

利用获得的移动机器人环境信息建立较为合理的模型,再用某种算法寻找一条从起始状态到目标状态的最优或近似最优的无碰撞路径；能够处理环境模型中的不确定因素和路径跟踪中出现的误差,使外界物体对机器人的影响降到最小；如何利用已知的所有信息来引导机器人的动作,从而得到相对更优的行为决策[4]。

5.1几种常见的编队控制策略[2]

多移动机器人的路径规划问题不单纯是单个移动机器人的路径规划问题的延伸,还要考虑多移动机器人之间的协调、编队避障（机器人可能成为其他机器人的障碍）等,因而使问题更加复杂。

1.跟随领航者法

跟随领航者法的基本思想是：

在多移动机器人组成的群体中，某个机器人被指定为领航者，其余作为它的跟随者，跟随者以一定的距离跟踪领航机器人的位置和方向。

对该方法进行拓展，可以指定一个领航者，也可以指定多个领航者，但群体队形的领航者只有一个，这与一个步兵班在进攻中可以划分为若干战斗小组是类似的。

根据领航者与跟随机器人之间的相对位置关系，就可以形成不同的网络拓扑结构，即形成不同的队形。

该方法中，协作是通过共享领航机器人的状态等信息实现的。

跟随领航者法的优点是，仅仅给定领航者的行为或轨迹就可以控制整个机器人群体的行为。

该方法的主要缺点是系统中没有明确的队形反馈，例如，如果领航机器人前进得太快，那么跟随机器人就有可能不能及时跟踪。

另一个缺点是如果领航机器人失效，那么整个队形就会无法保持。

2.基于行为法

基于行为法的基本思想是：

首先为机器人规定一些期望的基本行为，一般情况下，机器人的行为包括避碰、避障、驶向目标和保持队形等。

当机器人的传感器受到外界环境刺激时，机器人根据传感器的测得的信息作出反应，改变自身的运动方向和速度。

行为选择模块通过一定的机制来综合各行为的输出，并将综合结果作为机器人当前的行为输出。

该方法中，协作是通过共享机器人之间的相对位置、状态等信息实现的。

对该方法的拓展和改进主要体现在对各行为输出的处理上，即行为选择机制上。

3.虚拟结构法

假想将刚体上的某些点用机器人代替，并以刚体上的坐标系统作为参考坐标系，那么刚体运动时，机器人在参考坐标系下的坐标不变，机器人之间的相对位置也保持不变，即机器人之间可以保持一定的几何形状，它们之间形成了一个刚性结构，这样的结构称为虚拟结构。

虽然每个机器人相对于参考系统位置不变，但它仍可以一定的自由度来改变自己的方向。

多移动机器人以刚体上的不同点作为各自的跟踪目标就可以形成一定的队形[2]。

5.2多机器人编队策略

本文选用的是美国ActivMedia公司生产的Pioneer3H8-AT机器人，它有四个橡胶轮胎，同侧轮是由一个伺服电机驱动，类似与履带式驱动结构。

因此可以将其简化成两轮移动载体模型，且两轮同轴而且位于车体的中心位置[4]。

Pioneer3移动机器人上装有颜色传感器、条码传感器、路径跟踪CCD、监视CCD，它们负责环境感知信号的采集；视频传输模块将CCD的A/V信号传输到监视器上，可以远程监视；无线网卡负责移动机器人和外界的数据通信。

Pioneer3H8-AT移动机器人的下位机MCU承担了底盘驱动和传感信号采集的工作，并将各种信息传输给上位机，待上位机处理以后，再将输出的信息通过串口通信送往底层控制，以实现移动机器人的两轮驱动。

控制策略：

本文是以Pioneer3移动机器人改造后的HEBUT2机器人作为领航机器人，它要一直沿着一根宽度为5～6cm的红色的轨迹运动到一个目标位置，另一机器人一定的距离跟踪领航机器人的位置和方向。

图5.1经改装后的Pioneer3移动机器人

领航机器人用于路径跟踪的传感器有两种方案：

一种方案是路径跟踪CCD，另一种方案是颜色传感器和条码传感器组合。

当使用路径跟踪CCD时，运用图像处理的方法从CCD采集的图像信息中提取出路径，经过CCD坐标和车体坐标的换算得出移动机械手相对与车体的偏航角，进而由程序处理发出纠偏指令，移动载体进行纠偏。

再通过路径上所贴的不同颜色的路标进行定位。

其优点是纠偏量合理，路径跟踪轨迹圆滑，但精度较差，且易受光线影响。

图5.2颜色传感器与条形码传感器

颜色和条码传感器组合的方案中，颜色传感器使用的是KEYENCE公司的CZ-V1,CZ-10，它对颜色的辨识准确、误报率低、运行可靠。

选用两组对路径进行辨识，当机器人偏差较大时，颜色变化引起传感器I/O输出量变化，主机PC检测到后程序纠偏，完成巡迹。

条形码传感器主要是起定位的作用，当机器人运动到条形码的上方时，条码扫描器扫中条码同时将条码的内容通过串口发给主机，主机解析条码的内容来做出相应的动作。

其优点是跟踪准确，不易受干扰，但跟踪轨迹成“之”字形比较严重。

在实际使用中，采取两种方式结合使用，取其优势，视现场情况而定。

多移动机器人队形控制中应该做到：

①队列向目标区域运动时尽量保持队形（除非队列中有机器人遇到障碍物）；②机器人在遇到障碍物后，先进行避障，然后恢复队形并要求时间尽可能的短，恢复队形后再向目标位置运动。

5.3多机器人编队控制算法

本课题采用了闭环l-ψ编队控制算法。

l为两机器人之间的相对距离，ψ为两机器人间的相对角度。

算法的中心思想是将机器人间的l和ψ保持在一个固定的值[1]。

ROBOT1是leader,ROBOT2是follower。

那么，ROBOT2跟随ROBOT1运动。

每台机器人的位姿为（xi,yi,θi），它们就是机器人的参考原点的坐标，已在全局坐标系中表示出来。

O是全局坐标系原点。

机器人的转动中心点位于中心轴上两驱动轮的中心位置。

ROBOT1和ROBOT2的两参考原点间的直线距离就是两机器人间的距离l，d表示参考点和转动中心点间在中心轴线上的直线距离。

线速度的正方向为机器人前行的方向，角速度的正方向为逆时针方向。

图5.3两个机器人的数学模型

对于第i号机器人来说，它本地的状态变量（xi,yi,vi,ωi）是从定位线程得到的，而它所得到的其他机器人的信息（xj,yj,θj,vj,ωj）（j≠i）是通过无限网卡传输过来的。

跟随机器人将自己与领航机器人间的相对参数（l,ψ）以及系统所期望的理想之（ld,ψd）之差反馈于机器人自身，再通过比例控制器将这一反馈信息作用于自身的速度（v）和角速度（ω），从而完成跟随控制。

5.4恢复队形阶段的路径规划

当队形被严重打乱时，队列的首要任务是快速恢复队形。

保持队形的控制方法虽然可以保证队形收敛到目标队形，但所需的恢复时间较长，因此需要寻找更有效的控制方法以保证队形快速恢复。

显然，队列恢复队形所需的时间就是队列中最后到达局部目标位姿的机器人所花费的时间。

因此本论文将快速恢复队形问题转化为寻找各机器人局部目标位姿问题，使得各机器人从当前位姿运动到对应局部目标位姿的最长时间最短[5]。

记R（i=1,2,…,n）当前位姿为Qi，局部目标位姿Giq,最终位姿Qi*。

显然，当队列恢复队形时，各机器人的局部目标位姿受到l-ψ编队参数的约束，故只要确定队列中一个机器人的局部目标位姿，即可得到其他机器人的局部目标位姿。

本文直接规划R1的局部目标位姿Q1g，其他机器人的局部目标位姿Qig可根据Q1g计算得到。

5.5多机器人编队中避障控制

本论文使用了一种基于模糊逻辑的移动机器人“感知—动作”行为控制的新方法利用模糊逻辑来融合多个“感知—动作”行为，来改善系统的实时性和可靠性。

模糊控制的核心部分为模糊控制器。

模糊控制器的控制规则由计算机的程序实现，微机通过采样获取被控制量的精确值，然后将此量与给定值比较得到误差信号E（在此取误差反馈）。

一般误差

展开阅读全文