完整版2D 仿真机器人足球整体性能的优化与实现毕业设计.docx

资源描述

完整版2D 仿真机器人足球整体性能的优化与实现毕业设计.docx

《完整版2D 仿真机器人足球整体性能的优化与实现毕业设计.docx》由会员分享，可在线阅读，更多相关《完整版2D 仿真机器人足球整体性能的优化与实现毕业设计.docx（44页珍藏版）》请在冰豆网上搜索。

完整版2D 仿真机器人足球整体性能的优化与实现毕业设计.docx

完整版2D仿真机器人足球整体性能的优化与实现毕业设计

中图分类号：

TP393.17

本科生毕业设计

（申请学士学位）

论文题目2D仿真机器人足球整体性能的优化与实现

作者庞伟

所学专业名称计算机科学与技术

指导教师赵瑞斌

2012年3月10日

论文答辩日期：

2011年5月13日

指导教师：

（签字）

滁州学院本科毕业设计（论文）原创性声明

本人郑重声明：

所呈交的设计（论文）是本人在导师的指导下独立进行研究所取得的研究成果。

除了文中特别加以标注引用的内容外，本论文不包含任何其他个人或集体已经发表或撰写的成果。

本人完全意识到本声明的法律后果由本人承担。

2D仿真机器人足球整体性能的优化与实现

摘要：

随着计算机技术的告诉发展，分布式人工智能中的多智能体系统（MAS:

Multi-agentSystem）的理论与及应用研究已经成为人工智能研究的热点。

RoboCup（RobotWorldCup，即机器人足球世界杯）作为人工智能和机器人学新的标准问题，具有多智能体系统的诸多特征，是各种新理论和技术良好的试验平台。

本文首先介绍了RoboCup的研究背景，然后介绍了rcssserver的的仿真环境。

从第三章开始切入本文正题，首先从团队整体策略和智能体体系结构两方面讲解了多智能体系统架构，其中应用了混合型的智能体体系结构将智能体架构分为建模模块、通讯模块、动作模块、知识库模块、规划决策模块和反应模块。

第四章讲解了利用在线教练实现异构智能体的选择和辨识，并给出了智能体的选择和分配的框架。

第五章在异构智能体的前提下重新完成了智能体间配合和对抗中典型动作的精炼。

整体上对仿真机器人足球系统进行了优化。

关键词：

RoboCup；分布式人工智能；多智能体系统

OptimizationandImplementationofthe2Dsimulationoftheoverallperformanceoftherobotsoccer

Abstract:

Withthedevelopmentofthecomputertechnology,researchonthetheoryandapplicationofMulti-agentsystem（MAS）thisdomain.First,thispaperintroducestheresearchbackgroundofRoboCup.Second,thesimulationenvironmentofrobotsoccer.Afterpresentingtheaimofthisthesis,firstitintroducesthearchitectureofthemulti-agentsystemfromtwoaspectsoftheteam’soverallstrategyandtheagentarchitecture,itapplythetheteam.Thearchitectureconsistsofmodeling,communication,actions,domainknowledge,deliberativereasoningandreactivemodule.Accomplishedtheassignmentandrecognitionofonlinecoachinchapterfour,someessentialguidelinesareabstractedandtheframeworkofassignmentissetupwiththeseguidelines.Refinedthetypicalactionswithchapterfive.Itoptimizationthesimulationsystemasawhole.

Keywords:

RoboCup;DistributedArtificialInligence;Multi-agentsystem

1绪论

1.1背景及意义

智能体（Agent）和多智能体系统（MAS：

Multi-agentSystem）是当今人工智能领域的研究热点之一，其应用背景包括各类自主机器人、网络信息代理、分布式过程控制和新一代软件工程。

Agent的理论和研究技术最早源于分布式人工智能，但从80年代末开始，Agent理论及技术研究从分布式人工智能中拓展出来，并与许多其他领域的知识互相借鉴，在许多不同于人工智能领域得到了广泛的应用。

现在对Agent的特性研究中，认为一个Agent最基本的特性应该包含反应性、自主性、面向目标和社会性，然后根据其应用情况可以拥有其它特性：

移动性、自适应性、反应性、理性、持续性、自启动和自利等特性。

Agent概念的提出为人们提供了一种系统分析、计算和问题求解风范[1]。

多智能体系统的协作求解问题的能力超过单个的Agent是MAS产生的最直接原因，导致MAS研究逐渐兴起的其他原因还包括：

与已有系统或软件的互操作；提高系统的效率和鲁棒性等。

与单个Agent相比，MAS具有以下特点：

每个Agent仅拥有不完全的信息和问题求解能力，不存在全局控制，数据是分布的，计算过程是并行的。

基于MAS的模型概念模型代表了一种分析、设计和实现复杂、大型系统的方法途径。

如何在多Agent动态环境中实现Agent的灵活性和动作执行性，是当前MAS的研究热点。

此时，RoboCup作为人工智能和机器人学新的标准问题被提了出来，其具有MAS的诸多特征，成为各种新理论及技术的良好试验平台。

1.2RoboCup机器人世界杯

RoboCup机器人世界杯是国际上一项为促进分布式人工智能、智能机器人技术及相关领域的研究与发展而举行的大型比赛和学术活动。

它通过提供一个标准的平台来检验各种智能机器人技术。

它的最终梦想是在2050年组建一支能够打败人类足球世界杯冠军的机器人足球队[2][3]。

机器人足球赛的最初想法由加拿大不列颠哥伦比亚大学的AlanMackworth教授于1992年正式提出。

日本学者立即对这一想法进行了系统的调研和可行性分析。

1993年，MinoruAsada、HiroakiKitano和YasuoKuniyoshi等著名学者创办了RoboCup机器人世界杯（RobotWorldCup，简称RoboCup）。

与此同时，一些研究人员开始将机器人足球作为研究课题。

隶属于日本政府的电子技术实验室（ETL）的ItsukiNoda以机器人足球为背景展开多智能体系统的研究，日本大坂大学的浅田蟋、美国卡耐基-梅隆大学的Veloso等也开展了同类工作。

1997年，在国际最权威的人工智能系列学术大会-第15届国际人工智能联合大会（The15thInternationalJointConferenceonArtificialInligence，简称IJCAI-97）上，机器人足球被正式列为人工智能的一项挑战。

至此，机器人足球成为人工智能和机器人学新的标准问题。

将机器人足球作为未来人工智能和机器人学标准问题是十分恰当的，主要是由于机器人足球具有以下特点：

（1）典型性：

RoboCup机器人足球队的研制涉及当前人工智能研究的大多数主要热点，因而构成一个典型问题。

（2）可行性：

多Agent系统多数实际背景十分复杂，以致研究人员在目前条件下难以把握，无法兼顾具体细节分析与探索基本问题。

而在机器人足球中则较易兼顾二者，易于深入。

（3）客观性：

比赛提供了一种实验平台和评价各种理论与技术的客观方法，便于研究者的“观察”和相互交流。

（4）综合性：

在以往的研究中，各种技术通常被分为开发和考察，综合集成工作一般由面向最终用户的应用部门来完成，这种方式不利于相关技术在更高层次上的衔接和更深层次上的创新，而机器人足球是一个深层次的“综合平台”。

因此，开展机器人足球的研究是人工智能从基础理论走向实际应用的一个战略性步骤。

1.3RoboCup仿真比赛

RoboCup仿真机器人足球比赛是在RoboCup官方提供的仿真平台上进行的，因此设计者不必考虑硬件实现，而将研究集中在动态不确定环境下的问题求解与多智能体合作[4][5][6]。

RoboCup仿真球队决策的难点在于以下几点：

（1）问题复杂：

RoboCup仿真机器人足球比赛中，如果对于场上的22名球员的位置和速度、球的位置和速度等特征完全描述，无疑状态空间极其巨大。

如何合理的描述状态并求解决策问题，是一个十分重要的难点，而且RoboCup仿真平台中的噪声也是必须要考虑的问题。

（2）信息不完全：

RoboCup仿真球队的球员不能完全了解场上的所有信息，仿真平台限制了球员获取信息的途径，每一个球员都必须依赖自身获得的有限信息进行决策。

如何获得更多的有效信息，如何利用有限信息进行合理的决策，是RoboCup球队决策的一个重要问题。

（3）决策的实时性：

RoboCup仿真环境是一个实时动态环境，环境可能发生不可预期的改变，这将使得原有的决策不再适用。

这种情况下，要求Agent能够根据场上情况变化，及时做出反应，决策必须实时高效。

（4）多智能体的对抗与合作：

RoboCup仿真机器人足球比赛中，存在多个独立决策的球员，他们之间既存在合作（同一球队内）也存在对抗（两支球队之间）。

如何使球员间协商、规划以实现合作完成任务并在对抗中取得最大效益，这是RoboCup仿真足球的一个重要研究问题。

（5）通讯带宽有限且不可靠：

多智能体的合作中，通讯能够起到非常重要的作用。

而RoboCup仿真平台对球员间的通讯给与了一定的限制。

在有限带宽且不可靠的通讯上，如何保证合作的顺利进行，这也是需要解决的问题。

1.4论文组织结构

第1部分，绪论，介绍机器人足球的研究背景及RoboCup。

第2部分，RoboCup仿真比赛综述，介绍RoboCup仿真比赛以及RoboCup仿真平台。

第3部分，多智能体系统架构，从总体上介绍了仿真机器人足球比赛的相关知识。

第4部分，异构智能体的选择和辨识，介绍仿真机器人足球比赛中异构智能体的概念和用法。

第5部分，智能体间的配合与对抗，介绍仿真机器人足球系统的决策方法以及实现。

第6部分，系统架构，介绍仿真机器人足球系统整体的架构。

2RoboCup仿真比赛综述

RoboCup仿真机器人足球比赛是RoboCup比赛中参加人数最多、历史最久的子项目，仅需要几台计算机就可以进行比赛，全部的活动由计算机进行模拟，可以避免机械电路的各种硬件限制，将精力集中于高层的算法研究中，在实时异步有噪声的对抗环境下，研究多智能体间的合作与对抗问题。

2.1RoboCup仿真平台简介

RoboCup仿真平台是一套能够不同语言编写的自主球员进行足球比赛的系统。

比赛的执行采用的是服务器客户端（serverclient）模式，服务器端程序rcssserver提供了一个虚拟场地并且模拟包括球和球员在内的所有物体的移动，每个客户端程序相当于一个球员的大脑，控制场上该球员的移动。

服务器端和客户端之间是通过UDPIP协议进行信息交互的，也就是说，开发者可以使用任何支持UDPIP协议程序的语言来设计球队程序。

通过UDPIP协议，客户端程序可以发送指令去控制相应的场上球员，而服务器端按照规则给每个客户端发送它所能获得的信息。

每个客户端只允许控制一名球员，所以每队必须同时运行与比赛球员数目相等的客户端程序。

客户端之间的通讯必须通过服务器端根据规则来进行转发，任何不经过服务器客户端直接联系的行为都是违反规则的。

当一场比赛开始时，双方11个独立球员的程序，连接到服务器端进行比赛，每个队的目标就是将球踢进对方球门的同时阻止球进入自己的球门[4]。

2.2比赛服务器端

比赛服务器端包括两个主要程序：

rcssserver和rcssmonitor。

rcssserver作为一个服务器程序模拟所有球员、球的移动、球员通讯以及根据比赛规则控制比赛进程。

rcssmonitor是一个程序将从rcssserver那里获得的场上比赛信息显示到一个虚拟的足球场地上，由客户端程序控制的队员可以在场上跑动、踢球等。

rcssserver主要由球场仿真模块、裁判模块和消息板模块三个部分组成，如图2-1所示。

图2-1rcssserver结构图

球场仿真模块计算球场上对象的运动，检测他们之间的碰撞。

球场上的对象包括每队各11名队员、球、球门、标记及标志线等。

其中球和球员都具有大小、位置、速度、加速度等属性，球员则还有方向、耐力等属性。

球员与球的属性每个周期末更新一次，计算的依据是动力学定律。

如果球员与球员或球之间发生重叠，则作碰撞处理。

裁判模块依据比赛规则控制比赛的进程。

由于仿真比赛环境具有动态、实时、不确定、多主体对抗等特点，比赛不可能按照事先的设计按部就班的进行，还需要在比赛中有一个“智能”裁判。

目前这个内嵌的人工裁判只是部分实现，可以检测一些简单的形式，如进球、界外球、越位等。

然而，还是有一些很难检测的状态，如双方对峙、谁都不踢球，这就需要一个人为裁判。

所有的参赛球队都必须遵守一个“绅士协定”，包括不能利用比赛漏洞等有碍比赛公平的做法。

消息板模块负责客户端之间的通讯。

每个客户端程序通过UDP的socket来连接server。

同样，通过socket，客户端程序可以发送命令来控制球员，也可以接受球员的感知信息。

rcssserver采用离散化模式运行，即所有程序运行都是以仿真周期为单位。

在每个仿真周（simulatorstep，缺省为100毫秒）结束前，server收集所有球员程序的行为请求，直到每个周期末才统一执行并更新场上信息。

在每个周期的开始，server根据各个球员的状态（包括可视范围、获得时间等）发送相应的已更新的场上信息，体现了球员感知信息和行动的异步性。

如果一个球员在一个周期内发送了多于一条的独立行为请求，server将只执行第一个。

因此，球为了保证执行自己的真实意图，每周期就只能发送一条独立行为请求；另一方面，如果球员在一个周期内没有发送行为请求，他将失去该周期的行动机会，对于这样一个实时对抗的环境无疑是很不利的。

在rcssserver平台上比赛时，所有仿真比赛场景都可以通过一个可视化程序rcssmonitor显示在电脑屏幕上。

它通过一个特殊的端口（缺省为6000）直接和服务器端连接，获得比一般球员程序更全面、更准确的信息，使得用户可以生动地看到比赛的整个过程，并且可以控制比赛的进程。

另外，球场和球场上的对象都是二维的，任何对象都没有高度的概念。

球用一个实心原点表示。

场上每个队员用一个圆圈表示，从圆心处引出两条线段，红色线段代表球员脖子的朝向，黑色线段代表球员身体的朝向。

当球员体力低于2400时圆圈一周会变成红色代表此球员体力不支。

如图2-2所示。

图2-2球场界面

2.3球员客户端

一个球员客户端程序通过UDP接口连接到服务器端。

通过这个接口，客户端程序可以发送命令来控制场上的一个球员行动以及接收到这名球员的感知信息。

换句话说，一个球员客户端就是球员的大脑：

从服务器端接收到感知信息，并且发送命令到服务器端[5]。

如果球员程序都是独立的进程，通过一个特定的端口和服务器端连接。

当一个球员程序和服务器端建立好连接以后，所有通讯信息都通过这个端口传输。

一个球队最多可以连接12名队员，其中包括11名队员（其中一个是守门员）和1名场上教练。

这些球员程序向服务器端发送请求执行相应行为（如踢球、转身、跑步等），服务器端分析处理这些请求，相应的更新场上比赛状态。

另一方面，服务器端给所有队员提供他们可以感知到的信息，如球员可以看到的视觉信息、球员自身的状态信息等。

由于服务器端实际上是一种以离散时间片（或称为周期）为时间单位工作的实时系统，球员程序必须在每个指定仿真周期内及时做出决策并及时将请求发送给服务器端，否则将错过执行动作的机会。

这就要求球员决策要有比较高的实时性。

正式比赛中每个客户端程序只能控制一个场上队员。

因此，要组成一支球队就需要同样数量的程序分别控制每个队员。

球员之间的通讯必须经过比赛平台按照say和hear命令协议执行，而且通讯环境具有单信道、窄带宽等特点。

仿真比赛平台的一个目的就是要评估多智能体系统，智能体之间的高效通讯也是其中的一个判别标准。

为了尽可能模拟现实环境，比赛平台还加了很多限制。

比如，每个队员都有一定的视野范围，每次只能获得局部信息，即包括可视范围内的对象信息，而且是有随机噪音的；每个球员都有自己的体力值，随跑动衰减，每周期可以自动恢复一些，这样就限制球员要注意调整跑动速度，合理分配体力，也更符合现实。

另外，为了反映出实际比赛中球以及球员运动的不确定性，server还引入了风及噪声的干扰及对行为参数的干扰，使比赛更趋于真实，正如现实比赛很难无风和噪声的干扰，快速跑动中的队员不太可能急转弯等等，但这也增大了准确建模的难度[6]。

2.4仿真平台主要特点

通过上面的介绍可以看到，RoboCup仿真平台提供了一个很好的、全分布的、包括合作与对抗的多智能体实时环境，非常有挑战性。

其具体特点总结如下：

（1）状态空间极大：

仅仅考虑22个球员的位置和速度情况：

每个队员的位置范围处于68×105的赛场上，最大速度为1.0，保留到小数点后一位，再加上速度方向的考虑，共有680×1050×10×360=109种可能，这样就存在（109）22=10198个状态，如果再增加足球状态等信息，则状态空间将更为巨大。

（2）动态、实时、不确定的环境：

在服务器端，整个系统按照100毫秒的周期运转，所有的球员都必须按照则个周期运行，意味着球员的所有决策必须实时完成，由于多智能体的存在，环境在动态的变化，无法预知。

（3）感知和行为异步：

由于比赛时间以周期为单位离散，感知和行为就无法同步，所以光靠传统人工智能方法使用感知来激发行动是远远不够的。

（4）球员能力受限：

场上所有球员的能力都是参照真实球员有所限制的，如体力、加速度、最大速度、惯性等。

（5）视觉受限：

每个球员的视觉都是局部的，受到球员视角和视距的限制，也就是说球员在任何时刻都只能获得一部分球场上的信息，这就给球员正确分析场上形势，进而产生决策带来了困难。

（6）通讯受限：

球员之间的通讯环境具有单信道、窄带宽等特点，即每队球员公用一条信道，每个球员一个周期内只能“听”到队友一条消息，而且信道容量很有限（缺省为10字节）。

（7）多智能体的对抗与合作：

本方智能体是合作关系，要协调个体目标与全局目标的冲突；而对抗智能体的竞争关系则意味着执行任务时要遇到更多的障碍。

RoboCup仿真比赛充分体现了人类足球的特点，也集中了许多人工智能领域关注的重点问题。

用户可以运用包括数学建模、搜索推理、数据挖掘、机器学习、动态规划等各种知识、技术来开发球队，并通过该平台进行实践、检验，很好的推动了相关学科理论的研究。

3多智能体系统架构

多智能体系统是多个自主智能体的集合，当这些智能体为了一个共同的目标协调合作时，称之为形成了一个团队。

一个有共同目标的多智能体系统需要在设计之初就从整体上考虑其协作方法[7]。

本章首先站在团队整体的高度，结合具体的领域知识，探讨基于站位和通讯的协作策略；然后介绍了智能体所采用的混合型体系结构；最后从程序设计的角度说明系统架构的具体实现。

3.1团队整体策略

足球比赛是个集体的项目，由11个场上队员共同完成多进球赢得比赛的任务。

但是，每个智能体只拥有局部的视觉，而且其执行的动作也只能直接影响到局部的环境。

如何进行全局决策，达到多智能体间的配合，必须是基于领域知识的合作，可以通过预定义模式或实时通讯完成。

在仿真比赛中，预定义模式一般由阵型体现，通过阵型的概念对智能体进行角色分配，使其在全场比赛中保持协调。

阵型通过提供一个事先制定的准则从宏观上对智能体行为进行控制，让所有的智能体都按照该准则行动，从而整个球队体现出一定的协调性。

另一方面，由RoboCup中通讯带宽受到极大限制，仿真比赛的实时动态特性让通讯只能是作为配合的辅助作用。

3.1.1角色和阵型

角色的概念和真实人类足球比赛中的概念相仿，代表一个球员在比赛中承担的责任，如前锋、中场、后卫、守门员等。

每种角色都包括了这个角色的一些性质，如活动区域、初始位置等，当然不同角色的活动区域可以相互重叠。

每个角色都有不同的行为模式，每个智能体的行为决策会受到它当前扮演角色的影响。

阵型是一组特定角色的集合，如果把参加足球比赛的球员进行角色细分，可以分为诸如左前锋、右后卫等11个不同的角色。

阵型最主要的任务是定义各个角色的场上位置，使智能体的分布能对赛场有尽可能大的覆盖，同时维护在比赛过程中阵型的衔接。

我们基于FCP的SBSP策略进行站位的训练，SBSP要求阵型在定义角色的同时，定义每个角色的基本位置Home（x,y），对足球的吸引权重Weight（x,y），还有对双方越位线的考虑等。

如果足球的位置为Ball（x,y），简化的说，角色的场上位置应该是：

Positioning（x,y）=Home（x,y）+Weight（x,y）*Ball（x,y）

这种方法保证了比赛过程中队形的协调，不会出现很多智能体集中于某一处（比如围着足球）导致其他的空当，基本可以覆盖场上大概空间。

但是，这种加权和的方法缺少灵活性，如果需要对某些敏感区域进行细节调整，比如重新考虑双方禁区范围内的站位，就需要增加（条件，规则）进行补充。

基于SBSP的站位系统是预定义的，而比赛情况总是千变万化的，智能体扮演的角色和对应的站位还可以根据实际情况变换。

比赛时，由于控球、盯人等原因，使智能体偏离原扮演角色所处的区域，导致场上出现空当无人防守，此时就需要其他智能体能够弥补这个角色缺失引起的危险。

偏离原角色的智能体因位置的改变选择了其他角色的行为，比如中场球员在带球长驱直入后，考虑到实际情况（比如单刀等）选择前锋行为，此时，一方面前锋的角色会出现重叠，另一方面中场线也会因为该球员的缺失减弱了中场能力，应该让被重叠的前锋或者其他的不重要角色去扮演缺失的中场角色，以免被对方乘虚反击。

除了基本确定位置的方法，球员站位时还应该考虑一些场上的基本情况，如是否越位，实际站位的时候就应该把上述情况综合起来考虑，如图3-1所示为完整的站位策略。

同时为了应对场上千变万化的情况，还应该制定多种站位策略，在不同的情况下采用不同的站位策略，增强球队的实战能力。

智能体除了因为角色变化产生站位调整外，智能体的异构类型也可作调整。

阵型规定了角色的任务，也间接的提出了对角色的素质要求，选择更符合角色能力要求的异构智能体可以在比赛开始时确定，更佳方法则应该根据比赛情况进行微调。

比赛过程中可以进行最多三次换人，将更符合要求的异构智能体换上场，充当对应角色，这一点可以通过在线教练来完成。

3.1.2局部通讯模型

RoboCup仿真平台模拟了低带宽不可靠的通讯能力，每条消息最多包括10个字节的可见字符（共1074种可能），而且在50米之内只能听到分别来自每一个队伍的最多一条消息。

因此，队员间的合作无法主要依靠通讯完成，通讯只能作为配合的辅助作用。

由于智能体对环境的感知是局部的，不同的智能体可能拥有对环境的不同认识，因此通讯的主要作用是保证每个智能体所独立维护的世界模型的一致性。

另外，在某些时候，通讯还被用于传递辅助决策信息。

解决以局部视觉来维护全局世界模型是一个非常迫切的问题，因为，当所有智能体都按照相同的整体策略框架来进行决策时，如果基于相同的世界模型作为决策依据，对其他智能体的预测就比较准确，那么就会使整个球队体现出一定的协调性。

通过视觉参数的设置和视觉动作的

展开阅读全文