机器人足球比赛设计与实现.ppt

资源描述

机器人足球比赛设计与实现.ppt

《机器人足球比赛设计与实现.ppt》由会员分享，可在线阅读，更多相关《机器人足球比赛设计与实现.ppt（21页珍藏版）》请在冰豆网上搜索。

机器人足球比赛设计与实现.ppt

RoboCup2D球队设计与实现华南师范大学毕业论文答辩姓名：

戴浩彬指导老师：

冯刚（副教授）同组成员：

（无）演讲提纲演讲提纲项目研究的背景项目预期目标RoboCup2D仿真比赛介绍SCNURoboCup2D队伍设计遗传算法介绍基于遗传算法的战位设计项目成果机器人足球世界杯（RobotSoccerWorldCup,简称RoboCup）是一个国际性的研究与教育项目，它通过提供一个标准问题来促进人工智能和智能机器人的研究发展。

RoboCup的最终目标是:

到21世纪中叶，一支完全自治的人形机器人足球队能在遵循国际足联正式的规则比赛中，战胜人类世界杯冠军队。

RoboCup（TheRobotSoccerWorldCup,机器人足球世界杯）仿真比赛是多智能体系统的理想测试平台，通过提供一个标准任务来促进分布式人工智能、智能机器人技术及其相关领域的研究与发展。

MAS（Multi-agentSystem，多智能体系统）的理论及应用研究已经成为人工智能研究的热点，其主要研究自主的智能体（Agent）之间智能行为的协调，为了一个共同的全局目标，也可能是关于各自的不同目标，共享有关问题和求解方法的知识，通过协作进行问题求解，以完成复杂的控制任务或解决复杂的问题。

一一.项目背景项目背景三三.RoboCup2D仿真比赛介绍仿真比赛介绍性质RoboCup比赛分为实物组与仿真组。

RoboCup仿真组又可以分为2D仿真与3D仿真，2D组比赛即是在二维的环境下进行的比赛，而3D组则是在此基础上考虑了立体环境因素。

项目的研究对象是oboCup2D比赛项目。

仿真比赛在一个标准的计算机环境内进行，采用Server/Client（服务器/客户端）方式，由RoboCup联合会提供Server系统rcsoccersim,参赛队编写各自的客户端程序，模拟足球队员进行比赛。

每一个client相当于一个球员的大脑，控制场上球员的移动。

比赛开始后，双方可以各派11个球员与1名在线教练上场。

RoboCup仿真环境Rcsoccersim通过提供一个虚拟场地，对比赛全部球员和足球的移动进行仿真。

仿真模型引入了真实世界的很多复杂特性，诸如物体移动的随机性，感知信息和执行机构的不确定性，个人能力的物理有限性以及通讯量的受限性。

Client程序则表现为多个Agent（球员）为了共同的赢球目标进行多智能体间的合作规划。

仿真开发环境一般需要三台计算机组成的局域网，其中一台运行rcsoccersim,另外两台分别运行两个参赛队伍，三台机连到同一个Hub。

为了调试方便，也可以运行在同一台机上。

rcsoccersim通过UDP/IP协议和client进行通信，开发语言可以任意的选择，由于rcsoccersim运行在Linux/Unix系统下，而Linux遵循GPL协议与RoboCup开放源码，共享资源的思路有极大的相通之处，因此一般都是选择Linux系统作为开发平台。

比赛平台比赛平台Client程序框架世界模型翻译器高层决策底层行为真实世界rcsoccersimAgent体体感知信息感知信息原子行为原子行为仿真比赛四四.队伍设计队伍设计底层代码的选择阿姆斯特丹大学的UVAtrilearn队公开的底层源码（2003）。

该球队在2002年德国公开赛以及2003年世界RoboCup公开赛中获得冠军，其底层代码使用软件工程的思想进行了重新的编写，具有良好的风格以及可阅读性，这些代码为我们节省了大量的时间，在工程开始之初，我们就可以集中多智通体的协作和高层策略的实现，以及一些为支持高层而设计的底层细节。

该源代码提供了一个Client的框架，以及对Server数据的处理。

通过自主的添加高层决策策略，可以形成自己的球队队伍。

目前绝大部分高校的RoboCup2D球队都是基于UVAtrilearn底层源码。

球员框架SCNU_Forthgoer10个球员Agent采用相同的决策框架，每个Agent都可以预先知道其它Agent的执行动作，可以提高球员之间的协作。

从而避免多个agent去抢球，或者多个agent去截球，造成空位的现象出现。

划分球员的状态空间球员状态空间球员状态空间持球状态非持球状态Client决策框架根据球员的状态进行决策选择持球决策client决策周期开始是否可以控球非持球决策client决策周期结束是否判定为控球状态带球估值传球估值射门估值选择最优动作持球决策终结图3.3.2clien持球决策流程判定为非控球状态图3.3.2clien非持球决策流程根据阵型得到基本站位点根据战术要求调整站位点到指定点站位非持球决策终结我是否离球最近去截球是否五五.遗传算法介绍遗传算法介绍遗传算法（GeneticAlgorithm）是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型，是一种通过模拟自然进化过程搜索最优解的方法。

它根据适者生存、优胜劣汰等自然进化规则来进行搜索计算和问题求解，对许多传统数学难以解决或明显失效的复杂的、非线性问题，特别是优化问题，提供了一个行之有效的新途径，也为人工智能的研究带来新的生机。

遗传算法是一类可以解决复杂优化计算的鲁棒性搜索算法，与其它的搜索算法相比，有以下的特点:

对参数编码，而不是对参数本身；通过目标函数来计算适度值，不需要其它的推导和辅助信息，不受优化函数的连续性影响，从而对问题的依赖性较小。

遗传算法从n个初始解开始操作，而不是从一个解开始，实际上处理了大约O（n3）个模式，可以减小搜索过程中收敛于局部最优解的概率，有较大的可能性求得全局最优。

它对函数的性态无要求，针对某一问题的遗传算法经简单的修改即可适应于其它的问题一，或加入特定的知识领域，或与已有算未予结合，具有较好的普适性与易扩性。

遗传算法采用概率转变原则，而不是确定性原则，因此能够有效的达到最优解的邻域；遗传算法在解空间的时候不是盲目的穷举，而是一种启发式搜索，其搜索的效率往往高于其它的算法；遗传算法对于待寻优函数基本无限制，既不要求函数连续，也不要求函数可微，既可以是数学解析式，也可以是映射矩阵等等，在非线性、多锋、有噪声的情况下，能够以很大的概率收敛于最优解与满意解，其应用范围广范，全局求解能力强；遗传算法具有并行计算的特点，因而可通过大规模并行计算来提搞计算速度；遗传算法各适合复杂问题的优化；遗传算法的基本思想简单，运行方式和实现步骤规范，便于具体的应用。

否是开始产生初代种群图3.3.2clien一般遗传算法的流程计算适度值最佳个体是否满足最优化准则选择交叉变异遗传操作结果六六.基于遗传算法的球员战略站位基于遗传算法的球员战略站位站位：

每个球员在比赛前分配其角色，并负责自己的区域。

通过一定的严格限定，球员将在足球的四周分布站位，从而形成一定的阵型。

站位体系的优缺点如下:

优点:

在比赛的过程中可以一直保持着队形，不会出现乱阵的情况。

每个球员都可以明白队友所在的位置。

缺点:

由于决定站位的因素已经确定了，所以当球处于一定的位置时，无论对方的情况怎样，都是一样的站位，不能根据当前的情况进行调整。

不能实现站位的最优。

开球时的阵型开球时的阵型问题的描述站位的最优搜索问题可以表述为在一个基本的战略站位点周围，寻找一个点，满足达到目标的最优化，我们通过遗传算法来寻优。

数学表达式为Max=t（pos）;Pos为得到的站位点，t（pos）为在考虑球场情况限制下，利用遗传算法来寻优。

遗传算法的每种操作都是根据适应值的信息对群体进行遗传操作和逐代更新的。

因此，适度值函数的选取将直接影响到遗传算法收敛的快慢和算法的成败。

此外，适度值还应该考虑具体的问题的特征，即满足站位位置的最优。

我们选取的球员的站位位置应该尽量的满足传球与射门。

Fitness=shootfit（pos）+passfit（pos）;在RoboCup2D平台上进行了实验，仿真过程中采用遗传算子分别为:

：

选择算法采用保存最优个体的轮盘赌模型，交叉采用两个点随机交叉，变异采用随机单点变异。

使用的参数为N=36,交叉率为0.,变异率为0.2（这里取得比较的大是为了避免陷入早熟。

仿真实验数据:

谢谢!

展开阅读全文