人工智能Java 坦克机器人系列 遗传算法Word下载.docx
《人工智能Java 坦克机器人系列 遗传算法Word下载.docx》由会员分享,可在线阅读,更多相关《人工智能Java 坦克机器人系列 遗传算法Word下载.docx(26页珍藏版)》请在冰豆网上搜索。
然后,把这些假设解置于问题的“环境”中,也即一个适应度函数中来评价。
并按适者生存的原则,从中选择出较适应环境的染色体进行复制,淘汰低适应度的个体,再通过交叉,变异过程产生更适应环境的新一代染色体群。
对这个新种群进行下一轮进化,至到最适合环境的值。
遗传算法已用于求解带有应用前景的一些问题,例如遗传程序设计、函数优化、排序问题、人工神经网络、分类系统、计算机图像处理和机器人运动规划等。
术语说明
由于遗传算法是由进化论和遗传学机理而产生的搜索算法,所以在这个算法中会用到很多生物遗传学知识,下面是我们将会用来的一些术语说明:
一、染色体(Chronmosome)
染色体又可以叫做基因型个体(individuals),一定数量的个体组成了群体(population),群体中个体的数量叫做群体大小。
二、基因(Gene)
基因是串中的元素,基因用于表示个体的特征。
例如有一个串S=1011,则其中的1,0,1,1这4个元素分别称为基因。
它们的值称为等位基因(Alletes)。
三、基因地点(Locus)
基因地点在算法中表示一个基因在串中的位置称为基因位置(GenePosition),有时也简称基因位。
基因位置由串的左向右计算,例如在串S=1101中,0的基因位置是3。
四、基因特征值(GeneFeature)
在用串表示整数时,基因的特征值与二进制数的权一致;
例如在串S=1011中,基因位置3中的1,它的基因特征值为2;
基因位置1中的1,它的基因特征值为8。
五、适应度(Fitness)
各个个体对环境的适应程度叫做适应度(fitness)。
为了体现染色体的适应能力,引入了对问题中的每一个染色体都能进行度量的函数,叫适应度函数.这个函数是计算个体在群体中被使用的概率。
操作算法
霍兰德(Holland)教授最初提出的算法也叫简单遗传算法,简单遗传算法的遗传操作主要有三种:
选择(selection)、交叉(crossover)、变异(mutation)这也是遗传算法中最常用的三种算法:
1.选择(selection)
选择操作也叫复制操作,从群体中按个体的适应度函数值选择出较适应环境的个体。
一般地说,选择将使适应度高的个体繁殖下一代的数目较多,而适应度较小的个体,繁殖下一代的数目较少,甚至被淘汰。
最通常的实现方法是轮盘赌(roulettewheel)模型。
令Σfi表示群体的适应度值之总和,fi表示种群中第i个染色体的适应度值,它被选择的概率正好为其适应度值所占份额fi/Σfi。
如下图表中的数据适应值总和Σfi=6650,适应度为2200变选择的可能为fi/Σfi=2200/6650=0.394.
图1.轮盘赌模型
Fitness值:
2200
1800
1200
950
400
100
选择概率:
3331
0.271
0.18
0.143
0.06
0.015
2.交叉(Crossover)
交叉算子将被选中的两个个体的基因链按一定概率pc进行交叉,从而生成两个新的个体,交叉位置pc是随机的。
其中Pc是一个系统参数。
根据问题的不同,交叉又为了单点交叉算子(SinglePointCrossover)、双点交叉算子(TwoPointCrossover)、均匀交叉算子(UniformCrossover),在此我们只讨论单点交叉的情况。
单点交叉操作的简单方式是将被选择出的两个个体S1和S2作为父母个体,将两者的部分基因码值进行交换。
假设如下两个8位的个体:
S110001111S211101100
产生一个在1到7之间的随机数c,假如现在产生的是2,将S1和S2的低二位交换:
S1的高六位与S2的低六位组成数串10001100,这就是S1和S2的一个后代P1个体;
S2的高六位与S1的低二位组成数串11101111,这就是S1和S2的一个后代P2个体。
其交换过程如下图所示:
Crossover
11110000
S1
10001111
S2
11101100
P1
10001100
P2
11101111
3.变异(Mutation)
这是在选中的个体中,将新个体的基因链的各位按概率pm进行异向转化,最简单方式是改变串上某个位置数值。
对二进制编码来说将0与1互换:
0变异为1,1变异为0。
如下8位二进制编码:
11101100
随机产生一个1至8之间的数i,假如现在k=6,对从右往左的第6位进行变异操作,将原来的1变为0,得到如下串:
11001100
整个交叉变异过程如下图:
图2.交叉变异过程
4.精英主义(Elitism)
仅仅从产生的子代中选择基因去构造新的种群可能会丢失掉上一代种群中的很多信息。
也就是说当利用交叉和变异产生新的一代时,我们有很大的可能把在某个中间步骤中得到的最优解丢失。
在此我们使用精英主义(Elitism)方法,在每一次产生新的一代时,我们首先把当前最优解原封不动的复制到新的一代中,其他步骤不变。
这样任何时刻产生的一个最优解都可以存活到遗传算法结束。
上述各种算子的实现是多种多样的,而且许多新的算子正在不断地提出,以改进GA某些性能。
比如选择算法还有分级均衡选择等等。
遗传算法的所需参数
说简单点遗传算法就是遍历搜索空间或连接池,从中找出最优的解。
搜索空间中全部都是个体,而群体为搜索空间的一个子集。
并不是所有被选择了的染色体都要进行交叉操作和变异操作,而是以一定的概率进行,一般在程序设计中交叉发生的概率要比变异发生的概率选取得大若干个数量级。
大部分遗传算法的步骤都很类似,常使用如下参数:
Fitness函数:
见上文介绍。
Fitnessthreshold(适应度阀值):
适合度中的设定的阀值,当最优个体的适应度达到给定的阀值,或者最优个体的适应度和群体适应度不再上升时(变化率为零),则算法的迭代过程收敛、算法结束。
否则,用经过选择、交叉、变异所得到的新一代群体取代上一代群体,并返回到选择操作处继续循环执行。
P:
种群的染色体总数叫种群规模,它对算法的效率有明显的影响,其长度等于它包含的个体数量。
太小时难以求出最优解,太大则增长收敛时间导致程序运行时间长。
对不同的问题可能有各自适合的种群规模,通常种群规模为30至160。
pc:
在循环中进行交叉操作所用到的概率。
交叉概率(Pc)一般取0.6至0.95之间的值,Pc太小时难以向前搜索,太大则容易破坏高适应值的结构。
Pm:
变异概率,从个体群中产生变异的概率,变异概率一般取0.01至0.03之间的值变异概率Pm太小时难以产生新的基因结构,太大使遗传算法成了单纯的随机搜索。
另一个系统参数是个体的长度,有定长和变长两种。
它对算法的性能也有影响。
由于GA是一个概率过程,所以每次迭代的情况是不一样的,系统参数不同,迭代情况也不同。
遗传步骤
了解了上面的基本参数,下面我们来看看遗传算法的基本步骤。
基本过程为:
1.对待解决问题进行编码,我们将问题结构变换为位串形式编码表示的过程叫编码;
而相反将位串形式编码表示变换为原问题结构的过程叫译码。
2.随机初始化群体P(0):
=(p1,p2,…pn);
3.计算群体上每个个体的适应度值(Fitness)
4.评估适应度,对当前群体P(t)中每个个体Pi计算其适应度F(Pi),适应度表示了该个体的性能好坏
5.按由个体适应度值所决定的某个规则应用选择算子产生中间代Pr(t)
6.依照Pc选择个体进行交叉操作
7.仿照Pm对繁殖个体进行变异操作
8.没有满足某种停止条件,则转第3步,否则进入9
9.输出种群中适应度值最优的个体
程序的停止条件最简单的有如下二种:
完成了预先给定的进化代数则停止;
种群中的最优个体在连续若干代没有改进或平均适应度在连续若干代基本没有改进时停止。
根据遗传算法思想可以画出如右图所示的简单遗传算法框图:
图3.简单遗传算法框图
下面伪代码简单说明了遗传算法操作过程:
chooseanintialpopulation
Foreachhinpopulation,computeFitness(h)
While(maxFitness(h)<
Fitnessthreshold)
doselection
docrossover
domutation
updatepopulation
ReturnbestFitness
Robocode说明
能有效实现遗传算法的应用例子有很多,像西洋双陆棋、国际名模等等都是遗传程序设计学习的工具,但是Robocode有着其他几个无可比拟的优势:
1.它是基于面向对象语言Java开发,而遗传算法本身的思想也是存在继承等面向对象概念;
2.Robocode是一种基于游戏与编程语言之间的平台,有一个充满竞技与乐趣的坦克战斗平台,你能很快的通过与其他坦克机器比赛而测试自己的遗传算法;
3.Robocode社群有4000个左右各种策略的例子机器人可供你选择,这些机器人足以让我们模拟真实的遗传环境。
而且很多代码可直接开放源代码供我们借鉴;
4.Robocode是一个开源软件,你可直接上Robocode控制器上加入自己的遗传特点,而加快遗传过程的收敛时间;
5.Robocoe是一个很容易使用的机器人战斗仿真器,您在此平台上创建自己的坦克机器人,并与其它开发者开发的机器人竞技。
以得分排名的方式判定优胜者。
每个Robocode参加者都要利用Java语言元素创建他或她的机器人,这样就使从初学者到高级黑客的广大开发者都可以参与这一娱乐活动。
如果您对Robocode不是很了解,请参考developerWorks网站Java技术专区文章:
“重锤痛击Robocode”;
在Robocode中其实有很多种遗传算法方法来实现进化机器人,从全世界的Robocode流派中也发展几种比较成熟的方法,比如预设策略遗传、自开发解释语言遗传、遗传移动我们就这几种方法分别加以介绍。
由于遗传算法操作过程都类似,所以前面二部分都是一些方法的介绍和部分