蚁群系统文献翻译.docx

资源描述

蚁群系统文献翻译.docx

《蚁群系统文献翻译.docx》由会员分享，可在线阅读，更多相关《蚁群系统文献翻译.docx（21页珍藏版）》请在冰豆网上搜索。

蚁群系统文献翻译.docx

蚁群系统文献翻译

郑州航空工业管理学院

毕业论文（设计）

英文翻译

2012届网络工程专业0810073班级

翻译题目蚁群系统

姓名韩敏学号081007308

指导教师刘双红职称讲师

2012年5月19日

蚁群系统:

一个合作学习模式解决旅行商问题的方法

摘要

本文介绍了蚁群系统（ACS），应用于解决旅行商问题（TSP）的分布式算法。

ACS就是一些合作代理所谓的蚂蚁合作找到TSP问题的良好解决方案。

蚂蚁通过播撒一种信息素来间接合作，在生成解决方案的同时把信息素存放在TSP图形的边缘。

我们研究ACS通过运行试验了解其操作。

结果表明，ACS优于其他自然灵感的算法，如模拟退火和进化的自然启发算法计算。

我们得出结论与ACS-3-opt比较，在本地搜索过程中，优化的ACS通过一些算法来表现最优的的TSP和ATSP。

索引术语——适应行为、旅行商问题的蚁群、紧急行为。

一、导论

蚂蚁算法是基于自然的比喻蚁群。

真正的蚂蚁能够找到从食物源到自己的窝[3]的最短路径，[22]不利用视觉线索[24]而通过感知信息素。

在移动的时候，蚂蚁在地上洒下信息素，并趋向于朝其他蚂蚁播撒的信息素方向移动。

在图.1我们展示了蚂蚁利用信息素找到两点之间的最短路径。

考虑图（a）：

蚂蚁到达一个抉择点，他们要决定向左还是向右。

因为没有线索表明哪一个是最佳选择。

他们随机选择。

可以预期，一般情况下，是一半蚂蚁左转一半蚂蚁右转。

两蚂蚁从左至右（名称开头为L）和从右至左移动（名字开头为R）。

图（b）和（c）显示在紧随其后的瞬间发生了什么，假设所有的蚂蚁以大约相同的速度移动。

虚线代表蚂蚁沉积在地面上的信息素。

由于较低的路径比上面一个短，更多的蚂蚁将平均访问，因此信息素累积更快。

经过短暂的过渡时期，两个路径信息素量的差异就足够大，从而影响进入系统的新蚂蚁的决定。

图（d）显示，从现在开始，新进入的蚂蚁在概率上更倾向于选择较短的路径，因为在决定点时，他们感知到了短路径上的有较多的信息素。

在正反馈的影响下，这又反过来增加了更多的蚂蚁去选择较短的路径。

很快所有的蚂蚁将会使用较短的路径。

真实蚂蚁的上述行为，激发了蚂蚁系统，一个算法，其中一组人工蚂蚁合作解决一个问题，通过沉积在图的边缘上的信息素来交换信息。

蚂蚁系统已应用于组合优化问题，旅行商问题（TSP）[7]，[8]，[10]，[12]和二次分配问题[32]，[42]。

蚁群系统（ACS），这篇文章提出的算法，是建立在以前的蚂蚁系统之上，应用于对称和非对称TSP问题，来提高效率。

其主要思想是，有一组代理商，所谓的蚂蚁，通过信息素的间接合作和全球通信，来并行的寻找TSP良好的解决方案。

简单的说，每个蚂蚁构建解决TSP问题用一个迭代的方式：

它增加了新的城市，从过去的经验和贪婪启发式获得通过利用双方信息的部分解决方案。

通过记忆存放在TSP边缘上的信息素，而启发式信息仅仅决定于边缘的长度。

被引入蚁群算法的新理念将在论文的其余部分讨论，是协同使用相对简单了许多代理人之间的合作它通过分布式内存实现信息素沉积在图的边缘。

本文的组织如下：

第二节通过描述蚁群系统以及其起源来引出ACS；第三节介绍ACS；第四节致力于研究ACS的一些特点；我们研究在运行时信息素是如何变化的，估计要使用蚂蚁的最佳数量，观察信息素在协同调解中的作用和评估信息素和贪婪式算法在ACS中的作用。

第五节提供了一套标准测试的问题，比较知名的如通用算法，进化计算和模拟退火ACS结果的概述。

在第六节中，我们添加到ACS的局部优化，获得一个新的算法，称为ACS-3-OPT。

该算法相比，毫不逊色于第一次进化优化[5]国际大赛的非对称旅行商问题（ATSP）（见图2），尽管它产生的TSP问题上的表现略差。

第七节专门讨论了ACS的主要特点，并指出进一步研究的方向。

如图.1蚂蚁如何找到最短路径：

图.1蚂蚁如何找到最短路径

（a）蚂蚁到达决定点（b）蚂蚁随即的选择较高和较低的路径（c）因为蚂蚁以大约恒定的的速度移动，那些选择较低较近路径的蚂蚁到达相反决定点的时间比选择较高较远路径的蚂蚁少（d）信息素以较高的速率沉积在较短路径上。

虚线的密度与信息素的累积成正比。

TSP

假设V={a,……，z}是一组城市的集合，A={（r,s）:

r,s∈V}是边集合，δ（r,s）δ（s,r）成本的计算与边有关（r,s）∈A.

TSP问题是找到一个最小的成本，访问每个城市一次。

图.2旅行商问题

Ⅱ.背景

在图.2定义的蚁群系统[10]是我们研究所有算法的基础，第一次被应用于TSP。

蚂蚁系统采用图形表示，这与图.2中的定义相同，增加如下：

除了成本措施，每边也有可取措施，被称为信息素，它是通过人工蚂蚁在运行时更新（以下简称蚂蚁）。

当蚂蚁系统应用于对称的TSP，，但是当它被应用到不对称的情况时，。

非正式地，蚂蚁系统的工作原理如下。

每个蚂蚁生成一个完整的旅游选择城市根据概率状态转移规则；蚂蚁喜欢转移到由短边相连且信息素量高的城市。

一旦所有的蚂蚁都完成了他们旅行的一个全局信息素更新规则（全局更新规则，简称）是适用；所有边上的信息素都会挥发一部分，然后每个蚂蚁在边上沉积信息素，短边获得大量的信息素，这个过程是迭代。

初始化

/*在这个水平上每次循环叫做一次迭代*/

每只蚂蚁被定位于一个起始节点

/*在这个水平上每次循环叫做一步*/

每个蚂蚁适用于一个状态转换规则，逐步建立一个解决方案和本地信息素更新规则

直到所有的蚂蚁已经建立了一套完整的解决方案

一套全局信息素更新规则被应用

直到条件结束

图.3ACS算法

蚂蚁系统所使用的状态转移规则，称为随机比例规则，由

（1）可知蚂蚁K从城市r到该市s的转移概率。

（1）

其中τ是信息素，η=1/δ是δ（r,s）的倒数，jk（r）是集，仍然要访问城市的蚂蚁k定位在城市r（可行的解决方案），β是一个参数，它决定信息素与距离的相对重要性（β>0）。

在

（1）中由边（r,s）上信息素的值乘以相应的启发式值η（r，s）。

这样有利于选择短边即信息素量大的边。

在蚂蚁系统中，全局更新规则的实施如下。

一旦所有蚂蚁建立了自己的旅游路径，所有边上的信息素根据如下公式更新：

（2）

其中

0<α<1是信息素的衰减参数，是蚂蚁转移的的长度，m是蚂蚁的数量。

信息素更新是为了分配更多的信息素在短路径上。

从某种意义上说，这类似于一种强化学习计划[2]，[26]，其中更好的解决方案获得更高的加固（例如发生，相似，根据比例选择的遗传算法）。

信息素更新公式是为了模仿蚂蚁沉积在访问边上的新的信息素和信息素的挥发。

边缘上的信息素起着一个分布式的长期记忆的作用：

信息素不会存储在本地的个别蚂蚁上，而是分布在图形的边缘。

这种间接形式的沟通称为stigmergy[9][23]。

有兴趣的读者会发现蚂蚁系统充分说明其生物学动因，[12]的计算结果。

尽管蚂蚁系统被应用于发现好的或者最佳的解决方法对于小的TSP问题（最多30个城市），时间要求找到这样的结果，对于大的问题不可行，我们设计了三个主要的变化，以提高其性能，从而产生了ACS的定义，在下一节介绍。

III.ACS

ACS不同于以前的蚂蚁系统表现在以下三个主要方面：

（1）状态转移规则为更好更合理地利用新路径和利用先验知识解决问题的提供了方法，

（2）全局更新规则只应用于最优的蚂蚁路径上，

（3）在建立问题解决方案的过程中，应用局部信息素更新规则。

一般情况下，ACS工作原理如下：

蚂蚁一开始选择定位城市根据一些初始化规则（例如，随机）。

每个蚂蚁建立一个路径（一个可行的TSP解决方法）通过反复应用随机贪婪规则（状态转换规则）。

当新建路径时，蚂蚁会采用局部更新规则更改所访问路径的信息素的量。

一旦所有的蚂蚁走完了既定路径，边上的信息素会被再次更改（运用局部更新规则）。

蚂蚁系统的情况如下，在建立他们的路径时，蚂蚁被启发式信息（它们喜欢选择短边）和信息素信息指导。

信息素量高的边是一个非常理想的选择。

信息素更新规则的设计是为了使更多的信息素沉积在被蚂蚁访问的边上。

ACS算法如图.3。

下面我们讨论：

状态转换规则、全局更新规则和局部更新规则。

A.ACS状态转换规则

ACS的状态转移规则如下：

定位节点上的蚂蚁选择城市的移动应用（3）给定的规则。

（3）

其中q是一个随机数，均匀分布在[0.......1]，是一个参数，并根据给定的概率分布

（1）选择S是一个随机变量。

由（3）和

（1）得出的状态转换规则称为伪随机比例规则。

此状态转换规则，同以前的随机比例规则，都支持短边相连和信息素量大的节点。

参数决定开采与侦探的相对重要性：

每次一只蚂蚁从城市r选择移动到城市s，样本的随机数。

如果≤，则路径根据（3）式来选择，反之根据

（1）式选择。

B.ACS全局更新规则

在ACS中只有全局最好的蚂蚁（即，从实验的开始就指引着最短的路径）允许沉积信息素。

这样的选择，再加上使用的伪随机比例规则，旨在使搜索更有针对性：

蚂蚁在附近寻找路径时发现了当前迭代算法。

全局更新执行后，所有的蚂蚁都完成了自己的旅游。

采用全局更新规则（4）更新信息素的水平。

（4）

其中

0<α<1是信息素的衰变参数，Lgb是从试验开始的全局路径的长度。

正如蚂蚁系统的情况，全局更新的目的是提供更多的信息素在较短的路径上。

方程（4）规定，只有那些属于全局最佳路径的边会得到加固。

我们也测试了另外一种类型的全局更新规则，叫做迭代最佳，不同于以上所谓的全局最佳代替运用（最佳路径长度在当前的迭代实验），如公式（4）。

此外，得到强化的边迭代最佳的是那些属于当前迭代的最佳路径。

实验表明，这两项计划之间的差异很小，全局最佳策略稍有优势，因此在下面的实验中采用。

C.ACS局部更新规则

当构建一个解决TSP问题的方案（即路径）时，蚂蚁通过运用局部更新规则（5）来访问边和改变边上信息素的量。

（5）

其中γ是参数，0＜γ＜1

我们已试验过三个值。

第一选择是松散的灵感来自Q-学习[40]，开发算法以解决强化学习问题[26]。

代理人必须学习最佳的行动，以发现自己每一个可能执行的状态，作为唯一的学习信息使用一个标量它代表一个状态进入后，选择动作评估面临着这些问题。

Q学习算法允许一个代理来学习这样一个最优政策规则类似递归应用（5），在术语被设置为下一个状态值打折的评估。

因此我们的蚂蚁必须解决的问题类似于加强学习问题（蚂蚁必须学习哪个城市将作为其当前位置），我们设[19]，它正是在Q-学习（0≦γ﹤1）中运用的公式。

另外两种选择是：

i）,是初始信息素的量，ii）。

最后，我们还在做局部更新没有被应用的实验（即不使用局部更新规则，如蚂蚁系统）。

得到的结果在5个随机产生的50个城市的TSP[13]集中运行实验（见表一），在Oliver30对称的TSP[41]和ry48p非对称的TSP[35],表明局部更新是肯定有用的和局部更新规则没有局部更新规则或者性能好。

关于ACS的，我们叫做Ant-Q在[11]和[9]中，当时叫做简单的ACS，产生了两个最好的行为算法，拥有一个相似的性能水平。

因此ACS局部更新规则需要小于ANTQ值计算，我们关注ACS，选择它来做实验。

将在本论文其余部分介绍。

将在第四节探讨ACS局部更新规则，它的作用是打乱路径，所以，一只蚂蚁早期路径中的城市可能会被后来其他蚂蚁探索。

换句话说，局部更新的影响是使期望的边可动态改变：

每次蚂蚁使用过的边会变得稍微不太理想（因为它会损失一些信息素）。

用这种方式，蚂蚁将会更好地运用信息素信息：

没有局部更新所有的蚂蚁将会在先前最好路径的狭窄邻域里寻找。

D.ACS参数设置

在以下章节所有试验

展开阅读全文