模拟退火算法的旅行商问题.docx
《模拟退火算法的旅行商问题.docx》由会员分享,可在线阅读,更多相关《模拟退火算法的旅行商问题.docx(16页珍藏版)》请在冰豆网上搜索。
模拟退火算法的旅行商问题
人工智能原理
实验报告
模拟退火算法解决TSP问题
1旅行商问题和模拟退火算法
1.1旅行商问题
1.1.1旅行商问题的描述
旅行商问题(TravelingSalesmanProblem,简称TSP)又名货郎担问题,是威廉·哈密尔顿爵士和英国数学家克克曼(T.P.Kirkman)于19世纪初提出的一个数学问题,也是著名的组合优化问题。
问题是这样描述的:
一名商人要到若干城市去推销商品,已知城市个数和各城市间的路程(或旅费),要求找到一条从城市1出发,经过所有城市且每个城市只能访问一次,最后回到城市1的路线,使总的路程(或旅费)最小。
TSP刚提出时,不少人认为这个问题很简单。
后来人们才逐步意识到这个问题只是表述简单,易于为人们所理解,而其计算复杂性却是问题的输入规模的指数函数,属于相当难解的问题。
这个问题数学描述为:
假设有n个城市,并分别编号,给定一个完全无向图G=(V,E),V={1,2,…,n},n>1。
其每一边(i,j)
E有一非负整数耗费Ci,j(即上的权记为Ci,j,i,j
V)。
并设
G的一条巡回路线是经过V中的每个顶点恰好一次的回路。
一条巡回路线的耗费是这条路线上所有边的权值之和。
TSP问题就是要找出G的最小耗费回路。
1.2模拟退火算法
模拟退火算法由KirkPatrick于1982提出[7],他将退火思想引入到组合优化领域,提出一种求解大规模组合优化问题的方法,对于NP-完全组合优化问题尤其有效。
模拟退火算法来源于固体退火原理,将固体加温至充分高,再让其缓慢降温(即退火),使之达到能量最低点。
反之,如果急速降温(即淬火)则不能达到最低点。
加温时,固体内部粒子随温升变为无序状,内能增大,而缓慢降温时粒子渐趋有序,在每个温度上都达到平衡态,最后在常温时达到基态,内能减为最小。
根据Metropolis准则,粒子在温度T时趋于平衡的概率为exp(-E/(kT)),其中E为温度T时的内能
,
E为其改变量,k为Boltzmann常数。
用固体退火模拟组合优化问题,将内能E模拟为目标函数值f,温度T演化成控制参数t,即得到解组合优化问题的模拟退火算法:
由初始解i和控制参数初值t开始,对当前解重复产生“新解→计算目标函数差→接受或舍弃”的迭代,并逐步衰减t值,算法终止时的当前解即为所得近似最优解,这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。
退火过程由冷却进度表(CoolingSchedule)控制,包括控制参数的初值t及其衰减因子a、每个t值时的迭代次数L和停止条件C。
1.2.1基本思想
模拟退火算法可以分解为解空间、目标函数和初始解3部分。
其基本思想是:
(1)初始化:
初始温度T(充分大),初始解状态s(是算法迭代的起点),每个T值的迭代次数L;
(2)对k=1,……,L做第(3)至第6步;
(3)产生新解s′;
(4)计算增量cost=cost(s′)-cost(s),其中cost(s)为评价函数;
(5)若t′
0则接受s′作为新的当前解,否则以概率exp(-t′/T)接受s′作为新的当前解;
(6)如果满足终止条件则输出当前解作为最优解,结束程序。
终止条件通常取为连续若干个新解都没有被接受时终止算法;
(7)T逐渐减少,且T趋于0,然后转第2步运算。
具体如下
(1)新解的产生和接受
模拟退火算法新解的产生和接受可分为如下4个步骤:
①由一个函数从当前解产生一个位于解空间的新解。
为便于后续的计算和接受,减少算法耗时,常选择由当前新解经过简单地变换即可产生新解的方法,如对构成新解的全部或部分元素进行置换、互换等。
产生新解的变换方法决定了当前新解的邻域结构,因而对冷却进度表的选取有一定的影响。
②计算与新解所对应的目标函数差。
因为目标函数差仅由变换部分产生,所以目标函数差的计算最好按增量计算。
事实表明,对大多数应用而言,这是计算目标函数差的最快方法。
③判断新解是否被接受。
判断的依据是一个接受准则,最常用的接受准则是Metropo1is准则:
若t′
0则接受S′作为新的当前解S,否则以概率exp(-t′/T)接受S′作为新的当前解S。
④当新解被确定接受时,用新解代替当前解。
这只需将当前解中对应于产生新解时的变换部分予以实现,同时修正目标函数值即可。
此时,当前解实现了一次迭代,可在此基础上开始下一轮试验。
而当新解被判定为舍弃时,则在原当前解的基础上继续下一轮试验。
模拟退火算法与初始值无关,算法求得的解与初始解状态S(是算法迭代的起点)无关;模拟退火算法具有渐近收敛性,已在理论上被证明是一种以概率收敛于全局最优解的全局优化算法;模拟退火算法具有并行性。
(2)参数控制问题
模拟退火算法的应用很广泛,可以求解NP完全问题,但其参数难以控制,其主要问题有以下3点[7]:
①温度T的初始值设置。
温度T的初始值设置是影响模拟退火算法全局搜索性能的重要因素之一。
初始温度高,则搜索到全局最优解的可能性大,但因此要花费大量的计算时间;反之,则可节约计算时间,但全局搜索性能可能受到影响。
实际应用过程中,初始温度一般需要依据实验结果进行若干次调整。
②温度衰减函数的选取。
衰减函数用于控制温度的退火速度,一个常用的函数为:
式中是一个非常接近于1的常数,t为降温的次数。
③马尔可夫链长度L的选取。
通常的原则是:
在衰减参数T的衰减函数已选定的前提下,L的选取应遵循在控制参数的每一取值上都能恢复准平衡的原则。
2TSP模拟退火算法的实现
TSP是典型的组合优化问题,模拟退火算法是一种随机性解决组合优化方法。
将TSP与模拟退火算法相结合,以实现对其求解。
2.1TSP算法实现
2.1.1TSP算法描述
(1)TSP问题的解空间和初始解
TSP的解空间S是遍访每个城市恰好一次的所有回路,是所有城市排列的集合。
TSP问题的解空间S可表示为{1,2,…,n}的所有排列的集合,即S={(c1,c2,…,cn)|((c1,c2,…,cn)为{1,2,…,n}的排列)},其中每一个排列Si表示遍访n个城市的一个路径,ci=j表示在第i次访问城市j。
模拟退火算法的最优解与初始状态无关,故初始解为随机函数生成一个{1,2,…,n}的随机排列作为S0。
(2)目标函数
TSP问题的目标函数即为访问所有城市的路径总长度,也可称为代价函数:
现在TSP问题的求解就是通过模拟退火算法求出目标函数C(c1,c2,…,cn)的最小值,相应地,s*=(c*1,c*2,…,c*n)即为TSP问题的最优解。
(3)新解产生
新解的产生对问题的求解非常重要。
新解可通过分别或者交替用以下2种方法产生:
①二变换法:
任选序号u,v(设u
v
n),交换u和v之间的访问顺序,若交换前的解为si=(c1,c2,…,cu,…,cv,…,cn),交换后的路径为新路径,即:
si′=(c1,…,cu-1,cv,cv-1,…,cu+1,cu,cv+1,…,cn)
②三变换法:
任选序号u,v和ω(u≤v
ω),将u和v之间的路径插到ω之后访问,若交换前的解为si=(c1,c2,…,cu,…,cv,…,cω,…,cn),交换后的路径为的新路径为:
si′=(c1,…,cu-1,cv+1,…,cω,cu,…,cv,cω+1,…,cn)
(4)目标函数差
计算变换前的解和变换后目标函数的差值:
Δc′=c(si′)-c(si)
(5)Metropolis接受准则
根据目标函数的差值和概率exp(-ΔC′/T)接受si′作为新的当前解si,接受准则:
2.1.2TSP算法流程
根据以上对TSP的算法描述,可以写出用模拟退火算法解TSP问题的流程图2-1所示:
图2-1TSP的模拟退火流程
2.2TSP的C实现
2.2.1加载数据文件
下面是加载数据文件的一个例子:
中国31省会城市数据:
[13042312;36391315;41772244;37121399;34881535;33261556;
32381229;41961044;4312790;4386570;30071970;25621756;
27881491;23811676;1332695;37151678;39182179;40612370;
37802212;36762578;40292838;42632931;34291908;35072376
33942643;34393201;29353240;31403550;25452357;27782826;23702975];
当调用数据文件函数时,包含城市坐标信息的矩阵载入到数组中。
2.2.2计算总距离的函数
这是一个城市间计算距离的函数,根据给定路径计算该路径对应总路程。
inlinedoubledist(intx1,inty1,intx2,inty2)
{
returnsqrt(double((x2-x1)*(x2-x1)+(y2-y1)*(y2-y1)));
}
inlinedoubletotaldist(pathp)
{
inti;
doublecost=0;
for(i=1;i{
cost+=D[p.City[i]][p.City[i+1]];
}
cost+=D[p.City[1]][p.City[N]];
returncost;
}
TSP问题的成本函数是城市之间的距离。
调用此函数将计算n个城市之间的距离。
2.2.3交换城市的函数
这是一个用于城市交换的函数,它从某路径的邻域中随机的选择一个新的路径。
pathgetnext(pathp){
intx,y;
pathret;
ret=p;
do{
x=rand()%N+1;
y=rand()%N+1;
}while(x==y);
swap(ret.City[x],ret.City[y]);
ret.Length=totaldist(ret);
returnret;
}
2.2.4执行模拟退火的函数
voidsa()//退ª?
火e和¨ª降¦Ì温?
过y程¨¬
{
doubleT;
pathnewpath,curpath;
inti,A_t=0;
doubledelta;
T=INIT_T;
curpath=F_Path;
while(true)
{
for(i=1;i<=IN_K;i++)
{
newpath=getnext(curpath);
delta=newpath.Length-curpath.Length;
if(delta<0.0)
{
curpath=newpath;
A_t=0;
}
else
{
doublernd=rand()%10000/10000.0;
doublep=exp(-delta/T);
if(p>rnd)
curpath=newpath;
}
}
if(curpath.LengthF_Path=curpath;
if(TT=T*RATE;}
}
输入参数:
INIT_K则是开始模拟退火过程的起始温度。
RATE是模拟退火过程的冷却速率,冷却速率应该始终低于1。
FINAL_T是模拟退火的停止条件。
2.3实验结果
2.4小结
模拟退火算法是依据Metropolis准则接受新解,该准则除了接受优化解外,还在一定的限定范围内接受劣解,此举避免陷入局部极小值、提高解空间的搜索能力和扩大搜索范围方面具有明显的优越性;其次,初始温度T,内循环次数K,以及温度衰减率△t的选取对结果影响很大,适当的选取很重要。
3源代码
#include"stdafx.h"
#include
#include
#include
usingnamespacestd;
constintMAXN=200;//最大城市数
constdoubleINIT_T=100000;//初始温度¨
constdoubleRATE=0.05;//温度下降率
constdoubleFINAL_T=1E-10;//终止温度
constintIN_K=10000;//内层循环数
structpath{//定义路径结构类型
intCity[MAXN];//依次遍历的城市的序号
doubleLength;//所有城市的总长度
};
intN;//城市数量
doubleD[MAXN][MAXN];//任意两个城市之间的距离
pathF_Path;//最优的遍历路径
inlinedoubledist(intx1,inty1,intx2,inty2)//计算两点之间的距离
{
returnsqrt(double((x2-x1)*(x2-x1)+(y2-y1)*(y2-y1)));
}
inlinedoubletotaldist(pathp)//计算遍历路径总长度
{
inti;
doublecost=0;
for(i=1;i{
cost+=D[p.City[i]][p.City[i+1]];
}
cost+=D[p.City[1]][p.City[N]];
returncost;
}
voidinit()//读数据,并初始化
{
intC[MAXN][2];//城市的坐标
inti,j;
freopen("城市坐标.txt","r",stdin);
scanf("%d",&N);
for(i=1;i<=N;i++)
scanf("%d%d",&C[i][0],&C[i][1]);
for(i=1;ifor(j=i+1;j<=N;j++)
{
D[i][j]=D[j][i]=dist(C[i][0],C[i][1],C[j][0],C[j][1]);
}
for(i=1;i<=N;i++)//最优解的初始状态
F_Path.City[i]=i;
F_Path.Length=totaldist(F_Path);
srand((unsigned)time(NULL));
}
pathgetnext(pathp)//新解产生函数
{
intx,y;
pathret;
ret=p;
do{
x=rand()%N+1;
y=rand()%N+1;
}while(x==y);
swap(ret.City[x],ret.City[y]);//交换两城市之间位置顺序
ret.Length=totaldist(ret);
returnret;
}
voidsa()//退火和降温过程
{
doubleT;//温度
pathnewpath,curpath;//当前路径和新路径
inti,A_t=0;
doubledelta;
T=INIT_T;//赋值初始温度
curpath=F_Path;
while(true)
{
for(i=1;i<=IN_K;i++)
{
newpath=getnext(curpath);//获取新路径
delta=newpath.Length-curpath.Length;
if(delta<0.0)
{
curpath=newpath;
A_t=0;
}
else
{
doublernd=rand()%10000/10000.0;
doublep=exp(-delta/T);
if(p>rnd)
curpath=newpath;
}}
if(curpath.LengthF_Path=curpath;
if(TT=T*RATE;//降温
}
}
intmain()
{
clock_tbegin,end;
doublecost;
begin=clock();
init();
printf("初始路径长度:
%.4f\n",F_Path.Length);
for(inti=0;i{
printf("%d->",F_Path.City[++i]);
}
printf("%d",F_Path.City[1]);
printf("\n");
sa();
printf("最优路径长度:
%.4f\n",F_Path.Length);
for(intj=0;j{
printf("%d->",F_Path.City[++j]);
}
printf("%d",F_Path.City[1]);
printf("\n");
end=clock();
cost=(double)(end-begin)/CLOCKS_PER_SEC;
printf("%lfseconds\n",cost);
//printf("Elapsedtime:
%usecs.\n",clock()/CLOCKS_PER_SEC);
return0;
}