模拟退火算法.docx-资源下载

模拟退火算法.docx

1、模拟退火算法一. 爬山算法 ( Hill Climbing ) 介绍模拟退火前，先介绍爬山算法。爬山算法是一种简单的贪心搜索算法，该算法每次从当前解的临近解空间中选择一个最优解作为当前解，直到达到一个局部最优解。爬山算法实现很简单，其主要缺点是会陷入局部最优解，而不一定能搜索到全局最优解。如图1所示：假设C点为当前解，爬山算法搜索到A点这个局部最优解就会停止搜索，因为在A点无论向那个方向小幅度移动都不能得到更优的解。图1二. 模拟退火(SA,Simulated Annealing)思想爬山法是完完全全的贪心法，每次都鼠目寸光的选择一个当前最优解，因此只能搜索到局部的最优值。模拟退火其实也是

2、一种贪心算法，但是它的搜索过程引入了随机因素。模拟退火算法以一定的概率来接受一个比当前解要差的解，因此有可能会跳出这个局部的最优解，达到全局的最优解。以图1为例，模拟退火算法在搜索到局部最优解A后，会以一定的概率接受到E的移动。也许经过几次这样的不是局部最优的移动后会到达D点，于是就跳出了局部最大值A。模拟退火算法描述：若J( Y(i+1) )= J( Y(i) ) (即移动后得到更优解)，则总是接受该移动若J( Y(i+1) ) J( Y(i) ) (即移动后的解比当前解要差)，则以一定的概率接受移动，而且这个概率随着时间推移逐渐降低（逐渐降低才能趋向稳定）这里的“一定的概率”的计算参

3、考了金属冶炼的退火过程，这也是模拟退火算法名称的由来。根据热力学的原理，在温度为T时，出现能量差为dE的降温的概率为P(dE)，表示为：P(dE) = exp( dE/(kT) )其中k是一个常数，exp表示自然指数，且dE0。这条公式说白了就是：温度越高，出现一次能量差为dE的降温的概率就越大；温度越低，则出现降温的概率就越小。又由于dE总是小于0（否则就不叫退火了），因此dE/kT T_min )dE=J( Y(i+1) )-J( Y(i) ) ;if( dE=0)/表达移动后得到更优解，则总是接受移动Y(i+1)=Y(i) ;/接受从Y(i)到Y(i+1)的移动else/函数exp( d

4、E/T )的取值范围是(0,1) ，dE/T越大，则exp( dE/T )也if( exp( dE/T )random(0,1) )Y(i+1)=Y(i) ;/接受从Y(i)到Y(i+1)的移动T=r*T ;/降温退火，0r1 。r越大，降温越慢；r越小，降温越快/* 若r过大，则搜索到全局最优解的可能会较高，但搜索的过程也就较长。若r过小，则搜索的过程会很快，但最终可能会达到一个局部最优值*/i+;四. 使用模拟退火算法解决旅行商问题旅行商问题 ( TSP , Traveling Salesman Problem ) ：有N个城市，要求从其中某个问题出发，唯一遍历所有城市，再回到出发的城市

5、，求最短的路线。旅行商问题属于所谓的NP完全问题，精确的解决TSP只能通过穷举所有的路径组合，其时间复杂度是O(N!) 。使用模拟退火算法可以比较快的求出TSP的一条近似最优路径。（使用遗传算法也是可以的，我将在下一篇文章中介绍）模拟退火解决TSP的思路：1. 产生一条新的遍历路径P(i+1)，计算路径P(i+1)的长度L( P(i+1) )2. 若L(P(i+1) 温度缓慢下降=终止在低温（这时能量函数达到最小，目标函数最小）在热力学中的退火过程大致是变温物体缓慢降温而达到分子之间能量最低的状态。设热力学系统S中有有限个且离散的n个状态，状态的能量为，在温度下，经过一段时间达到热平衡，这

6、时处于状态的概率为模拟退火算法也是贪心算法，但是在其过程中引入了随机因素，以一定的概率接受一个比当前解要差的解，并且这个概率随着时间的推移而逐渐降低。2. 模拟退火算法描述若，即移动后得到更优的解，那么总是接受改移动。若，即移动后得到更差的解，则以一定的概率接受该移动，并且这个概率随时间推移逐渐降低。这个概率表示为由于是退火过程，所以dE 0，这个公式说明了温度越高出现一次能量差为dE的降温概率就越大，温度越低，出现降温的概率就越小，由于dE总是小于0，所以P(dE)取值在0到1之间。伪码如下3. 费马点问题求解题目：http:/poj.org/problem?id=2420题意：

7、给n个点，找出一个点，使这个点到其他所有点的距离之和最小，也就是求费马点。题目：平面上给定n条线段，找出一个点，使这个点到这n条线段的距离和最小。4. 最小包含球问题求解题目：http:/poj.org/problem?id=2069 题意：给定三维空间的n点，找出一个半径最小的球把这些点全部包围住。5. 函数最值问题求解题目：题意：给出方程，其中，输入，求的最小值。分析：本题可以用经典的二分法求解，这种方法比较简单，就不说了。主要来说模拟退火做法。6. TSP问题求解 TSP问题是一个NP问题，但是可以求近似解，通过模拟退火算法实现，代码如下BloomFilter大规模数据处理利器Bl

8、oom Filter是由Bloom在1970年提出的一种多哈希函数映射的快速查找算法。通常应用在一些需要快速判断某个元素是否属于集合，但是并不严格要求100%正确的场合。一.实例为了说明Bloom Filter存在的重要意义，举一个实例：假设要你写一个网络蜘蛛（web crawler）。由于网络间的链接错综复杂，蜘蛛在网络间爬行很可能会形成“环”。为了避免形成“环”，就需要知道蜘蛛已经访问过那些URL。给一个URL，怎样知道蜘蛛是否已经访问过呢？稍微想想，就会有如下几种方案：1. 将访问过的URL保存到数据库。2. 用HashSet将访问过的URL保存起来。那只需接近O(1)的代价就可以查到一

9、个URL是否被访问过了。3. URL经过MD5或SHA-1等单向哈希后再保存到HashSet或数据库。4. Bit-Map方法。建立一个BitSet，将每个URL经过一个哈希函数映射到某一位。方法13都是将访问过的URL完整保存，方法4则只标记URL的一个映射位。以上方法在数据量较小的情况下都能完美解决问题，但是当数据量变得非常庞大时问题就来了。方法1的缺点：数据量变得非常庞大后关系型数据库查询的效率会变得很低。而且每来一个URL就启动一次数据库查询是不是太小题大做了？方法2的缺点：太消耗内存。随着URL的增多，占用的内存会越来越多。就算只有1亿个URL，每个URL只算50个字符，就需要5GB

10、内存。方法3：由于字符串经过MD5处理后的信息摘要长度只有128Bit，SHA-1处理后也只有160Bit，因此方法3比方法2节省了好几倍的内存。方法4消耗内存是相对较少的，但缺点是单一哈希函数发生冲突的概率太高。还记得数据结构课上学过的Hash表冲突的各种解决方法么？若要降低冲突发生的概率到1%，就要将BitSet的长度设置为URL个数的100倍。实质上上面的算法都忽略了一个重要的隐含条件：允许小概率的出错，不一定要100%准确！也就是说少量url实际上没有没网络蜘蛛访问，而将它们错判为已访问的代价是很小的大不了少抓几个网页呗。二. Bloom Filter的算法废话说到这里，下面引入本篇的

11、主角Bloom Filter。其实上面方法4的思想已经很接近Bloom Filter了。方法四的致命缺点是冲突概率高，为了降低冲突的概念，Bloom Filter使用了多个哈希函数，而不是一个。 Bloom Filter算法如下：创建一个m位BitSet，先将所有位初始化为0，然后选择k个不同的哈希函数。第i个哈希函数对字符串str哈希的结果记为h（i，str），且h（i，str）的范围是0到m-1 。(1)加入字符串过程下面是每个字符串处理的过程，首先是将字符串str“记录”到BitSet中的过程：对于字符串str，分别计算h（1，str），h（2，str） h（k，str）。然后将BitS

12、et的第h（1，str）、h（2，str） h（k，str）位设为1。图1.Bloom Filter加入字符串过程很简单吧？这样就将字符串str映射到BitSet中的k个二进制位了。(2)检查字符串是否存在的过程下面是检查字符串str是否被BitSet记录过的过程：对于字符串str，分别计算h（1，str），h（2，str） h（k，str）。然后检查BitSet的第h（1，str）、h（2，str） h（k，str）位是否为1，若其中任何一位不为1则可以判定str一定没有被记录过。若全部位都是1，则“认为”字符串str存在。若一个字符串对应的Bit不全为1，则可以肯定该字符串一定没有被Blo

13、om Filter记录过。（这是显然的，因为字符串被记录过，其对应的二进制位肯定全部被设为1了）但是若一个字符串对应的Bit全为1，实际上是不能100%的肯定该字符串被Bloom Filter记录过的。（因为有可能该字符串的所有位都刚好是被其他字符串所对应）这种将该字符串划分错的情况，称为false positive 。(3)删除字符串过程字符串加入了就被不能删除了，因为删除会影响到其他字符串。实在需要删除字符串的可以使用Counting bloomfilter(CBF)，这是一种基本Bloom Filter的变体，CBF将基本Bloom Filter每一个Bit改为一个计数器，这样就可以实

14、现删除字符串的功能了。Bloom Filter跟单哈希函数Bit-Map不同之处在于：Bloom Filter使用了k个哈希函数，每个字符串跟k个bit对应。从而降低了冲突的概率。三. Bloom Filter参数选择 (1)哈希函数选择哈希函数的选择对性能的影响应该是很大的，一个好的哈希函数要能近似等概率的将字符串映射到各个Bit。选择k个不同的哈希函数比较麻烦，一种简单的方法是选择一个哈希函数，然后送入k个不同的参数。(2)Bit数组大小选择哈希函数个数k、位数组大小m、加入的字符串数量n的关系可以参考参考文献1。该文献证明了对于给定的m、n，当 k = ln(2)* m/n 时出错的

15、概率是最小的。同时该文献还给出特定的k，m，n的出错概率。例如：根据参考文献1，哈希函数个数k取10，位数组大小m设为字符串个数n的20倍时，false positive发生的概率是0.0000889 ，这个概率基本能满足网络爬虫的需求了。四. Bloom Filter实现代码下面给出一个简单的Bloom Filter的Java实现代码：importjava.util.BitSet;publicclassBloomFilter/*BitSet初始分配224个bit*/privatestaticfinalintDEFAULT_SIZE=125;/*不同哈希函数的种子，一般应取质数*/priv

16、atestaticfinalint seeds=newint 5,7,11,13,31,37,61;privateBitSet bits=newBitSet(DEFAULT_SIZE);/*哈希函数对象*/privateSimpleHash func=newSimpleHashseeds.length;publicBloomFilter()for(inti=0; iseeds.length; i+)funci=newSimpleHash(DEFAULT_SIZE, seedsi);/将字符串标记到bits中publicvoidadd(String value)for(SimpleHash f

17、: func)bits.set(f.hash(value),true);/判断字符串是否已经被bits标记publicbooleancontains(String value)if(value=null)returnfalse;booleanret=true;for(SimpleHash f : func)ret=ret&bits.get(f.hash(value);returnret;/*哈希函数类*/publicstaticclassSimpleHashprivateintcap;privateintseed;publicSimpleHash(intcap,intseed)this.cap

18、=cap;this.seed=seed;/hash函数，采用简单的加权和hashpublicinthash(String value)intresult=0;intlen=value.length();for(inti=0; ilen; i+)result=seed*result+value.charAt(i);return(cap-1)&result;模拟退火算法模拟退火算法来源于固体退火原理，是一种基于概率的算法，将固体加温至充分高，再让其徐徐冷却，加温时，固体内部粒子随温升变为无序状，内能增大，而徐徐冷却时粒子渐趋有序，在每个温度都达到平衡态，最后在常温时达到基态，内能减为最小。简介模拟

19、退火算法(Simulated Annealing，SA)最早的思想是由N. Metropolis1等人于1953年提出。1983 年,S. Kirkpatrick 等成功地将退火思想引入到组合优化领域。它是基于Monte-Carlo迭代求解策略的一种随机寻优算法，其出发点是基于物理中固体物质的退火过程与一般组合优化问题之间的相似性。模拟退火算法从某一较高初温出发，伴随温度参数的不断下降,结合概率突跳特性在解空间中随机寻找目标函数的全局最优解，即在局部最优解能概率性地跳出并最终趋于全局最优。模拟退火算法是一种通用的优化算法，理论上算法具有概率的全局优化性能,目前已在工程中得到了广泛应用，诸如VL

20、SI、生产调度、控制工程、机器学习、神经网络、信号处理等领域。模拟退火算法是通过赋予搜索过程一种时变且最终趋于零的概率突跳性，从而可有效避免陷入局部极小并最终趋于全局最优的串行结构的优化算法。模拟退火算法的原理编辑模拟退火算法来源于固体退火原理，将固体加温至充分高，再让其徐徐冷却，加温时，固体内部粒子随温升变为无序状，内能增大，而徐徐冷却时粒子渐趋有序，在每个温度都达到平衡态，最后在常温时达到基态，内能减为最小。根据Metropolis准则，粒子在温度T时趋于平衡的概率为e(-E/(kT)，其中E为温度T时的内能，E为其改变量，k为Boltzmann常数。用固体退火模拟组合优化问题，将内能E模

21、拟为目标函数值f，温度T演化成控制参数t，即得到解组合优化问题的模拟退火算法：由初始解i和控制参数初值t开始，对当前解重复“产生新解计算目标函数差接受或舍弃”的迭代，并逐步衰减t值，算法终止时的当前解即为所得近似最优解，这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。退火过程由冷却进度表(Cooling Schedule)控制，包括控制参数的初值t及其衰减因子t、每个t值时的迭代次数L和停止条件S。模拟退火算法的模型1模拟退火算法可以分解为解空间、目标函数和初始解三部分。2模拟退火的基本思想:(1) 初始化：初始温度T(充分大)，初始解状态S(是算法迭代的起点)，每个T值的迭代次数L(2)

22、对k=1，L做第(3)至第6步：(3) 产生新解S(4) 计算增量t=C(S)-C(S)，其中C(S)为评价函数(5) 若t0，然后转第2步。模拟退火算法的步骤模拟退火算法新解的产生和接受可分为如下四个步骤：第一步是由一个产生函数从当前解产生一个位于解空间的新解；为便于后续的计算和接受，减少算法耗时，通常选择由当前新解经过简单地变换即可产生新解的方法，如对构成新解的全部或部分元素进行置换、互换等，注意到产生新解的变换方法决定了当前新解的邻域结构，因而对冷却进度表的选取有一定的影响。第二步是计算与新解所对应的目标函数差。因为目标函数差仅由变换部分产生，所以目标函数差的计算最好按增量计算。事实表

23、明，对大多数应用而言，这是计算目标函数差的最快方法。第三步是判断新解是否被接受,判断的依据是一个接受准则，最常用的接受准则是Metropolis准则: 若t0则接受S作为新的当前解S，否则以概率exp(-t/T)接受S作为新的当前解S。第四步是当新解被确定接受时，用新解代替当前解，这只需将当前解中对应于产生新解时的变换部分予以实现，同时修正目标函数值即可。此时，当前解实现了一次迭代。可在此基础上开始下一轮试验。而当新解被判定为舍弃时，则在原当前解的基础上继续下一轮试验。模拟退火算法与初始值无关，算法求得的解与初始解状态S(是算法迭代的起点)无关；模拟退火算法具有渐近收敛性，已在理论上被证明是一

24、种以概率l 收敛于全局最优解的全局优化算法；模拟退火算法具有并行性。模拟退火算法伪代码123456789s:=s0;e:=E(s)/设定目前状态为s0，其能量E(s0)k:=0/评估次数kwhilekemax/若还有时间（评估次数k还不到kmax）且结果还不够好（能量e不够低）则：sn:=neighbour(s)/随机选取一临近状态snen:=Esn)/sn的能量为E(sn)ifrandom()P(e,en,temp(k/kmax)then/决定是否移至临近状态sns:=sn;e:=en/移至临近状态snk:=k+1/评估完成，次数k加一returns/回转状态s模拟退火算法心得本文属于原

25、创，make by 刘润佳，转载请注明出处。由于在做一些Sat（可满足性问题）的事情，所以也尝试了多种方法来求解，其中模拟退火算法是一种不完全方法。首先看看模拟退火算法的思想：一、模拟退火算法的起源1）它受益于物理退火过程加温过程等温过程冷却（退火）过程2）等温下热平衡过程可用Monte Carlo方法模拟，计算量大。3）1953年，Metropolis提出重要性采样法，即以概率接受新状态，称Metropolis准则，计算量相对Monte Carlo方法显著减少。4）1983年，Kirkpatrick等提出模拟退火算法，并将其应用于组合优化问题的求解。二、模拟退火的基本思想它可以分解为解空间、目标函数和初始解三部分。(1) 初始化：初始温度T(充分大)，初始解状态S(是算法迭代的起点)，每个T

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？