模拟退火算法

🕗 发布于 2024-12-10 14:42 模拟退火算法算法 机器学习

模拟退火算法(SA) 是一种导向性随机搜索的启发式算法，它是受加热金属的退火规律所启发而提出的一种求解组合优化问题的逼近算法。这个规律就是，在某个温度下,金属分子停留在能量小的状态的概率比停留在能量大的状态的概率要大。

1 受热金属物体分子状态分

在温度度t下,金属物体的分子呈现出不同的状态，停留在状态r满足Boltzmann 概率分布

其中， $E(r)$ 表示分子在状态r 的能量，k>0为Boltzmann 常数, 而 $\bar{E}$ 表示分子能量的一个随机变量。设分子状态空间U是有限的，那么Z(t)应为

根据Boltzmann概率分布,分子有如下运动规律：

温度t很高时,金属物体的分子停留在任何状态的概率近似相等；
在同一温度t下,金属物体的分子停留在能量低的状态比在能量高的状态的概率大；
分子在能量最低状态的概率关于温度t下降；
分子停留在最低能量状态的概率随温度降低趋于1；
分子在非能量最低状态的概率随温度降低趋于0。

设金属分子的状态概率分布为

其中状态取为r=2,3,4,5,6, 而

可以由以下Boltzmann 函数曲线直观的看到上述分子运动规律。

2 基本模拟退火算法

基本步骤：

初始化可行解和温度；
根据 Boltzmann 概率退火；
重复第2步直到稳定状态（内循环）；
降温；
重复第2步至第4步直到满足终止条件或直到给定的步数（外循环）；
输出最好的解作为最优解。

3 模拟退火算法实现技术

3.1 初始化过程

初始可行解： $s_{0}$ ，根据问题随机产生；

初始温度 $t_{0}$ ，理论上要求应保证平稳分布中产生任意可行解的概率相等，即 $exp(-\Delta f_{ij}/t_{0})\approx 1$ ，其中 $\Delta f_{ij}=f(s_{i})-f(s_{i})$ 。取 $t_{0}=K\Delta _{0}$ ， $K$ K 为充分大的数,而

3.2 退火

退火过程就是在一给定温度下，由一个状态变到另一个状态，每一个状态到达的次数服从一个概率分布，即基于Metropolis 接受准则的过程，该过程达到平稳时停止。在状态 $s_{i}$ 时,产生的状态 $s_{j}$ 被接受的概率为

3.3 降温

一种降温方式为 $t_{k+1}=d(t_{k})$ ，其中 $d(t_{k})=\alpha t_{k}$ 。

另一种降温方法为 $t_{k}=\frac{M-k}{M}t_{0}$ ，其中M为温度下降的总次数。

3.4 内循环终止准则

固定步数：即在每一温度迭代相同的步数；
由接受和拒绝的比率控制迭代步数：
给定一个迭代步数上限U和一个接受次数指标r，在温度t实施退火过程，当接受次数等于r时，不再迭代，否则一直迭代到步数上限U。
或者给定一个接受指标R和迭代步数下限L，在温度t实施退火过程，迭代到步数L时，开始计算接受次数与总次数的比率，一旦比率超过R，不再迭代，否则一直迭代到步数上限U。
同样可以用拒绝次数控制终止准则。

3.5外循环终止准则

设置终止温度的阈值（比较小的正数） $\varepsilon > 0$ ，当温度下降到 $t_{k}< \varepsilon$ 时，算法停止。
设置循环总数。迭代次数达到指定数目时，算法停止。
基于不改进规则。若连续若干步搜索到的最优解不再改进，算法停止。
设置接受概率。给定指标 $\chi > 0$ 是一个比较小的数，在温度t，除局部最优解外，其他状态的接受概率均小于 $\chi$ ，算法停止。

4 参考原文

原文地址：https://blog.csdn.net/qq_58675332/article/details/144341691

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：GitHub使用
下一篇：openEuler 24.09 新体验及常用配置

Java学习笔记（15）——面向对象编程
学习资料来自。
阅读更多2024-12-26
Linux文件IO
对与系统IO ,当我们调用read，write读写数据的时候，操作系统会进入到内核来去调用这些api，但是如果是多次循环读写的话频繁的进入内核是和消耗性能的。所以标准的IO（fopen、fread、f
阅读更多2024-12-26
【ArcGIS Pro微课1000例】0064：栅格目录、栅格数据集、镶嵌数据集
栅格目录：是一个用于管理和组织栅格数据集的结构，通常包含多个栅格数据集的元数据和索引信息。它相当于一个文件夹，里面可以存放多个栅格文件。可以将工作空间转栅格目录。栅格数据集：是指单个的栅格数据文件，包
阅读更多2024-12-26
《网络对抗》—— 网络欺诈技术防范
DNS欺骗就是攻击者冒充域名服务器的一种欺骗行为，它并不是真的“黑掉”了对方的网站，而是冒名顶替、招摇撞骗罢了。DNS欺骗攻击是很难防御的，因为这种攻击大多数都是被动的。通常情况下，除非产生一定后果，
阅读更多2024-12-26
Leetcode打卡：切蛋糕的最小总开销I
有一个m x n大小的矩形蛋糕，需要切成1 x 1的小块。给你整数mnm - 1in - 1j一次操作中，你可以选择任意不是1 x 1ij每次操作后，这块蛋糕都被切成两个独立的小蛋糕。每次操作的开销都
阅读更多2024-12-26
《人工智能：洞察材料微观与宏观性能关系的神奇之眼》
在研究陶瓷材料的绝缘性能时，人工智能通过分析大量陶瓷的微观结构数据和电导率测试结果，发现了晶体结构对称性、气孔率等微观因素对宏观绝缘性能的影响规律，而且这种规律的总结并非简单的线性关系，而是一种高度复
阅读更多2024-12-26
MySQL备份
使用tar命令将数据库目录/var/lib/mysql/*进行备份。
阅读更多2024-12-26
Go语言zero项目服务恢复与迁移文档
确保各项依赖服务（MySQL、Redis、OSS、RabbitMQ、SDK）配置正确，Nginx 配置无误，项目能够正常运行并通过接口测试。在服务器环境配置完成后，接下来需要进行项目代码迁移及依赖配置
阅读更多2024-12-26
替换 Docker.io 的 Harbor 安全部署指南：域名与 IP 双支持的镜像管理解决方案
本教程详细讲解如何使用 OpenSSL 自签名证书，部署一个支持域名 registry-1.docker.io 和 IP 地址 172.16.20.20 的 Harbor 服务，作为 Docker.i
阅读更多2024-12-26
一起学Git【第六节：查看版本差异】
是 Git 版本控制系统中用于展示差异的强大工具。他可以用于查看文件在工作区、暂存区和版本库之间的差异、任意两个指定版本之间的差异和两个分支之间的差异等，接下来进行详细的介绍。
阅读更多2024-12-26