自学内容网 自学内容网

Sym-NCO:利用对称性进行神经组合优化


Abstract

深度强化学习(DRL)基础的组合优化(CO)方法(即DRL-NCO)与传统的CO求解器相比具有显著优势,因为DRL-NCO能够学习较少依赖于特定问题的专家领域知识(启发式方法)和监督标记数据(监督学习方法)。本文提出了一种新的训练方案Sym-NCO,它是一种基于正则化的训练方案,利用各种CO问题和解决方案中的普遍对称性。利用诸如旋转和反射不变性等对称性可以显著提高DRL-NCO的泛化能力,因为它允许学习到的求解器利用同一CO问题类别中共同的对称性。我们的实验结果验证了我们的Sym-NCO在四个CO任务上大大提高了DRL-NCO方法的性能,包括旅行商问题(TSP)、带容量限制的车辆路径问题(CVRP)、奖励收集TSP(PCTSP)和定向问题(OP),而且没有利用特定问题的专家领域知识。值得注意的是,Sym-NCO不仅超越了现有的DRL-NCO方法,而且在PCTSP中以240倍更快的速度超越了竞争性的常规求解器——迭代局部搜索(ILS)。我们的源代码可在https://git


原文地址:https://blog.csdn.net/qq_45823731/article/details/142762729

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!