"); //-->
3GAT在组合优化问题中的应用
3.1组合优化问题
组合优化问题是运筹学中的核心问题,也是学者开始学习运筹学的必经之路。组合优化问题是计算机科学和运筹学中的核心领域,涉及到许多实际应用,如物流、调度和网络设计等。组合优化问题 在许多实际应用中都起着至关重要的作用。例如,在物流领域,组合优化问题可以帮助人们在纷繁错 杂的运输条件中,找到最优的货物配送路线,从而节省运输成本和提高货运效率。在调度问题中,组合优化可以帮助人们有效地分配资源,以满足各种约束条件,同时最大化或最小化某个所需的某个目标值(通常称为目标函数)。
然而,传统的组合优化算法通常需要针对每个新问题从头开始设计,并且需要专家对问题结构进行仔细的考虑。解决组合优化问题通常需要大量的计算资源,特别是对于来源于现实的问题,通常情况下问题本身规模十分庞大,传统的优化算法可能无法在合理的时间内找到解决方案,甚至无法在可达的时间内求解。因此,如何有效地解决组合优化问题,一直是研究者们关注的焦点。近年来,使用马尔科夫链构造动态规划的方式,可以解决被表述为由状态、动作和奖励定义的单人游戏的组合优化问题,包括最小生成树、最短路径、旅行商问题(TSP)和车辆路径问题(VRP),而无需专家知识。这种方法使用强化学习训练图注意力神经网络(GNN),在未标记的图训练集上进行训练。训练后的网络可以在线性运行时间内输出新图实例的近似解。在TSP问题中,GAT可以有效地处理城市之间的距离关系,从而找到最短的旅行路径。在VRP问题中,GAT可以有效地处理车辆、客户 和仓库之间的关系,从而找到最优的配送路线。这些研究结果表明,GAT在解决组合优化问题方面,具 有巨大的潜力。
3.2GAT解决路径规划论文案例
(Kool et al.,2018)中提出了一种类似GAT的基于注意力机制的模型来解决不同的路径规划问题,包括TSP, VRP, OP等问题。本文主要是通过将路径规划问题(例如TSP)构造为基于图的问题,在TSP中 的每个顾客点位的位置以及其它信息作节点的特征。经由基于注意力机制的编码-****,得出路径结果即一个随机策略π(π|s), 使用此策略在给定的测试数据点中找到最有路径方法π,此方法被θ参数化并且分解为:
(10)
解码过程是顺序进行的。在每个时间步,****根据编码器的嵌入和在时间生成的输出来输出节点πt。在解码过程中,增加一个特殊的上下文节点来表示解码上下文。****在编码器的顶部计算一个注意力(子)层,但是只向上下文节点发送消息以提高效率。最后的概率是使用单头注意力机制计算的。在 时间t,****的上下文来自编码器和在时间t之前的输出。对于TSP来说包括图的嵌入,前一个(最 后一个)节点πt-1和第一个节点π1。同时为了计算输出概率,添加一个具有单个注意力头的最终****层。文章通过梯度下降优化损失L,使用REINFORCE梯度估计器和基线。文章使用Rollout基线,基线策略的更新是周期性的,也是较好的模型定义策略,用来确定性贪婪Rollout的解决方案。
文章还详细讨论了对于不同问题的处理策略,例如对于奖励收集旅行商问题(PCTSP),作者在编码器中使用了单独的参数来处理仓库节点,并且提供了节点奖励和惩罚作为输入特征。在****的上下文中,作者使用了当前/最后的位置和剩余的奖励来收集。在PCTSP中,如果剩余的奖励大于0且所有节点都没有被访问过,那么仓库节点不能被访问。只有当节点已经被访问过时,才会被屏蔽(即不 能被访问)。
由于篇幅限制,本文只着重介绍Kool et al. (2018)是如何基于图注意力机制来构造在TSP中节点 间相互传递加权信息的算法。在文中构造的图中,节点接收到的带有权重的信息,来自于自己和周围的邻点们。而这些节点位的信息值是取决于其查询与邻居的键的兼容性,如Figure6所示。作者定义了dk, dv并设计计算了相应的ki∈ ℝdk, vi∈ ℝdv, qi∈ ℝdk。对于所有点位的对应qi ,ki,v i,通过以下方法 投影嵌入到hi来计算:
其中的WQ,WK是两组维数是dk ×dh的参数矩阵,WV的大小是(dv × dh). (推荐想深入了解Transformer中q, k, v设置与计算方法的读者,移步至WMathor (2020))
两点之间的兼容性,就是通过计算节点i的qi同j点的kj之间的值uij来实现的 (Velickovic et al.,2017):
(11)
设置-∞避免了不相接的点互相传递信息,通过构建的兼容性,类似于Velickovic et al.(2017)中的eij, Khalil et al.(2017) 是这样计算注意力权重aij的:
(12)
最终,节点i将接收到一个向量h’i,其中包含了向量vj的凸组合:
(13)
4结语
4.1GAT的未来发展和应用前景
图注意力网络(GAT)在解决组合优化问题,特别是旅行商问题(TSP)和车辆路径问题(VRP)等问题上的能力已经得到了广泛的证明。然而也需要注意到,虽然GAT在这些问题上表现出了优越性,但是它并不是万能的。对于一些特定的问题,可能需要设计特定的模型或者算法来解决。因此,在研究问题时,需要根据问题的具体情况,结合GAT解决问题的特性,选择合适的工具来解决不同的组合 优化问题。
在其它领域GAT也发挥着不同的作用,例如,Zhang et al. (2022)中提出了一种新的GAT架构,该架构可以捕获不同规模图知识之间的潜在关联。这种新的GAT架构在预测准确性和训练速度上都优于 传统的GAT模型。
此外,Shao et al.(2022)提出了一种新的动态多图注意力模型,该模型可以处理长期的时空预测问题。这种模型通过构建新的图模型来表示每个节点的上下文信息,并利用长期的时空数据依赖结构。这种方法在两个大规模数据集上的实验表明,它可以显著提高现有图神经网络模型在长期时空预测任务上的性能。
在股票市场预测方面,GAT也有着广泛的应用。Zhao et al. (2022)提出了一种基于双注意力网络的股票移动预测方法。首先构建了一个包含两种类型的实体(包括上市公司和相关的高管)和混合关系(包括显式关系和隐式关系)的市场知识图。然后,提出了一种双注意力网络,通过这个网络可以 学习到市场知识图中的动量溢出信号,从而进行股票预测。实验结果表明,该方法在股票预测方面的性能优于九种最先进的基线方法。
总的来说,图形的视角为研究提供了一种全新的方式来理解和解决问题。将已有的问题以图形的形式思考和转换,不仅可以揭示问题的新的方面和特性,而且还可能引发新的创新点。同样,将新的问题用图形方法思考,也可能带来意想不到的收获。这种方法的优点在于,它可以帮助学者更好地理解问题的结构和复杂性,从而找到更有效的解决方案。希望大家从本篇对于GAT的介绍开始,可以更多了解图神经网络的原理,更多地应用到自己的学 习和研究当中,通过使用GAT可以为解决问题提供强有力的支持。
作者简介
作者邓杨,西安交通大学管理学院-香港城市大学系统工程学院联合培养博三学生,研究方向为强化学习在城市物流中的应用。硕士毕业于南加州大学交通工程专业,荣誉毕业生。曾就职于工程咨询 企业HATCH洛杉矶办公室,加州注册EIT。曾获AACYF 2017年‘三十位三十岁以下优秀创业青年’、2019年‘全美十大华裔杰出青年’等称号。现为包头市海联会副会长、侨联、欧美同学会会员。
References
1.DGL Team. 9 Graph Attention Network (GAT) Deep Graph Library (DGL). https: //docs .dgl.ai/ en/0.8.x/tutorials/models/1_gnn/9_gat.html (2023).2.Graph Attention Networks LabML. https://nn.labml.ai/graphs/gat/index.html (2023).3.Graph Attention Networks Experiment LabML. https://nn.labml.ai/graphs/gat/experiment. html (2023).4.Khalil, E., Dai, H., Zhang, Y., Dilkina, B. & Song, L. Learning combinatorial optimization algorithms over graphs. Advances in neural information processing systems 30 (2017).5.Kool, W., Van Hoof, H. & Welling, M. Attention, learn to solve routing problems! arXiv preprint arXiv:1803.08475 (2018).6.LabML Team. Graph Neural Networks LabML. https://nn.labml.ai/graphs/index.html (2023).7.LaBonne, M. Graph Attention Networks: Theoretical and Practical Insights https : / / mlabonne . github.io/blog/posts/2022-03-09-graph_attention_network.html (2023).8.Shao, W., Jin, Z., Wang, S., Kang, Y., Xiao, X., Menouar, H., Zhang, Z., Zhang, J. & Salim, F. Long-term Spatio-Temporal Forecasting via Dynamic Multiple-Graph Attention. arXiv preprint arXiv:2204.11008 (2022).9.Velickovic, P., Cucurull, G., Casanova, A., Romero, A., Lio, P., Bengio, Y., et al. Graph attention networks. stat 1050, 10–48550 (2017).10.WMathor. Graph Attention Networks https://wmathor.com/index.php/archives/1438/ (2023).11.Zhang, W., Yin, Z., Sheng, Z., Li, Y., Ouyang, W., Li, X., Tao, Y., Yang, Z. & Cui, B. Graph attention multilayer perceptron in Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (2022), 4560–4570.12.Zhao, Y., Du, H., Liu, Y., Wei, S., Chen, X., Zhuang, F., Li, Q. & Kou, G. Stock Movement Prediction Based on Bi-Typed Hybrid-Relational Market Knowledge Graph Via Dual Attention Networks. IEEE Transactions on Knowledge and Data Engineering (2022).REFERENCES
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。