吉林大学学报(信息科学版) ›› 2025, Vol. 43 ›› Issue (5): 988-998.
杨思洁,杨依睿,刘 思,陈欢军,徐 韬,孔德政,窦全胜
YANG Sijie, YANG Yirui, LIU Si, CHEN Huanjun, XU Tao, KONG Dezheng, DOU Quansheng
摘要: 针对传统调度方法在电能计量设备检测调度中存在的稳定性不足、泛化能力弱及受设备配置影响等问题, 提出了GNN-RL(Graph Neural Network-Reinforcement Learning)检测调度模型。 该模型将调度问题视为马尔可夫决策过程,首先构建电能计量设备检测调度的图结构模型,然后通过改进的图神经网络提取问题特征并传递给动作选择网络以生成决策,最终将决策结果分配给机器执行。 调度结束后,模型收集反馈信息以训练强化学习模块中的调度策略。 在训练阶段, GNN-RL优化了消息传递机制, 采用与调度目标紧密相关的损失函数,并动态调整学习率。 同时,还引入多任务学习框架处理任务分配和时间调度。 实验结果表明,GNN-RL 在寻优能力、求解精度和稳定性方面优势明显,对电能计量设备检测调度问题的求解具有显著优势,明显提高了问题求解的效率和可靠性。
中图分类号: