吉林大学学报(理学版) ›› 2023, Vol. 61 ›› Issue (6): 1432-1440.
高思华1,2, 顾晗1, 贺怀清1, 周钢3
GAO Sihua1,2, GU Han1, HE Huaiqing1, ZHOU Gang3
摘要: 针对求解无线传感器网络目标覆盖问题过程中存在的节点激活策略机理不明确、 可行解集存在冗余等问题, 提出一种基于深度Q学习的目标覆盖算法, 学习无线传感器网络中节点的调度策略. 首先, 算法将构建可行解集抽象成Markov决策过程, 智能体根据网络环境选择被激活的传感器节点作为离散动作; 其次, 奖励函数从激活节点的覆盖能力和自身剩余能量考虑, 评价智能体选择动作的优劣. 仿真实验结果表明, 该算法在不同规模的网络环境下均有效, 网络生命周期均优于3种贪婪算法、 最大寿命覆盖率算法和自适应学习自动机算法.
中图分类号: