吉林大学学报(信息科学版) ›› 2025, Vol. 43 ›› Issue (5): 1033-1042.
王义春, 程崇阳, 闫丽梅
WANG Yichun1, CHENG Chongyang2, YAN Limei2
摘要: 针对现有深度强化学习方法在训练智能体时,常因采集数据泛化性不足导致智能体应对多变运行条件时泛化能力受限的问题,首先提出一种基于大模型辅助深度强化学习的配电网区域电压优化控制策略,将大模型技术与深度强化学习相结合;其次,通过提示工程引导大语言模型(LLM:Large Language Model)生成用于深度强化学习智能体训练的定制化数据集,构建多智能体协同决策框架;然后,基于分布式部分可观测马尔可夫过程建模动态控制问题,在减少对现实数据依赖的同时提升智能体泛化能力;最后,在改进的IEEE33节点 系统上验证了所提控制策略的有效性。 结果表明, 电压偏差与网络损耗分别降低60.82%和49.91%, 并在多种运行条件下表现出较强鲁棒性。
中图分类号: