稳定且受限的新强化学习 SAC 算法

稳定且受限的新强化学习 SAC 算法

海日, 张兴亮, 姜源, 杨永健

Novel Reinforcement Learning Algorithm: Stable Constrained Soft Actor Critic

HAI Ri , ZHANG Xingliang , JIANG Yuan , YANG Yongjian

吉林大学学报(信息科学版) . 2024, (2): 318 -325 .