稳定且受限的新强化学习 SAC 算法
海 日, 张兴亮, 姜 源, 杨永健
Novel Reinforcement Learning Algorithm: Stable Constrained Soft Actor Critic
HAI Ri , ZHANG Xingliang , JIANG Yuan , YANG Yongjian
吉林大学学报(信息科学版) . 2024, (2): 318 -325 .