基于动态延迟策略更新的TD3 算法
康朝海, 孙超, 荣垂霆, 刘鹏云
TD3 Algorithm with Dynamic Delayed Policy Update
KANG Chaohai, SUN Chao, RONG Chuiting, LIU Pengyun
吉林大学学报(信息科学版) . 2020, (4): 474 -481 .