强化学习中基于权重梯度下降的函数逼近方法
秦晓燕, 刘禹含, 徐云龙, 李斌
Function approximation method based on weights gradient descent in reinforcement learning
Xiaoyan QIN, Yuhan LIU, Yunlong XU, Bin LI
网络与信息安全学报 . 2023, (4): 16 -28 .  DOI: 10.11959/j.issn.2096-109x.2023050