强化学习中基于权重梯度下降的函数逼近方法

秦晓燕, 刘禹含, 徐云龙, 李斌

Function approximation method based on weights gradient descent in reinforcement learning

Xiaoyan QIN, Yuhan LIU, Yunlong XU, Bin LI

网络与信息安全学报 . 2023, (4): 16 -28 . DOI: 10.11959/j.issn.2096-109x.2023050

版权 © 2019 《网络与信息安全学报》编辑部
地址：北京市丰台区东铁匠营街道顺八条1号院B座“北阳晨光大厦”2层
邮编：100079 电话：010-53879136/53879138/53879139
电子邮件：cjnis@bjxintong.com.cn