基于深度强化学习算法的自主式水下航行器深度控制
王日中, 李慧平, 崔迪, 徐德民
Depth control of autonomous underwater vehicle using deep reinforcement learning
Rizhong WANG, Huiping LI, Di CUI, Demin XU

图6. 平均奖励值随训练幕数的变化

.