深度强化学习算法与应用研究现状综述
刘朝阳1, 穆朝絮1, 孙长银2
An overview on algorithms and applications of deep reinforcement learning
Zhaoyang LIU1, Chaoxu MU1, Changyin SUN2

图5. Atari 2600典型游戏环境

.