最小状态变元平均奖赏的强化学习方法

最小状态变元平均奖赏的强化学习方法

刘全,傅启明,龚声蓉,伏玉琛,崔志明

Reinforcement learning algorithm based on minimum state method and average reward

Quan LIU,Qi-ming FU,Sheng-rong GONG,Yu-chen FU,Zhi-ming CUI

通信学报 . 2011, (1): 66 -71 . DOI: 1000-436X(2011)01-0066-06

期刊网站版权所有 © 2021 《通信学报》编辑部
地址：北京市丰台区东铁匠营街道顺八条1号院B座“北阳晨光大厦”2层邮编：100079
电话：010-53878169、53859522、53878236 电子邮件：xuebao@ptpress.com.cn; txxb@bjxintong.com.cn

期刊网站版权所有 © 2021 《通信学报》编辑部
地址：北京市丰台区东铁匠营街道顺八条1号院B座“北阳晨光大厦”2层
邮编：100079 电话：010-53878169、53859522、53878236
电子邮件：txxb@bjxintong.com.cn