基于拓扑序列更新的值迭代算法
黄 蔚,刘 全,孙洪坤,傅启明,周小科
Optimized algorithm for value iteration based on topological sequence backups
通信学报 . 2014, (8): 8 -62 .