基于两层模糊划分的在策略时间差分算法
穆翔1,刘全1,2,傅启明1,孙洪坤1,周鑫 1
TD algorithm based on double-layer fuzzy partitioning
通信学报 . 2013, (10): 11 -99 .