智能科学与技术学报 ›› 2020, Vol. 2 ›› Issue (2): 101-106.doi: 10.11959/j.issn.2096-6652.202011

• 评论智能 •    下一篇

强化学习:迈向知行合一的智能机制与算法

王飞跃1,2,3,曹东璞4,魏庆来1,2,3   

  1. 1 中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京 100190
    2 中国科学院大学,北京,100049
    3 青岛智能产业技术研究院,山东 青岛 266109
    4 滑铁卢大学,加拿大 滑铁卢 N2L 3G1
  • 修回日期:2020-05-20 出版日期:2020-06-20 发布日期:2020-07-14
  • 作者简介:王飞跃(1961- ),男,博士,中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任,中国科学院大学中国经济与社会安全研究中心主任,青岛智能产业技术研究院院长,主要研究方向为平行系统的方法与应用、社会计算、平行智能以及知识自动化|曹东璞(1978- ),男,博士,滑铁卢大学副教授,认知自动驾驶实验室主任,主要研究方向为自动驾驶、人车协同与平行驾驶|魏庆来(1979- ),男,博士,中国科学院自动化研究所研究员,复杂系统管理与控制国家重点实验室副主任,中国科学院大学岗位教授,青岛智能产业技术研究院智能技术创新中心主任,主要研究方向为自学习控制、平行控制、自适应动态规划、智能控制、最优控制及其工业应用

Reinforcement learning:toward action-knowledge merged intelligent mechanisms and algorithms

Fei-Yue WANG1,2,3,Dongpu CAO4,Qinglai WEI1,2,3   

  1. 1 The State Key Laboratory for Management and Control of Complex Systems,Institute of Automation,Chinese Academy of Sciences,Beijing 100190,China
    2 University of Chinese Academy of Sciences,Beijing 100049,China
    3 Qingdao Academy of Intelligent Industries,Qingdao 266109,China
    4 University of Waterloo,Waterloo N2L 3G1,Canada
  • Revised:2020-05-20 Online:2020-06-20 Published:2020-07-14

摘要:

简要地评论了强化学习的历史、现状与未来的发展途径,认为强化学习应从先行后知、先知后行向知行合一的平行强化学习迈进,实现在虚拟世界“吃一堑”,在物理世界“长一智”,真正成为智慧机制和智能算法的基础学习理论。

关键词: 强化学习, 动态规划, 深度学习, 平行学习, 人工智能, 平行智能

Abstract:

This article discusses briefly the history,the state of the art and the future of reinforcement learning,and outlines a roadmap of evolution from learning by doing,doing with planning to parallel intelligence that combining learning virtually in artificial systems and acting accordingly in actual systems.

Key words: reinforcement learning, dynamic programming, deep learning, parallel learning, artificial intelligence

中图分类号: 

No Suggested Reading articles found!