智能科学与技术学报 ›› 2019, Vol. 1 ›› Issue (3): 219-227.doi: 10.11959/j.issn.2096-6652.201935

• 综述 • 上一篇    下一篇

基于统计前向规划算法的游戏通用人工智能

LUCAS Simon1,沈甜雨2,3,王晓2,4(),张杰2,4   

  1. 1 伦敦玛丽女王大学,英国 伦敦 E1 4NS
    2 中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京 100190
    3 中国科学院大学人工智能学院,北京100049
    4 青岛智能产业技术研究院,山东 青岛 266109
  • 修回日期:2019-08-16 出版日期:2019-09-20 发布日期:2019-12-17
  • 作者简介:LUCAS Simon(1972- ),男,博士,伦敦玛丽女王大学教授,主要研究方向为基于计算智能技术的游戏AI、基于AI的游戏设计、通用人工智能。|沈甜雨(1996- ),女,湖北天门人,中国科学院自动化研究所复杂系统管理与控制国家重点实验室博士生,主要研究方向为机器学习、深度学习和计算机视觉。|王晓(1988- ),女,博士,山东滨州人,中国科学院自动化研究所复杂系统管理与控制国家重点实验室副研究员,主要研究方向为社会交通、动态网群组织、人工智能和社交网络分析。|张杰(1982- ),男,博士,中国科学院自动化研究所复架系统管理与控制国家重点实验室副研究员,主要研究方向为最优控制、博弈论与平行控制。
  • 基金资助:
    中国科协青年人才托举工程基金资助项目(2017QNRC001);国家自然科学基金资助项目(61702519);国家自然科学基金资助项目(71402178)

General game AI with statistical forward planning algorithms

LUCAS Simon1,Tianyu SHEN2,3,Xiao WANG2,4(),Jie ZHANG2,4   

  1. 1 Queen Mary University of London,London E1 4NS,UK
    2 The State Key Laboratory of Management and Control for Complex Systems,Institute of Automation,Chinese Academy of Sciences,Beijing 100190,China
    3 School of Artificial Intelligence,University of Chinese Academy of Sciences,Beijing 100049,China
    4 Qingdao Academy of Intelligent Industries,Qingdao 266109,China
  • Revised:2019-08-16 Online:2019-09-20 Published:2019-12-17
  • Supported by:
    The Young Elite Scientists Sponsorship Program of China Association of Science and Technology(2017QNRC001);The National Natural Science Foundation of China(61702519);The National Natural Science Foundation of China(71402178)

摘要:

统计前向规划(statistical forward planning,SFP)算法使用仿真模型(也称为前向模型)自适应地搜索有效的动作序列,此类算法提供了一种简单通用的方法,为各种游戏提供快速自适应的 AI 控制。介绍了两种常用的 SFP 算法:蒙特x卡罗树搜索和滚动层进化,并证明了在没有任何事先训练的情况下,SPF 算法就可以在各种视频游戏中出色地运行。

关键词: 统计前向规划, 游戏智能, 滚动层进化

Abstract:

Statistical forward planning (SFP) algorithms use a simulation model (also called forward model) to adaptively search for effective sequences of actions.They offer a simple and general way to provide rapidly adaptive AI controllers for a variety of games.The two powerful SFP example algorithms:Monte Carlo tree search and rolling horizon evolution were introduced in this paper and key insights into their working principles were provided.It is demonstrated that the algorithms are able to play a variety of video games surprisingly well without the need for any prior training.

Key words: statistical forward planning, game AI, rolling horizon evolution

中图分类号: 

No Suggested Reading articles found!