智能科学与技术学报 ›› 2021, Vol. 3 ›› Issue (4): 444-448.doi: 10.11959/j.issn.2096-6652.202143

• 专栏:基于数据的学习与优化 • 上一篇    下一篇

未知异构多智能体系统无模型自适应动态规划同步控制

夏丽娜1, 李擎1, 宋睿卓1, 王子涵1, 许镇2   

  1. 1 北京科技大学自动化学院,北京 100083
    2 北京科技大学城镇化与城市安全研究院,北京 100083
  • 修回日期:2021-11-09 出版日期:2021-12-15 发布日期:2021-12-01
  • 作者简介:夏丽娜(1993- ),女,北京科技大学自动化学院博士生,主要研究方向为多智能体同步、事件驱动控制、自适应动态规划
    李擎(1971- ),男,博士,北京科技大学自动化学院教授、博士生导师,主要研究方向为群智能优化算法及其应用、多智能体同步
    宋睿卓(1982- ),女,博士,北京科技大学自动化学院教授、博士生导师。主要从事基于数据的智能计算、复杂系统最优决策与控制等方面的研究工作,并将成果应用于人体信号测控、目标定位与识别等领域。共发表论文85篇,其中SCI论文44篇。第一作者ESI高被引论文3篇。出版学术专著3部,其中英文专著2部。共主持科研项目20项,包括国家自然科学基金项目、北京市自然科学基金项目、横向课题等。发表论文在Google Scholar数据库中总被引1 386次,H指数19。获得2017年中国自动化学会自然科学奖一等奖
    王子涵(2000- ),男,北京科技大学自动化学院在读,主要研究方向为自适应动态规划
    许镇(1986- ),北京科技大学城镇化与城市安全研究院教授、博士生导师,主要研究方向为城市综合数字防灾的交叉
  • 基金资助:
    国家自然科学基金资助项目(61873300);国家自然科学基金资助项目(61722312);中央高校基本科研业务费专项资金项目(FRF-MP-20-11);中央高校基本科研业务费专项资金项目(FRF-IDRY-20-030)

Synchronization control of unknown heterogeneous multi-agent system via model-free adaptive dynamic programming

Lina XIA1, Qing LI1, Ruizhuo SONG1, Zihan WANG1, Zhen XU2   

  1. 1 School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing 100083, China
    2 Research Institute of Urbanization and Urban Safety, University of Science and Technology Beijing, Beijing 100083, China
  • Revised:2021-11-09 Online:2021-12-15 Published:2021-12-01
  • Supported by:
    The National Natural Science Foundation of China(61873300);The National Natural Science Foundation of China(61722312);The Fundamental Research Funds for the Central Universities(FRF-MP-20-11);The Fundamental Research Funds for the Central Universities(FRF-IDRY-20-030)

摘要:

多智能体协同在众多领域逐渐得到应用,但是还有很多仍未解决的问题。为此,研究了基于无模型自适应动态规划(MFADP)的未知异构多智能体系统同步控制问题,其中领航者智能体和追随者智能体动态模型均是未知的。首先为每一个追随者智能体设计观测器来估计领航者智能体的信息,包括领航者智能体状态以及领航者智能体系统动态矩阵。然后利用追随者智能体动态模型信息和观测器动态模型信息构建增广系统,运用贝尔曼最优性原理求得最优控制器以及对应的代数黎卡提方程。在追随者智能体系统动态模型信息未知的情况下,引出了MFADP算法。最后使用双质量-弹簧系统来验证所提算法的有效性。

关键词: 多智能体系统, 代数黎卡提方程, 基于无模型自适应动态规划

Abstract:

Synchronization of multi-agent system has been gradually applied in the most fields, but there are still many unsolved problems.The synchronization control of unknown heterogeneous multi-agent system based on model-free adaptive dynamic programming (MFADP) algorithm was studied.Firstly, an observer was designed for each follower to estimate the information of the leader, including the state and the system dynamic matrix of the leader.Then, the optimal controller was obtained by exploiting the Bellman optimality principle.Under the condition that the dynamics of the follower was unknown, a MFADP algorithm was proposed.Finally, two-mass-spring systems were used to verify the effectiveness of the algorithm.

Key words: multi-agent system, algebraic Riccati equation, model-free adaptive dynamic programming

中图分类号: 

No Suggested Reading articles found!