物联网学报 ›› 2022, Vol. 6 ›› Issue (4): 104-116.doi: 10.11959/j.issn.2096-3750.2022.00293

• 理论与技术 • 上一篇    下一篇

基于多智能体深度强化学习的多域协同抗干扰方法研究

张彪1, 汪西明2, 徐逸凡1, 李文1, 韩昊1, 刘松仪1, 陈学强1   

  1. 1 陆军工程大学通信工程学院,江苏 南京 210007
    2 国防科技大学信息通信学院,湖北 武汉 430010
  • 修回日期:2022-08-22 出版日期:2022-12-30 发布日期:2022-12-01
  • 作者简介:张彪(1999- ),男,陆军工程大学通信工程学院硕士生,主要研究方向为智能通信抗干扰和强化学习
    汪西明(1993- ),男,博士,国防科技大学信息通信学院讲师,主要研究方向为智能通信抗干扰、无线资源优化、多智能体决策理论等
    徐逸凡(1995- ),男,博士,陆军工程大学通信工程学院讲师,主要研究方向为无线通信和智能通信抗干扰等
    李文(1996- ),男,陆军工程大学通信工程学院博士生,主要研究方向为智能抗干扰通信、强化学习、博弈论和动态频谱接入等
    韩昊(1996- ),男,陆军工程大学通信工程学院博士生,主要研究方向为智能频谱对抗、智能通信抗干扰、博弈论、机器学习等
    刘松仪(1995- ),男,陆军工程大学通信工程学院博士生,主要研究方向为机器学习、智能抗干扰通信、无线通信资源优化等
    陈学强(1985- ),男,博士,陆军工程大学通信工程学院副教授,主要研究方向为认知无线电、无线频谱资源优化等
  • 基金资助:
    国家自然科学基金资助项目(62071488);国家自然科学基金资助项目(61961010)

Multi-domain collaborative anti-jamming based on multi-agent deep reinforcement learning

Biao ZHANG1, Ximing WANG2, Yifan XU1, Wen LI1, Hao HAN1, Songyi LIU1, Xueqiang CHEN1   

  1. 1 College of Communications Engineering, Army Engineering University of PLA, Nanjing 210007, China
    2 College of Information and Communication, National University of Defense Technology, Wuhan 430010, China
  • Revised:2022-08-22 Online:2022-12-30 Published:2022-12-01
  • Supported by:
    The National Natural Science Foundation of China(62071488);The National Natural Science Foundation of China(61961010)

摘要:

动态的传输需求和有限的缓存空间给恶意干扰环境下的无线数据传输带来巨大挑战。针对上述问题,从频域和时域的角度出发,研究了面向分布式物联网的协同抗干扰信道选择和数据调度联合决策方法,构建了基于多用户马尔可夫决策过程的数据传输模型,提出了基于多智能体深度强化学习的协同抗干扰信道和数据联合决策算法。仿真表明,所提算法可有效避开恶意干扰并避免同频互扰。相较于对比算法,网络吞吐量显著提高,丢包数量明显降低。

关键词: 协同抗干扰, 信道选择, 数据调度, 多智能体强化学习, 深度学习

Abstract:

Dynamic transmission requirements and the limited cache space bring great challenges to wireless data transmission in the malicious jamming environment.Aiming at the above problems, a collaborative anti-jamming channel selection and data scheduling joint decision method for distributed internet of things was studied from the perspective of frequency domain and time domain.A data transmission model based on multi-user Markov decision process was constructed and a collaborativeanti-jamming joint-channel-and-data decision algorithm based on multi-agent deep reinforcement learning was proposed.Simulation results show that the proposed algorithm can effectively avoid the malicious jamming and the co-channel interference.Compared with the comparison algorithm, the network throughput is significantly improved, and the number of packet dropout is significantly reduced.

Key words: collaborative anti-jamming, channel selection, data scheduling, multi-agent reinforcement learning, deep learning

中图分类号: 

No Suggested Reading articles found!