通信学报 ›› 2019, Vol. 40 ›› Issue (2): 11-18.doi: 10.11959/j.issn.1000-436x.2019002

• 专题:5G与AI • 上一篇    下一篇

基于深度强化学习的蜂窝网资源分配算法

廖晓闽1,2,严少虎3(),石嘉1,谭震宇1,赵钟灵1,李赞1   

  1. 1 西安电子科技大学综合业务网理论及关键技术国家重点实验室,陕西 西安 710071
    2 国防科技大学信息通信学院,陕西 西安 710106
    3 中国电子科技集团公司第二十九研究所,四川 成都 610036
  • 修回日期:2019-02-15 出版日期:2019-02-01 发布日期:2019-03-04
  • 作者简介:廖晓闽(1984- ),女,江西德兴人,西安电子科技大学博士生,国防科技大学信息通信学院副教授,主要研究方向为频谱管控、隐蔽通信。|严少虎(1976- ),男,四川绵竹人,博士,中国电子科技集团公司第二十九研究所高级工程师,主要研究方向为频谱管控、体系集成。|石嘉(1987- ),男,陕西西安人,博士,西安电子科技大学副教授,主要研究方向为无线系统资源分配、毫米波通信、隐蔽通信等。|谭震宇(1987- ),男,广西玉林人,西安电子科技大学博士生,主要研究方向为无线频谱管理。|赵钟灵(1995- ),男,河北张家口人,西安电子科技大学博士生,主要研究方向为频谱资源管理。|李赞(1975- ),女,陕西西安人,西安电子科技大学教授、博士生导师,主要研究方向为隐蔽通信、频谱管控。
  • 基金资助:
    国家自然科学基金重点资助项目(61631015)

Deep reinforcement learning based resource allocation algorithm in cellular networks

Xiaomin LIAO1,2,Shaohu YAN3(),Jia SHI1,Zhenyu TAN1,Zhongling ZHAO1,Zan LI1   

  1. 1 State Key Laboratory of Integrated Services Networks,Xidian University,Xi’an 710071,China
    2 School of Information and Communications,National University of Defense Technology,Xi’an 710106,China
    3 The 29th Research Institute of China Electronics Technology Group Corporation,Chengdu 610036,China
  • Revised:2019-02-15 Online:2019-02-01 Published:2019-03-04
  • Supported by:
    The Key Project of National Natural Science Foundation of China(61631015)

摘要:

针对蜂窝网资源分配多目标优化问题,提出了一种基于深度强化学习的蜂窝网资源分配算法。首先构建深度神经网络(DNN),优化蜂窝系统的传输速率,完成算法的前向传输过程;然后将能量效率作为奖惩值,采用Q-learning机制来构建误差函数,利用梯度下降法来训练DNN的权值,完成算法的反向训练过程。仿真结果表明,所提出的算法可以自主设置资源分配方案的偏重程度,收敛速度快,在传输速率和系统能耗的优化方面明显优于其他算法。

关键词: 蜂窝网, 资源分配, 深度强化学习, 神经网络

Abstract:

In order to solve multi-objective optimization problem,a resource allocation algorithm based on deep reinforcement learning in cellular networks was proposed.Firstly,deep neural network (DNN) was built to optimize the transmission rate of cellular system and to complete the forward transmission process of the algorithm.Then,the Q-learning mechanism was utilized to construct the error function,which used energy efficiency as the rewards.The gradient descent method was used to train the weights of DNN,and the reverse training process of the algorithm was completed.The simulation results show that the proposed algorithm can determine optimization extent of optimal resource allocation scheme with rapid convergence ability,it is obviously superior to the other algorithms in terms of transmission rate and system energy consumption optimization.

Key words: cellular networks, resource allocation, deep reinforcement learning, neural network

中图分类号: 

No Suggested Reading articles found!