通信学报 ›› 2018, Vol. 39 ›› Issue (1): 90-100.doi: 10.11959/j.issn.1000-436x.2018002

• 学术论文 • 上一篇    下一篇

基于强化学习的服务链映射算法

魏亮,黄韬,张娇,王泽南,刘江,刘韵洁   

  1. 北京邮电大学网络与交换技术国家重点实验室,北京 100876
  • 修回日期:2017-11-29 出版日期:2018-01-01 发布日期:2018-02-07
  • 作者简介:魏亮(1981-),男,江苏扬州人,北京邮电大学博士生,主要研究方向为未来网络、软件定义网络、网络功能虚拟化等。|黄韬(1980-),男,重庆人,博士,北京邮电大学教授,主要研究方向为路由与交换、软件定义网络、内容分发网络等。|张娇(1986-),女,河北保定人,北京邮电大学副教授,主要研究方向为数据中心网络、网络功能虚拟化、软件定义网络、未来网络体系架构等。|王泽南(1994-),男,浙江湖州人,北京邮电大学博士生,主要研究方向为网络功能虚拟化、网络智能等。|刘江(1983-),男,河南郑州人,博士,北京邮电大学副教授,主要研究方向为网络体系架构、网络虚拟化、软件定义网络、信息中心网络等。|刘韵洁(1943-),男,山东烟台人,中国工程院院士,北京邮电大学教授,主要研究方向为未来网络技术、网络体系架构、网络融合与演进等。
  • 基金资助:
    国家高技术研究发展计划(“863”计划)基金资助项目(2015AA016101);国家自然科学基金资助项目(61501042);北京科技新星基金资助项目(Z151100000315078)

Service chain mapping algorithm based on reinforcement learning

Liang WEI,Tao HUANG,Jiao ZHANG,Zenan WANG,Jiang LIU,Yunjie LIU   

  1. State Key Laboratory of Networking and Switching Technology,Beijing University of Posts and Telecommunications,Beijing 100876,China
  • Revised:2017-11-29 Online:2018-01-01 Published:2018-02-07
  • Supported by:
    The National High Technology Research and Development Program of China (863 Program)(2015AA016101);The National Natural Science Foundation of China(61501042);Beijing New-Star Plan of Science and Technology(Z151100000315078)

摘要:

提出基于人工智能技术的多智能体服务链资源调度架构,设计一种基于强化学习的服务链映射算法。通过Q-learning的机制,根据系统状态、执行部署动作后的奖惩反馈来决定服务链中各虚拟网元的部署位置。实验结果表明,与经典算法相比,该算法有效降低了业务的平均传输延时,提升了系统的负载均衡情况。

关键词: 网络功能虚拟化, 人工智能, 服务链, 强化学习

Abstract:

A service chain resource scheduling architecture of multi-agent based on artificial intelligence technology was proposed.Meanwhile,a service chain mapping algorithm based on reinforcement learning was designed.Through the Q-learning mechanism,the location of each virtual network element in the service chain was determined according to the system status and the reward and punishment feedback after the deployment.The experimental results show that compared with the classical algorithms,the algorithm effectively reduces the average transmission delay of the service and improves the load balance of the system.

Key words: network function virtualization, artificial intelligence, service chain, reinforcement learning

中图分类号: 

No Suggested Reading articles found!