通信学报 ›› 2017, Vol. 38 ›› Issue (8): 172-182.doi: 10.11959/j.issn.1000-436x.2017173

• 学术通信 • 上一篇    下一篇

基于Q-learning算法的vEPC虚拟网络功能部署方法

袁泉1,2,汤红波1,2(),黄开枝1,王晓雷1,2,赵宇1,2   

  1. 1 国家数字交换系统工程技术研究中心,河南 郑州 450002
    2 移动互联网安全技术国家工程实验室,北京 100876
  • 修回日期:2017-07-15 出版日期:2017-08-01 发布日期:2017-09-07
  • 作者简介:袁泉(1991-),男,山东青岛人,国家数字交换系统工程技术研究中心硕士生,主要研究方向为移动通信网络、网络功能虚拟化。|汤红波(1968-),男,湖北孝感人,国家数字交换系统工程技术研究中心博士生导师,主要研究方向为移动通信网络、新型网络体系结构。|黄开枝(1973-),女,安徽滁州人,博士,国家数字交换系统工程技术研究中心博士生导师,主要研究方向为无线移动通信、无线物理层安全。|王晓雷(1982-),田,山东淄博人,国家数字交换系统工程技术研究中心讲师,主要研究方向为移动通信网络、新型网络体系结构等。|赵宇(1984-),男,吉林辽源人,国家数字交换系统工程技术研究中心讲师,主要研究方向为移动通信网络、新型网络体系结构等。
  • 基金资助:
    国家高技术研究发展计划(“863”计划)基金资助项目(2015AA01A706);国家自然科学基金资助项目(61521003);科技部支撑计划基金资助项目(2014BAH30B01)

Deployment method for vEPC virtualized network function via Q-learning

Quan YUAN1,2,Hong-bo TANG1,2(),Kai-zhi HUANG1,Xiao-lei WANG1,2,Yu ZHAO1,2   

  1. 1 National Digital Switching System Engineering and Technological R&D Center,Zhengzhou 450002,China
    2 National Engineering Laboratory for Mobile Network Security,Beijing 100876,China
  • Revised:2017-07-15 Online:2017-08-01 Published:2017-09-07
  • Supported by:
    The Nationa1 High Techno1ogy Research and Deve1opment Program of China(863 Program)(2015AA01A706);The Nationa1 Natura1 Science Foundation of China(61521003);Ministry of Science and Techno1ogy Support P1an(2014BAH30B01)

摘要:

针对虚拟化演进分组核心网(vEPC)环境下,现有虚拟网络功能(VNF)部署方法无法在优化时延的同时保证服务链部署收益的问题,提出一种改进的基于Q-1earning算法的vEPC虚拟网络功能部署方法。在传统0-1规划模型的基础上,采用马尔可夫决策过程建立了 vEPC 服务链部署的空间—时间优化模型,并设计了改进的Q-1earning算法求解。该方法同时考虑了空间维度下的EPC服务链虚拟映射和时间维度下的VNF生命周期管理,实现了VNF部署的收益—时延多目标优化。仿真结果表明,与其他VNF部署方法相比,该方法在降低网络时延的同时提高了VNF部署的收益和请求接受率。

关键词: 5G, 虚拟网络功能, 服务功能链部署, Q-1earning

Abstract:

In the context of vEPC,a method of virtua1ized network function(VNF)dep1oyment via an improved Q-1earning a1gorithm was proposed to so1ve the prob1em that the existing methods cannot achieve the optimization of time de1ay and revenue of VNF dep1oyment simu1taneous1y.To get the optima1 dep1oyment po1icy in both space dimension and time dimension,a Markov decision process mode1 of vEPC service function chain dep1oyment on the basis of the traditiona1 0-1 programming mode1 was estab1ished and a so1ution with an improved Q-1earning a1gorithm was proposed.The method had taken fu11 consideration of both virtua1 network embedding in space dimension and orchestration of VNF 1ife cyc1e in time dimension,and thus,the mu1ti-objective optimization of revenue and de1ay cou1d be attained.Simu1ation shows that the method can reduce network de1ay whi1e increasing the revenue and the ratio of request acceptance compared with other dep1oyment methods.

Key words: 5G, VNF, service function chain dep1oyment, Q-1earning

中图分类号: 

[1] 曹张华,唐元生. 基于网络编码保密通信[J]. 通信学报, 2010, 31(8A): 34 -194 .
[2] 高翔,祝跃飞,刘胜利,费金龙,刘龙. 基于模糊Petri网的网络风险评估模型[J]. 通信学报, 2013, 34(Z1): 16 -132 .
[3] 杨智丹,刘克胜,陈 宇,陈建熊. 抗统计分析的ISN随机增量协议隐写算法[J]. 通信学报, 2008, 29(11A): 7 -40 .
[4] 陶承怡,马小梅. 基于信息价值链的电信运营商大数据策略研究[J]. 电信科学, 2014, 30(6): 126 -130 .
[5] 张 旻,吴春明,王 滨,姜 明. 跨域逻辑承载网映射方法研究[J]. 通信学报, 2012, 33(8): 24 -207 .
[6] 王成巍,沈成彬,蒋铭. PON系统承载TDM技术研究[J]. 电信科学, 2010, 26(8): 14 -18 .
[7] 许 华,郑 辉. 对高阶QAM信号盲载波相位捕获算法的一种改进方法[J]. 通信学报, 2005, 26(8): 10 -66 .
[8] 陈文宇,曾 茹,皮 维,李 文. 基于RapidIO的GIOP协议——RIO-IOP[J]. 通信学报, 2012, 33(Z1): 10 -78 .
[9] 陆 阳,李继国. 标准模型下前向安全公钥加密方案的新构造[J]. 通信学报, 2014, 35(2): 5 -39 .
[10] 聂仁灿,周冬明,赵东风,谭颖芳. 竞争型脉冲耦合神经网络及用于多约束QoS路由求解[J]. 通信学报, 2010, 31(1): 7 -72 .