通信学报 ›› 2021, Vol. 42 ›› Issue (6): 41-51.doi: 10.11959/j.issn.1000-436x.2021093

• 学术论文 • 上一篇    下一篇

基于深度确定性策略梯度的随机路由防御方法

徐潇雨1,2, 胡浩1,2, 张红旗1,2, 刘玉岭3   

  1. 1 信息工程大学密码工程学院,河南 郑州 450001
    2 河南省信息安全重点实验室,河南 郑州 450001
    3 中国科学院信息工程研究所,北京 100190
  • 修回日期:2021-03-31 出版日期:2021-06-25 发布日期:2021-06-01
  • 作者简介:徐潇雨(1992− ),男,江苏连云港人,信息工程大学博士生,主要研究方向为主动防御和智能决策
    胡浩(1989− ),男,安徽池州人,博士,信息工程大学讲师,主要研究方向为网络安全态势感知
    张红旗(1962− ),男,河北遵化人,博士,信息工程大学教授、博士生导师,主要研究方向为网络安全、风险评估、等级保护和信息安全管理等
    刘玉岭(1982− ),男,山东济阳人,博士,中国科学院信息工程研究所副教授,主要研究方向为网络安全测评和等级保护
  • 基金资助:
    国家自然科学基金资助项目(61902427);国家自然科学基金资助项目(61802404)

Random routing defense method based on deep deterministic policy gradient

Xiaoyu XU1,2, Hao HU1,2, Hongqi ZHANG1,2, Yuling LIU3   

  1. 1 Cryptography Engineering Institute, Information Engineering University, Zhengzhou 450001, China
    2 Henan Key Laboratory of Information Security, Zhengzhou 450001, China
    3 Institute of Information Engineering, Chinese Academy of Sciences, Beijing 100190, China
  • Revised:2021-03-31 Online:2021-06-25 Published:2021-06-01
  • Supported by:
    The National Natural Science Foundation of China(61902427);The National Natural Science Foundation of China(61802404)

摘要:

针对现有随机路由防御方法对数据流拆分粒度过粗、对合法的服务质量(QoS)保障效果不佳、对抗窃听攻击的安全性有待提升等问题,提出一种基于深度确定性策略梯度(DDPG)的随机路由防御方法。通过带内网络遥测(INT)技术实时监测并获取网络状态;通过DDPG方法生成兼顾安全性和QoS需求的随机路由方案;通过 P4 框架下的可编程交换机执行随机路由方案,实现了数据包级粒度的随机路由防御。实验表明,与其他典型的随机路由方法相比,所提方法在对抗窃听攻击中的安全性和对网络整体QoS的保障效果均有提升。

关键词: 随机路由, 深度确定性策略梯度, 窃听攻击, 移动目标防御

Abstract:

To solve the problem of the existing routing shuffling defenses, such as too coarse data flow splitting granularity, poor protection effect on legitimate QoS and the security against eavesdropping attacks needed to be improved, a random routing defense method based on DDPG was proposed.INT was used to monitor and obtain the network state in real time, DDPG algorithm was used to generate random routing scheme considering both security and QoS requirements, random routing scheme was implemented with programmable switch under P4 framework to realize real-time routing shuffling with packet level granularity.Experiment results show that compared with other typical routing shuffling defense methods, the security and QoS protection effect of the proposed method are improved.

Key words: random routing, deep deterministic policy gradient, eavesdropping attack, moving target defense

中图分类号: 

No Suggested Reading articles found!