通信学报 ›› 2019, Vol. 40 ›› Issue (2): 118-128.doi: 10.11959/j.issn.1000-436x.2019028

• 学术论文 • 上一篇    下一篇

基于混合特征的恶意PDF文档检测

杜学绘,林杨东(),孙奕   

  1. 解放军战略支援部队信息工程大学河南省信息安全重点实验室,河南 郑州 450001
  • 修回日期:2018-05-11 出版日期:2019-02-01 发布日期:2019-03-04
  • 作者简介:杜学绘(1968- ),女,河南辉县人,解放军战略支援部队信息工程大学教授、博士生导师,主要研究方向为云计算、网络与信息安全、数据安全交换等。|林杨东(1992- ),男,广东汕头人,解放军战略支援部队信息工程大学硕士生,主要研究方向为网络与信息安全、数据安全。|孙奕(1979- ),女,河南郑州人,博士,解放军战略支援部队信息工程大学副教授,主要研究方向为网络与信息安全、数据安全交换等。
  • 基金资助:
    国家高技术研究发展计划(“863”计划)基金资助项目(2015AA016006);国家自然科学基金资助项目(61702550)

Malicious PDF document detection based on mixed feature

Xuehui DU,Yangdong LIN(),Yi SUN   

  1. Henan Provincial Key Laboratory of Information Security,Information Engineering University,Zhengzhou 450001,China
  • Revised:2018-05-11 Online:2019-02-01 Published:2019-03-04
  • Supported by:
    The National High Technology Research and Development Program of China(2015AA016006);The National Natural Science Foundation of China(61702550)

摘要:

针对现有恶意PDF文档在检测方案存在特征顽健性差、易被逃避检测等问题,提出了一种基于混合特征的恶意PDF文档检测方法,采用动静态混合分析技术从文档中提取出其常规信息、结构信息以及API调用信息,并基于K-means算法设计了特征提取方法,聚合出表征文档安全性的核心混合特征,从而提高了特征的顽健性。在此基础上,利用随机森林算法构建分类器并设计实验,对所提方案的检测性能以及抵抗模拟攻击的能力进行了探讨。

关键词: 恶意PDF文档, 混合特征, 机器学习, 检测

Abstract:

Aiming at the problem of poor robustness and easy to evade detection in the detection of malicious PDF document,a malicious PDF document detection method based on mixed features was proposed.It adopted dynamic and static analysis technology to extract the regular information,structure information and API calling information from the document,and then a feature extraction method based on K-means clustering algorithm was designed to filter and select the key mixed features that characterize the document security.Ultimately,it improved the robustness of features.On this basis,it used random forest algorithm to construct classifier and perform experiment to discuss the detection performance of the scheme and its ability to resist mimicry attacks.

Key words: malicious PDF document, mixed feature, machine learning, detection

中图分类号: 

No Suggested Reading articles found!