电信科学 ›› 2020, Vol. 36 ›› Issue (5): 25-30.doi: 10.11959/j.issn.1000-0801.2020145

• 专题:网络安全的智能化和高对抗性发展 • 上一篇    下一篇

利用深度学习融合模型提升文本内容安全的研究

汪少敏1,2,王铮1,2,任华1,2   

  1. 1 移动互联网系统与应用安全国家工程实验室,上海 201315
    2 中国电信股份有限公司研究院,上海 200122
  • 修回日期:2020-04-22 出版日期:2020-05-20 发布日期:2020-05-18
  • 作者简介:汪少敏(1983- ),女,移动互联网系统与应用安全国家工程实验室、中国电信股份有限公司研究院高级工程师,主要研究方向为内容安全识别技术、人工智能技术和自然语言处理|王铮(1973- ),男,移动互联网系统与应用安全国家工程实验室、中国电信股份有限公司研究院高级工程师,主要研究方向为信息安全、人工智能技术、大数据架构和数据挖掘分析|任华(1977- ),女,移动互联网系统与应用安全国家工程实验室、中国电信股份有限公司研究院高级工程师,主要研究方向为内容信息安全、数据分析和人工智能技术

Research on fusion model based on deep learning for text content security enhancement

Shaomin WANG1,2,Zheng WANG1,2,Hua REN1,2   

  1. 1 Mobile Internet System and Application Security National Engineering Laboratory,Shanghai 201315,China
    2 Research Institute of China Telecom Co.,Ltd.,Shanghai 200122,China
  • Revised:2020-04-22 Online:2020-05-20 Published:2020-05-18

摘要:

互联网和移动互联网中的信息内容急速膨胀,导致其中充斥着违法违规和不良信息,影响互联网空间的内容安全。基于敏感词匹配的传统文本内容安全识别方法忽略上下文语义,导致误报率高、准确率低。在分析传统文本内容安全识别方法的基础上,提出了利用深度学习的融合识别模型以及模型融合算法流程。深入介绍了基于利用深度学习的融合识别模型的文本内容安全识别系统,并进行了实验验证。结果表明,所提模型可以有效解决传统识别方法缺乏语义理解造成误报率高的问题,提高了不良信息检测的准确性。

关键词: 内容安全, 违法违规和不良信息, 深度学习, 文本识别

Abstract:

The rapid expansion of information content on the internet and the mobile internet has resulted in violations of laws and regulations and bad information,which affects the content security of the internet space.Traditional text content security recognition methods based on matching of sensitive words ignore context semantics,resulting in high false positive rate and low accuracy.Based on the analysis of traditional text content security recognition methods,a fusion recognition model using deep learning and a model fusion algorithm process were proposed.Text content security recognition system based on the fusion recognition model using deep learning and experimental verification was introducted deeply.Results show that the proposed model can effectively solve the problem of high false positive rate caused by the lack of semantic understanding of traditional recognition methods,and improve the accuracy of the bad information detection.

Key words: content security, illegal information and unhealthy information, deep learning, text recognition

中图分类号: 

No Suggested Reading articles found!