电信科学 ›› 2017, Vol. 33 ›› Issue (3): 119-125.doi: 10.11959/j.issn.1000-0801.2017059

• 运营技术广角 • 上一篇    下一篇

一种基于保形加密的大数据脱敏系统实现及评估

卞超轶1,2,朱少敏1,周涛1   

  1. 1 北京启明星辰信息安全技术有限公司,北京100193
    2 北京邮电大学,北京100876
  • 修回日期:2017-02-24 出版日期:2017-03-01 发布日期:2017-04-05
  • 作者简介:卞超轶(1987-),男,北京启明星辰信息安全技术有限公司高级研究员,启明星辰博士后工作站——北京邮电大学博士后流动站联合培养博士后,主要研究方向为大数据自身安全、大数据安全分析等。|朱少敏(1983-),男,北京启明星辰信息安全技术有限公司前线技术专家团成员,主要研究方向为电力系统信息安全、多媒体信息处理等。|周涛(1979-),男,博士,北京启明星辰信息安全技术有限公司教授级高级工程师,主要研究方向为大数据安全分析、事件关联分析、入侵检测等。

Implementation and evaluation of big data desensitization system based on format-preserving encryption

Chaoyi BIAN1,2,Shaomin ZHU1,Tao ZHOU1   

  1. 1 Beijing Venus Information Security Technology Incorporated Company, Beijing 100193, China
    2 Beijing University of Posts and Telecommunications, Beijing 100876, China
  • Revised:2017-02-24 Online:2017-03-01 Published:2017-04-05

摘要:

数据脱敏,是指对数据中包含的一些涉及机密或隐私的敏感信息进行特殊处理,以达到保护私密及隐私信息不被恶意攻击者非法获取的目的。保形加密是众多数据脱敏技术的一种,但其具有保持原始数据格式不变的重要优势,从而在一定程度上对上层应用透明。随着大数据时代的到来以及Hadoop平台的广泛应用,传统的基于关系型数据库的数据脱敏技术已不能满足实际的生产需要。针对Hadoop大数据平台实现了一种基于保形加密的数据脱敏系统,支持对多种数据存储格式以及纯数字、纯字母或数字—字母混合等多种数据类型敏感数据的加密脱敏处理。然后对3种不同的实现方式进行了探讨,并开展了一系列实验对系统的加密脱敏性能进行详细的评估比较。

关键词: 大数据, 数据脱敏, 保形加密, 系统, 评估

Abstract:

Data desensitization is a process that makes some special transformations on sensitive data in order to protect the secrecy and privacy from being acquired by malicious attackers.Format-preserving encryption is one of the techniques of data desensitization, which has the advantage of keeping data format unchanged so that the upper layer applications are not affected.Along with the coming of big data and the wide application of the Hadoop platform, data desensitization techniques for traditional relational database management systems cannot satisfy the need of production. A data desensitization system based on format-preserving encryption for Hadoop platform was implemented, which provided the encryption support for multiple data storage formats and data value types. Moreover, three different sorts of implementations were discussed, and a series of experiments were carried out to evaluate the performance.

Key words: big data, data desensitization, format-preserving encryption, system, evaluation

中图分类号: 

No Suggested Reading articles found!