大数据

• •    

隐私计算场景下数据质量治理探索与实践

张燕,杨一帆,伊人,罗圣美,唐剑飞,夏正勋   

  1. 星环信息科技(上海)股份有限公司,上海 200233
  • 作者简介:张燕(1985- ),女,星环信息科技(上海)股份有限公司人工智能研究员,主要研究方向为隐私计算、可解释AI、因果分析等。 杨一帆(1985- ),男,博士,星环信息科技(上海)有限公司产品总监、首席科学家,主要研究方向为统计(统计计算、生存分析、时间序列和生物信息)、机器学习中图计算、强化学习等。 伊人(1989- ),女,博士,星环信息科技(上海)有限公司隐私计算首席科学家,主要研究方向为隐私计算、联邦学习、知识图谱等。 罗圣美(1971- ),男,博士,星环信息科技(上海)股份有限公司大数据研究院院长,主要研究方向为大数据、并行计算、云存储、人工智能等。 唐剑飞(1986- ),男,星环信息科技(上海)股份有限公司大数据技术标准研究员,主要研究方向为大数据、数据库、图计算等。 夏正勋(1979- ),男,星环信息科技(上海)股份有限公司高级研究员,主要研究方向为人工智能、大数据、数据库、流媒体处理技术等。

Exploration and practice of data quality governance in privacy computing scenarios

ZHANG Yan, YANG Yifan, YI Ren, LUO shengmei, TANG Jianfei, XIA Zhengxun   

  1. Transwarp Information Technology (Shanghai) Co., Ltd., shanghai 200233, China

摘要: 隐私计算是一种新型的数据处理技术,可以在保护数据隐私及安全的前提下,实现数据价值转化和流通。然而隐私计算场景中数据可用不可见的特性,对传统的数据质量治理工作形成了很大的挑战。针对上述问题,业界尚缺乏完善的解决方案,本文提出了一种适用于隐私计算场景的数据质量治理方法与流程,能够兼顾本地域及联邦域的数据质量治理工作,从而提升隐私计算的数据质量,并提高计算结果的精度。

关键词: 隐私计算, 联邦学习, 数据质量治理, 数据贡献度

Abstract: Privacy computing is a new data processing technology, which can realize the transformation and circulation of data value on the premise of protecting data privacy and security. However, the invisible feature of data in private computing scenarios poses a great challenge to the traditional data quality management. There is still a lack of perfect solutions to solve the above problems in the industry. This paper proposes a data quality governance method and process suitable for privacy computing scenarios, which can take into account the data quality governance of local and federal domains, thus improving the data quality of privacy computing and improving the accuracy of calculation results.

Key words: privacy computing, federated learning, data quality management, data contribution

No Suggested Reading articles found!