大数据 ›› 2022, Vol. 8 ›› Issue (5): 55-73.doi: 10.11959/j.issn.2096-0271.2022073

• 专题:数据流通与隐私计算 • 上一篇    下一篇

隐私计算场景下数据质量治理探索与实践

张燕, 杨一帆, 伊人, 罗圣美, 唐剑飞, 夏正勋   

  1. 星环信息科技(上海)股份有限公司,上海 200233
  • 出版日期:2022-09-15 发布日期:2022-09-01
  • 作者简介:张燕(1985- ),女,星环信息科技(上海)股份有限公司人工智能研究员,主要研究方向为隐私计算、可解释AI、因果分析等
    杨一帆(1985- ),男,博士,星环信息科技(上海)股份有限公司产品总监、首席科学家,主要研究方向为统计、图计算、强化学习等
    伊人(1989- ),女,博士,星环信息科技(上海)股份有限公司隐私计算首席科学家,主要研究方向为隐私计算、联邦学习、知识图谱等
    罗圣美(1971- ),男,博士,星环信息科技(上海)股份有限公司大数据研究院院长,主要研究方向为大数据、并行计算、云存储、人工智能等
    唐剑飞(1986- ),男,星环信息科技(上海)股份有限公司大数据技术标准研究员,主要研究方向为大数据、数据库、图计算等
    夏正勋(1979- ),男,星环信息科技(上海)股份有限公司高级研究员,主要研究方向为人工智能、大数据、数据库、流媒体处理技术等

Exploration and practice of data quality governance in privacy computing scenarios

Yan ZHANG, Yifan YANG, Ren YI, Shengmei LUO, Jianfei TANG, Zhengxun XIA   

  1. Transwarp Technology (Shanghai) Co., Ltd., Shanghai 200233, China
  • Online:2022-09-15 Published:2022-09-01

摘要:

隐私计算是一种新型数据处理技术,可以在保护数据隐私及安全的前提下,实现数据价值转化和流通。然而隐私计算场景中“数据可用不可见”的特性给传统的数据质量治理工作带来了很大的挑战,业界尚缺乏完善的解决方案。针对上述问题,提出一种适用于隐私计算场景的数据质量治理方法与流程,构建了本地与多方两个层级的数据质量评估体系,能够兼顾本地域及联邦域的数据质量治理工作,同时提出了一种数据贡献度衡量方法,对隐私计算的长效激励机制进行探索,从而提升隐私计算的数据质量,并提高计算结果的精度。

关键词: 隐私计算, 联邦学习, 数据质量治理, 数据贡献度

Abstract:

Privacy computing is a new data processing technology, which can realize the transformation and circulation of a data value on the premise of protecting data privacy and security.However, the invisible feature of data in private computing scenarios poses a great challenge to traditional data quality management.There is still a lack of perfect solutions.To solve the above problems in the industry, a data quality governance method and process suitable for privacy computing scenarios were proposed.A local and multi-party data quality evaluation system was constructed, which could take into account the data quality governance of the local domain and the federal domain.At the same time, a data contribution measurement method was proposed to explore the long-term incentive mechanism of privacy computing, improve the data quality of privacy computing, and improve the accuracy of computing results.

Key words: privacy computing, federated learning, data quality governance, data contribution

中图分类号: 

No Suggested Reading articles found!