大数据 ›› 2022, Vol. 8 ›› Issue (3): 26-39.doi: 10.11959/j.issn.2096-0271.2022040

• 专题:数据要素市场建设 • 上一篇    

从数据质量到数据产品质量

蔡莉1, 朱扬勇1   

  1. 1 云南大学软件学院,云南 昆明 650504
    2 复旦大学计算机科学技术学院,上海 200438
    3 上海市数据科学重点实验室,上海 200438
  • 出版日期:2022-05-01 发布日期:2022-05-01
  • 作者简介:蔡莉(1975- ),女,博士,云南大学软件学院副教授,主要研究方向为数据质量、数据挖掘和智能交通。
    朱扬勇(1963- ),男,博士,复旦大学计算机科学技术学院教授、上海市数据科学重点实验室主任,复旦大学数据产业研究中心副主任。《大数据》期刊编委会副主任,农业大数据产业技术战略联盟副理事长兼首席科学家,大数据协同安全国家工程实验室副理事长,中国自动化学会国防大数据分会副主任。国际数据科学倡导者,提出数据界、数据学、数据身、数据自治、数据财政等概念和体系。发表学术论文200多篇,出版《数据学》《旖旎数据》《特异群组挖掘》《数据自治》等专著,并任《大数据技术与应用丛书》(22册)主编、《大数据资源》主编。主要研究方向为数据科学和数字经济,近期研究重点为数字化转型、数据财政、数据资产、数据自治与数据跨境等。
  • 基金资助:
    国家自然科学基金资助项目(61663047);云南省软件工程重点实验室项目(2020SE314)

From data quality to data products quality

Li CAI1, Yangyong ZHU1   

  1. 1 School of Software, Yunnan University, Kunming 650504, China
    2 School of Computer Science, Fudan University, Shanghai 200438, China
    3 Shanghai Key Laboratory of Data Science, Shanghai 200438, China
  • Online:2022-05-01 Published:2022-05-01
  • Supported by:
    The National Natural Science Foundation of China(61663047);Key Laboratory in Software Engineering of Yunnan Province(2020SE314)

摘要:

长期以来,数据质量研究主要是为了满足组织自身信息系统正常运行的需求。随着数据要素市场的建设与发展,数据的质量需求从“自用需求”转变为“他用需求”“监管需求”。数据市场中的数据产品质量问题是数据使用者(购买者)和市场监管机构重点关注的内容。分析了数据产品质量的使用者需求和监管者需求,创新性地提出了一个数据产品质量体系框架;在此基础上,以盒装数据产品为例,从时间、空间和内容完整性3个方面构建了对应的质量维度、质量指标和质量评测模型。该质量体系可以对资源类数据产品进行检测和评定,能够为数据产品购买者和市场监管机构提供行之有效的检测依据和标准。

关键词: 数据产品, 数据质量, 质量管理, 盒装数据

Abstract:

For a long time, the purpose of data quality research is to fulfill requirements of the normal operation of the organization’s own information system.With the construction and development of data market, the requirements on data quality have changed from “self-use” to “other use” and “need for supervision”.The data products quality in the data market is the focus of data users (buyers) and market regulators.The demands of users and regulators for data product quality were analyzed, and a framework of data product quality was proposed innovatively.On this basis, taking BoxedData as an example, the corresponding quality dimensions, quality indicators and quality assessment models were construct from three aspects of time, space and content integrity.The quality framework was suitable for detecting and assessing resource data products, and could provide effective detection methods and standards for data product buyers and market regulators.

Key words: data product, data quality, quality control, BoxedData

中图分类号: 

No Suggested Reading articles found!