编辑部公告

  • 2018年第2期专题:数据自治开放



           推动数据开放共享是国家大数据战略的核心内容。但在实施过程中,数据开放共享面临着“数据拥有者不愿、不敢、不会开放共享”的问题。这里面有政策的原因,更有技术的问题。现行的数据管理技术是面向数据自治封闭的,不适合数据开放共享,急需开发面向数据开放共享的技术。数据开放共享的相关概念有开放数据、数据共享和数据交易,三者都是数据拥有者将数据开放给数据使用者,只是在范围、对象、是否收费等方面有所不同,所面临的核心问题是“如何控制数据使用者传播或滥用数据”。因此,为了方便叙述,本专题将开放数据、数据共享和数据交易统称为“数据开放”。本专题提出的“数据自治开放”是指数据拥有者在法律框架下对数据进行自行确权和管理、自行制定开放规则(即数据自治),然后将数据开放给使用者,包括上传数据到应用软件或下载数据到其设备中(使用者没有数据治理权)。

           数据自治开放技术要解决“如何控制数据使用者传播或滥用数据”的问题,对应的关键技术问题包括:如何做到数据既能够自治又能够开放;如何保护数据稀缺性不丧失、使数据安全和隐私有保障。2016年,上海市科学技术委员会注意到了数据开放共享面临的实际问题,委托课题组开展“数据开放共享的理论与方法”研究。本专题收录的“数据自治开放”的文章是该课题的首批研究成果。

           朱扬勇等人的文章《数据自治开放模》从分析数据开放共享需求和现行数据管理技术入手,提出了数据自治开放模式,阐述了数据自治开放涉及的主要技术。沈逸等人的文章《数据自治开放与治理模式创新》从宏观政策层面探索数据自治开放对政府数据资源开放、实现国家数据主权的意义和作用,提出了相应的政策建议。熊贇等人的文章《面向数据自治开放的数据盒模型》提出了数据盒模型,这是数据自治开放得以实现的基础。吴毅坚等人的文章《数据自治开放的软件开发和运行环境》探索了数据自治开放软件系统的实现技术。王智慧等人的文章《数据自治开放模式下的隐私保护》和黄霖等人的文章数据自治开放的加密技术挑战》提出了数据自治开放模式对数据加密和隐私保护的新挑战。陈德华等人的文章《数据自治开放应用平台设计与实践》介绍了数据自治开放应用系统的开发方法。

           数据自治开放模式有望成为数据开放的基本模式,是政府数据开放共享、企业及个人数据交易、国家数据主权实现的一种可行方法。后续,在宏观层面将就国际数据开放共享提出中国模式,探索具体实现方法;在技术层面开发数据盒管理系统软件和数据站系统产品,尽快推向市场。



           朱扬勇(1963-),男,博士,复旦大学计算机科学技术学院教授、学术委员会主任,上海市数据科学重点实验室主任。1989年起从事数据领域研究,2008年提出数据资源保护和利用,2009年发表了数据科学论文“Data explosion, data nature and dataology”,并出版专著《数据学》,对数据科学进行了系统探讨和描述。2010年创办了“International Workshop on Dataology and Data Science”,2014年和石勇、张成奇共同创办了“International Conference on Data Science”。担任第462次香山科学会议“数据科学与大数据的理论问题探索”的执行主席、“大数据技术与应用丛书”主编。目前主要研究方向为数据科学、大数据。

  • 发布日期: 2020-01-20    浏览: 916
下载排行
点击排行