大数据 ›› 2022, Vol. 8 ›› Issue (1): 37-45.doi: 10.11959/j.issn.2096-0271.2022004

• 专刊:科学数据治理 • 上一篇    下一篇

基因组科学数据的安全管理与应用

李茹姣1, 张欣1, 宋述慧1, 王彦青1, 邹东1, 肖景发1,2, 赵文明1,2, 章张1,2, 鲍一明1,2   

  1. 1 中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心,北京 100101
    2 中国科学院大学,北京 100049
  • 出版日期:2022-01-15 发布日期:2022-01-01
  • 作者简介:李茹姣(1976- ),女,博士,中国科学院北京基因组研究所(国家生物信息中心)高级工程师,主要研究方向为组学大数据整合和挖掘
    张欣(1981- ),男,中国科学院北京基因组研究所(国家生物信息中心)工程师,主要研究方向为组学大数据合作共享
    宋述慧(1981- ),女,博士,中国科学院北京基因组研究所(国家生物信息中心)副研究员,主要研究方向为基因组变异大数据整合分析与挖掘应用
    王彦青(1982- ),女,中国科学院北京基因组研究所(国家生物信息中心)高级工程师,主要研究方向为基因组学原始数据汇聚、管理与共享体系构建
    邹东(1986- ),男,中国科学院北京基因组研究所(国家生物信息中心)高级工程师,主要研究方向为生物数据库系统研发、多维组学大数据跨库检索平台建设
    肖景发(1973- ),男,博士,中国科学院北京基因组研究所(国家生物信息中心)研究员,主要研究方向为多维组学数据整合挖掘和微生物泛基因组学算法软件开发等
    赵文明(1977- ),男,中国科学院北京基因组研究所(国家生物信息中心)高级工程师,国家基因组科学数据中心副主任,主要研究方向为生物信息大数据整合挖掘、生物信息工具与平台研发
    章张(1980- ),男,博士,中国科学院北京基因组研究所(国家生物信息中心)研究员,国家基因组科学数据中心副主任,主要研究方向为生物大数据整合与信息挖掘
    鲍一明(1965- ),男,博士,中国科学院北京基因组研究所(国家生物信息中心)研究员,国家基因组科学数据中心主任,主要研究方向为生物数据库、病毒基因组注释、病毒进化与分类等
  • 基金资助:
    国家重点研发计划资助项目(2018YFD1000505);中国科学院战略性先导专项(XDB38030200);中国科学院基因组科学数据中心能力建设项目(XXH-13514-0202)

Safety management and application of genomics data

Rujiao LI1, Xin ZHANG1, Shuhui SONG1, Yanqing WANG1, Dong ZOU1, Jingfa XIAO1,2, Wenming ZHAO1,2, Zhang ZHANG1,2, Yiming BAO1,2   

  1. 1 National Genomics Data Center, Beijing Institute of Genomics, Chinese Academy of Sciences/China National Center for Bioinformation, Beijing 100101, China
    2 University of Chinese Academy of Sciences, Beijing 100049, China
  • Online:2022-01-15 Published:2022-01-01
  • Supported by:
    The National Key Research and Development Program of China(2018YFD1000505);Strategic Priority Research Program of the Chinese Academy of Sciences(XDB38030200);Genomics Data Center Construction of Chinese Academy of Sciences(XXH-13514-0202)

摘要:

基因组科学数据是人口健康和国家安全的重要战略资源,存好、管好和用好基因组科学数据具有重要意义。面对我国生物数据大量产出但因存储零散、缺乏系统监管而丢失和流失,以及严重依赖国际生物组学数据库的局面,亟须从国家层面建设我国自己的生物大数据管理体系。以国家基因组科学数据中心为例,阐述了基因组科学数据汇交共享体系和标准规范、数据安全管理机制,给出了数据挖掘与应用的典型案例,并从政策机制、基础设施、软件研发、学科建设、人才培养和国际合作等方面提出对策建议。

关键词: 科学数据, 基因组学, 汇交共享, 数据安全管理, 数据应用

Abstract:

Genomics data is essential strategic resources for population health and national security.It is of great significance to deposit, manage and utilize genomics data in a scientific manner.China is a powerhouse in generating vast quantities of biological data, while facing the situation of data loss due to the isolated data storage and the lack of systematic data monitoring and management, also with the heavy dependency on international biological data centers.Therefore, it urgently calls for China’s own life big data storage and management system at the national level.Taking the National Genomics Data Center for example, the deposition, sharing and safety management system and standards of genomics data were summarized, with data mining and application cases.Suggestions were also given on the aspects of policy-making, infrastructure, software research and development, principle building and talent development, as well as international cooperation.

Key words: scientific data, genomics, deposition and sharing, data safety management, data application

中图分类号: 

No Suggested Reading articles found!