大数据 ›› 2019, Vol. 5 ›› Issue (5): 48-57.doi: 10.11959/j.issn.2096-0271.2019041

• 专题:学术大数据 • 上一篇    下一篇

开放存取知识库及其数据采集规范的研究

万猛1,张永锋2,李振华2(),霍东云3,赵弋洋4,王莲4   

  1. 1 教育部科技发展中心,北京 100080
    2 清华大学软件学院,北京 100084
    3 北京赛时科技有限公司,北京 100084
    4 北京西普阳光教育科技股份有限公司,北京 100191
  • 出版日期:2019-09-15 发布日期:2019-10-11
  • 作者简介:万猛(1975-),男,博士,教育部科技发展中心研究员,主要研究方向为信息管理与信息系统、科技评价与管理、教育大数据等。|张永锋(1994-),男,清华大学软件学院硕士生,主要研究方向为云存储、网络信息爬取等。|李振华(1983-),男,博士,清华大学软件学院副教授、博士生导师,主要研究方向为云计算、云存储、移动互联网等。|霍东云(1981-),男,北京赛时科技有限公司联合创始人兼首席技术官,主要研究方向为大数据、云计算、移动互联网等。|赵弋洋(1975-),男,博士,北京西普阳光教育科技股份有限公司首席科学家,主要研究方向为物联网、定位、移动互联网等。|王莲(1984-),女,北京西普阳光教育科技股份有限公司高级经济师,主要研究方向为物联网、大数据、产业经济学等。
  • 基金资助:
    国家重点研发计划基金资助项目(2018YFB1004701)

Research on open-access repositories and data acquisition specifications

Meng WAN1,Yongfeng ZHANG2,Zhenhua LI2(),Dongyun HUO3,Yiyang ZHAO4,Lian WANG4   

  1. 1 Center for Science and Technology Development,Ministry of Education,Beijing 100080,China
    2 School of Software,Tsinghua University,Beijing 100084,China
    3 ScientistIn Co.,Ltd.,Beijing 100084,China
    4 Beijing Simpleware Education Technology Co.,Ltd.,Beijing 100191,China
  • Online:2019-09-15 Published:2019-10-11
  • Supported by:
    The National Key Research and Development Program of China(2018YFB1004701)

摘要:

在建设学术大数据、促进学术共享的时代背景下,调查了目前开放存取知识库的发展现状,在数据规模、地区分布、系统软件等方面阐述了国内外的研究情况。以建立科研机构知识库为例,梳理了建立过程中的数据采集需求,并从数据属性、元数据标准、语义去重等方向分析了常用的数据采集规范。最后,综合考虑国内外开放存取知识库的发展现状,并结合我国发展开放存取知识库存在的问题和面临的挑战,提出了4点发展建议。

关键词: 开放存取, 知识库, 数据, 规范

Abstract:

Under the background of building academic big data and promoting academic sharing,the current development status of open-access repositories was investigated and domestic and foreign research were summarized on data scale,regional distribution and system software.Taking the establishment of building academic institutional repositories as an example,the data collection requirements were analyzed and the commonly used data acquisition specifications were summarized from the aspects of data attributes,metadata standards and semantic deduplication.Finally,combined with the problems and challenges faced by China in developing open-access repositories,reasonable suggestions were put forwar.

Key words: open-access, repositories, data, specification

中图分类号: 

No Suggested Reading articles found!