大数据 ›› 2015, Vol. 1 ›› Issue (1): 78-88.doi: 10.11959/j.issn.2096-0271.2015.01.007

• 研究 • 上一篇    下一篇

大数据是数据、技术,还是应用

朱扬勇1,2,熊赟1,2   

  1. 1 复旦大学计算机科学技术学院 上海 201203
    2 上海市数据科学重点实验室(复旦大学) 上海 201203 451191
  • 修回日期:2015-05-05 出版日期:2015-05-20 发布日期:2020-09-28
  • 作者简介:朱扬勇,男,博士,复旦大学计算机科学技术学院教授、学术委员会主任,上海市数据科学重点实验室主任。1989年起从事数据领域研究,2008年提出数据资源保护和利用,2009年发表了数据科学论文“Data explosion, data nature and dataology”,并出版专著《数据学》,对数据科学进行了系统探讨和描述。2010年创办了“International Workshop on Dataology and Data Science”, 2014年和石勇、张成奇共同创办了“International Conference on Data Science”。第462次香山科学会议“数据科学与大数据的理论问题探索”的执行主席,《大数据技术与应用丛书》主编。目前研究兴趣为数据科学、大数据。|熊赟,女,博士,复旦大学计算机科学技术学院副教授。2004年起从事数据领域方面的研究工作,作为项目负责人主持国家自然科学基金、上海市科委发展基金以及企业合作项目。相关研究成果在本领域国际权威期刊或会议发表论文30余篇,出版专著2本。目前研究兴趣为数据科学、大数据。
  • 基金资助:
    国家自然科学基金资助项目(61170096);国家自然科学基金资助项目(71331005);上海市科技发展基金资助项目(13dz2260200);上海市科技发展基金资助项目(13511504300);上海市科技发展基金资助项目(14511107302)

Defining Big Data

Yangyong ZHU1,2,Yun Xiong1,2   

  1. 1 School of Computer Science, Fudan University, Shanghai 201203, China;
    2 Shanghai Key Laboratory of Data Science, Fudan University, Shanghai 201203, China
  • Revised:2015-05-05 Online:2015-05-20 Published:2020-09-28
  • Supported by:
    The National Natural Science Foundation of China(61170096);The National Natural Science Foundation of China(71331005);Shanghai Science and Technology Development Fund(13dz2260200);Shanghai Science and Technology Development Fund(13511504300);Shanghai Science and Technology Development Fund(14511107302)

摘要:

通常认为大数据是一个现有技术难以处理的复杂而庞大的数据集,这将导致一个谬误的出现:大数据都不能被处理,能处理的都不是大数据。显然,如何定义大数据是一个问题。分析了已有的大数据定义和现象,发现数据、技术和应用是大数据的三要素,定义大数据是为决策提供服务的大数据集、大数据技术和大数据应用的总称。其中,大数据集是指一个决策问题所用到的所有可能的数据,而不是一个领域的所有数据。还给出了大数据应用遇到的问题及技术挑战,并指出大数据未来的研究方向。

关键词: 大数据, 智慧城市, 交互式可视分析, 机器智能

Abstract:

Generally, big data is regarded as a term about data sets so large or complex that conventional data technologies cannot handle. This statement of big data leads to confusion: none of big data has been handled by existing data technologies;or none of current successful data applications can be called as big data. Therefore, what is the best way to define big data becomes a problem. Data, technology, and application were regarded as three associated key factors of big data by analyzing the state-of-the-art of big data. A comprehensive definition on big data was defined as the umbrella of big data set, big data technology, and big data application. Here, big data set means all data that can be acquired and were related to one decision-making application instead of all data in an area or an enterprise. In addition, the issues in big data applications and the main challenges in big data technologies were discussed. Finally, the future directions of big data research were presented including data science and the technologies of big data reservation and development.

Key words: big data, data science, data nature

No Suggested Reading articles found!