大数据 ›› 2017, Vol. 3 ›› Issue (6): 102-111.doi: 10.11959/j.issn.2096-0271.2017065

• 论坛 • 上一篇    

“数据科学概论”课程设计

覃雄派1,陈跃国1,杜小勇1,王伟娟2   

  1. 1 中国人民大学信息学院,北京 100872
    2 中国人民大学出版社,北京 100872
  • 出版日期:2017-11-20 发布日期:2017-12-08
  • 作者简介:覃雄派(1971-),男,博士,中国人民大学信息学院讲师,目前主要从事高性能数据库、大数据分析、信息检索等方面的研究工作,主持1项国家自然科学基金面上项目,参与多项国家“973”计划、“863”计划、国家自然科学基金项目,在国内外期刊和会议上发表论文20余篇。|陈跃国(1978-),男,博士,中国人民大学信息学院副教授、博士生导师,中国计算机学会高级会员,数据库专家委员会委员,大数据专家委员会通信委员,Frontiers of Computer Science青年编委,主要研究方向为大数据分析系统和语义搜索。主持国家自然科学基金项目2项,广东省科技应用重大专项1项,参与多项国家核高基(核心电子器件、高端通用芯片及基础软件产品)、“973”计划、“863”计划项目,近年来在SIGMOD、SIGIR、ICDE、AAAI、IEEE TKDE、WWW等国际重要期刊和会议上发表论文30余篇。|杜小勇(1963-),男,博士,中国人民大学信息学院教授、博士生导师,教育部数据工程与知识工程重点实验室主任,中国计算机学会会士,《大数据》期刊编委会副主任。主要研究方向为智能信息检索、高性能数据库、知识工程。主持和参与多项国家核高基(核心电子器件、高端通用芯片及基础软件产品)、“973”计划、“863”计划、国家自然科学基金项目,近年来在SIGMOD、VLDB、AAAI、IEEE TKDE等国际重要期刊和会议上发表论文百余篇。|王伟娟(1979-),女,中国人民大学出版社编辑,主要研究方向为大数据、云计算、统计分析、数据科学。

Course design of the"Introduction to Data Science"

Xiongpai QIN1,Yueguo CHEN1,Xiaoyong Du1,Weijuan WANG2   

  1. 1 School of Information,Renmin University of China,Beijing 100872,China
    2 China Renmin University Press,Beijing 100872,China
  • Online:2017-11-20 Published:2017-12-08

摘要:

大数据时代已经到来,为了挖掘大数据的价值,社会急需大量合格的数据科学家,数据科学家的培养是一个紧迫的问题。提出了三大课程群的课程体系建设思路,其中“数据科学概论”是数据科学课程群的导论和入门性质的一门课程。本课程通过案例对关键技术的原理进行介绍,提供了中等规模实际问题的全流程实践案例,有利于学生掌握。数据科学是一门交叉学科,课程应该体现学科交叉的特点。对于时间序列数据,从统计学视角和数据挖掘/机器学习视角,对其分析和建模技术进行了介绍和比较。

关键词: 数据科学, 课程群, 数据科学概论, 课程设计

Abstract:

Big data era has arrived.In order to extract the value from big data,the community needs a large number of qualified data scientists.The training of data scientists is a pressing problem.School of Information Renmin University of China (Computer Science Department) proposed the construction thinking of building a curriculum system of three course groups,among them“Introduction to Data Science” is an introductory course of the data science course group.Firstly,the key technologies were introduced by cases for students to easily grasp the basic idea were introduced.Besides that,in order to enhance students' ability to analyze real problems (complex engineering problems) and to solve them,a whole-process practice case for a mediumsized practical problem was provided.Data science is an interdisciplinary subject,the course should reflect the interdisciplinary characteristics.For example,for time series data,the methods from statistics perspective and data mining /machine learning perspective to model and analyze the data,some comparison of the methods was given.

Key words: data science, course group, Introduction to Data Science, course design

中图分类号: 

No Suggested Reading articles found!