大数据 ›› 2015, Vol. 1 ›› Issue (2): 66-77.doi: 10.11959/j.issn.2096-0271.2015020

• 研究 • 上一篇    下一篇

特异群组挖掘:框架与应用

熊赟1,2,朱扬勇1,2   

  1. 1 复旦大学计算机科学技术学院 上海 201203
    2 上海市数据科学重点实验室(复旦大学) 上海 201203
  • 出版日期:2015-07-20 发布日期:2017-03-08
  • 作者简介:熊赟,女,博士,复旦大学计算机科学技术学院副教授。2004年起从事数据领域方面的研究工作,作为项目负责人主持国家自然科学基金、上海市科委发展基金以及企业合作项目。相关研究成果在本领域国际权威期刊或会议发表论文30余篇,出版专著2本。目前研究方向为数据科学、大数据。|朱扬勇,男,博士,复旦大学计算机科学技术学院教授、学术委员会主任,上海市数据科学重点实验室主任。1989年起从事数据领域研究,2008年提出数据资源保护和利用,2009年发表了数据科学论文“Data explosion,data nature and dataology”,并出版专著《数据学》,对数据科学进行了系统探讨和描述。2010年创办了“International workshop on dataology and data science”,2014年和石勇、张成奇共同创办了“International conference on data science”。第462次香山科学会议“数据科学与大数据的理论问题探索”的执行主席。《大数据技术与应用丛书》主编。目前研究方向为数据科学、大数据。
  • 基金资助:
    国家自然科学基金资助项目(61170096);国家自然科学基金资助项目(71331005)

Abnormal Group Mining:Framework and Applications

Yun Xiong1,2,Yangyong Zhu1,2   

  1. 1 School of Computer Science,Fudan University,Shanghai 201203,China
    2 Shanghai Key Laboratory of Data Science,Fudan University,Shanghai 201203,China
  • Online:2015-07-20 Published:2017-03-08
  • Supported by:
    The National Natural Science Foundation of China Projects(61170096);The National Natural Science Foundation of China Projects(71331005)

摘要:

特异群组挖掘在证券金融、医疗保险、智能交通、社会网络和生命科学研究等领域具有重要应用价值。特异群组挖掘与聚类、异常挖掘都属于根据数据对象的相似性来划分数据集的数据挖掘任务,但是,特异群组挖掘在问题定义、算法设计和应用效果方面不同于聚类和异常等挖掘任务。为此,系统地阐述了特异群组挖掘任务,分析了特异群组挖掘任务与聚类、异常等任务之间的差异,给出了特异群组挖掘任务的形式化描述及其基础算法,最后,列举了特异群组挖掘的几个重点应用。

关键词: 大数据, 数据挖掘, 特异群组, 聚类, 异常检测, 数据相似性

Abstract:

Abnormal groups can be found in a wide range of areas.Together with clustering and outlier detection,their goals are all to partition a data set according to data similarity.However,abnormal group mining (AGM) is different in problem definition,algorithm design and applications.To the best of our knowledge,the abnormal group mining problem was investigated systematically.The differences among AGM,clustering and outlier detection were analyzed.The formalized definitions on AGM and a framework algorithm were presented,and several interesting applications were particularized.

Key words: big data, data mining, abnormal group, clustering, outlier detection, data similarity

No Suggested Reading articles found!