大数据 ›› 2016, Vol. 2 ›› Issue (2): 88-99.doi: 10.11959/j.issn.2096-0271.2016022

• 应用 • 上一篇    下一篇

基于短文本的食源性疾病事件探测技术

祝天刚1,2,郭旦怀1,王学志1,黎建辉1,周园春1   

  1. 1 中国科学院计算机网络信息中心,北京 100190
    2 中国科学院大学,北京 100049
  • 出版日期:2016-03-20 发布日期:2020-09-29
  • 作者简介:祝天刚(1988-),男,中国科学院大学硕士生,主要研究方向为数据挖掘。|郭旦怀(1973-),男,博士,中国科学院计算机网络信息中心副研究员、硕士生导师,主要研究方向为海量时空数据挖掘、大数据可视分析。|王学志(1979-),男,中国科学院计算机网络信息中心副研究员,主要研究方向为海量时空数据处理与分析。|黎建辉(1973-),男,博士,中国科学院计算机网络信息中心研究员、博士生导师,主要研究方向为大数据管理、大数据分析与处理。|周园春(1975-),男,博士,中国科学院计算机网络信息中心研究员、博士生导师,主要研究方向为数据挖掘、大数据分析与处理。
  • 基金资助:
    国家自然科学基金资助项目(91224006);国家“十二五”科技支撑计划资助项目(2013BAD15B02);中国科学院战略性先导专项资助项目(XDA06010307);国家卫生和计划生育委员会行业专项资助项目(201302005)

Foodborne diseases event detection based on short text

Tiangang ZHU1,2,Danhuai GUO1,Xuezhi WANG1,Jianhui LI1,Yuanchun ZHOU1   

  1. 1 Computer Network Information Center, Chinese Academy of Science, Beijing 100190, China
    2 University of the Chinese Academy of Sciences, Beijing 100049, China
  • Online:2016-03-20 Published:2020-09-29
  • Supported by:
    The National Natural Science Foundation of China(91224006);The 12th Five-Year Plan for Science&Technology Support(2013BAD15B02);The National Natural Science Foundation of China(XDA06010307);Special Research Funding of National Health and Family Planning Commission of China(201302005)

摘要:

微博数据是短文本事件探测的典型数据源,由于微博内容的多样性、稀疏性和碎片性,现有事件探测方法使用的数据源单一且噪声较大,在时空信息的发现上粒度过大,导致结果的准确性差。因此,在事件探测算法上提出动态上下文窗口算法,构建候选微博进行事件探测,提高了事件探测的效率和精度。并提出利用微博内容发现特定事件地理位置信息的算法,提高了事件时空信息的获取精度。最后应用于食源性疾病事件的自动探测中,相比以往的事件探测方法,扩大了数据来源,且时间和空间维度上的准确性得到显著提高。

关键词: 短文本, 事件探测, 时空信息, 微博, 食源性疾病

Abstract:

MicroBlog is a typical short text data source for event detection. Because of diversity, sparsity and debris in MicroBlog content, using existing event detection method is ineffective, and the event spatio-temporal information is inaccurate. To the end, a dynamic context window algorithm was proposed, improved the efficiency and precision of event detection of foodborne diseases based on MicroBlog. Moreover, an algorithm was developed which can get spatio-temporal information from MicroBlog more accurate. Finally, extensive experiments on event detection of foodborne diseases show the proposed method can help to expand the data source and improve the accuracy of time and space dimension.

Key words: short text, event detection, spatio-temporal information, MicroBlog, foodboorne disease

中图分类号: 

No Suggested Reading articles found!