大数据 ›› 2017, Vol. 3 ›› Issue (2): 26-30.doi: 10.11959/j.issn.2096-0271.2017016

• 专题:大数据管理与分析 • 上一篇    下一篇

开发商业智能应用小心大数据“陷阱”

黄锦辉   

  1. 香港中文大学工程学院,香港 999077
  • 出版日期:2017-03-20 发布日期:2017-03-24
  • 作者简介:黄锦辉(1960-),男,博士,香港中文大学工程学院副院长(外务)、系统工程与工程管理学系教授及创新科技中心主任,并担任哈尔滨工业大学深圳研究院特聘教授、北京大学信息科学技术学院客座教授以及东北大学兼职教授。香港信息科技联会、香港工程师学会、英国工程技术学会及英国计算机学会会员。主要研究方向为数据库及中文信息处理,并在多份国际刊物、会议及书籍中发表过超过250份技术研究报告。是《ACM Transactions on Asian Language Information Processing》的创办人及总编辑,也是《Computer Processing of Oriental Languages》及《Computational Linguistics and Chinese Computer Processing》等国际学术刊物的编辑小组成员。是亚洲自然语言处理协会(AFNLP)创会成员及现届会长(2015—2016年)。同时也是亚洲信息检索会议(AIRS)系列的创办人。

Beware of traps of big data analytics in business

KamFai WONG   

  1. Faculty of Engineering,The Chinese University of Hong Kong,Hong Kong 999077,China
  • Online:2017-03-20 Published:2017-03-24

摘要:

大数据的应用和研究是信息爆炸时代的热点话题。就如何更智能地发现大数据中的有用信息展开讨论,探讨了大数据中的“陷阱”和其引发的社会危害,提出一种面向社交文本的智能应用系统,以有效规避大数据中的“陷阱”并自动提取有用信息;基于提到的框架,展示了笔者研究组近些年在社交媒体上的事件检测、自动摘要和谣言检测方面的研究成果。

关键词: 大数据, 自然语言处理, 社交媒体, 数据处理

Abstract:

In the era of data explosion,research and application of big data has become a hot topic.How to automatically discover useful information from big data was focused.The organization is as following:examples of big data“traps” and their influences were discussed.The framework of an intelligent system to process social media texts that avoids traps and extracts useful information from big data was described.The research works proposed by our team and based on the framework about event detection,summarization and rumor detection were covered.

Key words: big data, natural language processing, social media, data processing

中图分类号: 

No Suggested Reading articles found!