大数据 ›› 2015, Vol. 1 ›› Issue (3): 36-47.doi: 10.11959/j.issn.2096-0271.2015027

• 专题:网络大数据 • 上一篇    下一篇

大数据时代的互联网分析引擎

窦志成,文继荣   

  1. 中国人民大学信息学院大数据管理与分析方法研究北京市重点实验室 北京 100872
  • 出版日期:2015-06-20 发布日期:2020-09-28
  • 作者简介:窦志成,男,中国人民大学信息学院研究员、硕士生导师,中国计算机学会大数据专家委员会通讯委员,中文信息学会信息检索专委会通讯委员,中国中文信息学会青年工作委员会委员,亚洲信息检索协会Steering Committee成员,美国ACM学会、IEEE会员,中国计算机学会会员。主要研究方向为信息检索、互联网搜索、数据挖掘、大数据等。近年来,在国际知名会议和学术期刊上(如SIGIR、WWW、CIKM、WSDM、EMNLP及IEEE TKDE等)发表论文20余篇。|文继荣,男,博士,中国人民大学信息学院教授、博士生导师,国家“千人计划”特聘专家。1999年至2013年就职于微软亚洲研究院,自2008年起担任高级研究员和互联网搜索与数据挖掘组主任。在微软亚洲研究院工作的14年中,获得50多项美国专利,其中一些成果已经被用于重要的微软产品中(如微软搜索引擎Bing)。所领导的研究团队开发出了微软学术搜索(http://academic.research.microsoft.com)、人立方(http://renlifang.msra.cn/)、产品搜索等有影响力的互联网应用。在国际著名会议和期刊上发表了100多篇论文,担任过许多国际会议和研讨会的程序委员和主席。目前是信息检索领域主要期刊ACM Transactions on Information Systems (TOIS)的副主编。
  • 基金资助:
    国家重点基础研究发展计划(“973”计划)基金资助项目(2014CB340403);国家自然科学基金资助项目(61502501);中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)(15XNLF03);国家文化科技提升计划

Web Analytical Engine in the Big Data Era

Zhicheng Dou,Jirong Wen   

  1. School of Information & Beijing Key Laboratory of Big Data Management and Analysis Methods,Renmin University of China,Beijing 100872,China
  • Online:2015-06-20 Published:2020-09-28
  • Supported by:
    The National Basic Research Program of China(973 Program)(2014CB340403);The National Natural Science Foundation of China(61502501);The Fundamental Research Funds for the Central Universities,the Research Funds of Renmin University of China(15XNLF03);The National Culture Science and Technology Promotion Plan

摘要:

随着互联网尤其是移动互联网的高速发展,互联网文档的数量、内容的丰富度和复杂度都大大增加,互联网正朝大数据时代迈进,而用户的信息需求也趋于复杂化。除了基本的信息检索需求外,对大量相关文档的深入理解与聚合分析的需求也越来越强烈,而传统的互联网搜索引擎已经无法满足人们对该类信息的需求。针对这一问题,提出“互联网分析引擎”的构想,阐述了其与搜索引擎和OLAP分析系统的区别,介绍了一种互联网分析引擎的架构,并详细讨论了实现该引擎的核心问题。

关键词: 互联网大数据, 分析引擎, 数据感知与采集

Abstract:

Web search engines can only return a list of Web documents (the so-called ten blue links),whereas users may need high-order knowledge that is contained within the Web documents.The demand of analytical services atop the Web is becoming stronger with the rapid development of the internet and the increase of big Web data.The concept of“Web Analytical Engine”,which aims to provide analytical service atop the huge amount of Web documents,was introduced.A simple infrastructure was described and the key research problems for building such an engine were discussed.

Key words: big Web data, analytical engine, data sensing and gathering

中图分类号: 

No Suggested Reading articles found!