通信学报 ›› 2015, Vol. 36 ›› Issue (12): 77-88.doi: 10.11959/j.issn.1000-436x.2015316

• 搜索 • 上一篇    下一篇

大数据探索式搜索研究

杜小勇1,2,陈峻1,2,陈跃国1,2   

  1. 1 中国人民大学 教育部数据工程与知识工程教育部重点实验室,北京 100872
    2 中国人民大学 信息学院,北京 100872
  • 出版日期:2015-12-25 发布日期:2017-07-17
  • 基金资助:
    国家重点基础研究发展计划(“973”计划)基金资助项目;中国人民大学科学研究(中央高校基本科研业务费专项资金)基金资助项目

Exploratory search on big data

Xiao-yong DU1,2,Jun CHEN1,2,Yue-guo CHEN1,2   

  1. 1 MOE Key Laboratory of Data Engineering and Knowledge Engineering,Renmin University of China,Beijing 100872,China
    2 School of Information,Renmin University of China,Beijing 100872,China
  • Online:2015-12-25 Published:2017-07-17
  • Supported by:
    The National Basic Research Program of China (973 Program);The National Natural Science Foundation of China

摘要:

数据探索(data exploration)是有别于数据服务与数据分析的第3种体现大数据价值的技术手段。数据服务强调从微观层面获取满足用户需求的精准信息;数据分析强调从宏观层面为用户提供数据洞察,进而提供决策支持;而数据探索是一种支持用户在微观层面和宏观层面进行自由切换的、深入浅出的、交互式发掘数据价值的方式。首先,简要介绍大数据价值发掘的传统技术手段和特点,并引入探索式搜索;其次,详细阐述探索式搜索的定义与模型,总结探索式搜索的特点;随后,基于组件化的思想,设计探索式搜索系统框架,并综述每个组件所涉及到的挑战与关键技术;最后简要介绍了笔者在知识库探索式搜索方面的尝试。

关键词: 大数据, 知识库, 探索式搜索, 数据探索

Abstract:

Exploratory search is a new approach for discovering the value of big data,compared with data serving and data analysis.Data serving emphasizes to meet users' information need at the micro-level,and data analysis emphasizes to discover insights among data at the macro-level.However,exploratory search is a way to support user to freely swap between micro-level to macro-level and interactively explore the value of data as well.Firstly,approaches for discovering the value of big data were discussed.Secondly,the definition,model and characteristics of exploratory search were illustrated.Thirdly,the architecture of exploratory search systems was designed,and a review of the challenges and techniques of each component of the architecture were given.Finally,preliminary results of exploratory search in RDF knowledge bases were introduced.

Key words: big data, knowledge base, exploratory search, data exploration

[1] 刘伯涛. 移动回传的融合之路[J]. 电信科学, 2009, 25(11): 91 -93 .
[2] 王俊波,陈 明. 单业务TDD-CDMA系统上行用户容量分析[J]. 通信学报, 2007, 28(6): 8 -53 .
[3] 刘 龙,宋琦军,赵太飞,元向辉. 基于运动矢量时-空特性的快速运动估计算法研究[J]. 通信学报, 2013, 34(1): 14 -127 .
[4] 王亚石,闵丽娟,周严. OSS/BSS一体化及其与ITSM的融合[J]. 电信科学, 2014, 30(6): 17 -23 .
[5] 杨春刚,盛敏,董延杰,李建东,李红艳,刘勤. 认知网络中基于网络辅助的速率控制方法[J]. 通信学报, 2013, 34(5): 15 -135 .
[6] 刘月平,姜秋喜,毕大平,崔 瑞. 网络雷达对Rician目标检测性能分析[J]. 通信学报, 2011, 32(10): 3 -26 .
[7] 淦明,李辉,戴旭初. 基于协作中继的多元网络乘积码[J]. 通信学报, 2013, 34(6): 13 -113 .
[8] 张红旗,韩崇砚. 支持分布式身份联盟的单点登录机制[J]. 通信学报, 2011, 32(11A): 22 -162 .
[9] 王庆顺. UT斯达康奔流融合视讯平台——全业务运营商的选择[J]. 电信科学, 2010, 26(11): 146 -150 .
[10] 陈久雨,张岚,张琳峰. cdma2000移动分组网络演进研究[J]. 电信科学, 2011, 27(11): 14 -18 .