大数据 ›› 2015, Vol. 1 ›› Issue (3): 62-71.doi: 10.11959/j.issn.2096-0271.2015029

• 专题:网络大数据 • 上一篇    下一篇

网络大数据的文本内容分析

程学旗,兰艳艳   

  1. 中国科学院计算技术研究所 北京 100019
  • 出版日期:2015-06-20 发布日期:2020-09-28
  • 作者简介:程学旗,男,中国科学院计算技术研究所研究员、博士生导师,中国科学院“网络数据科学与技术”重点实验室主任,目前主要从事网络数据科学和社会计算等研究领域的工作,主持和参与多项国家“973”计划、“863”计划、国家自然科学基金项目和国家自然科学基金委杰出青年基金项目,并多次荣获国家科技进步奖一等奖。近年来,在IEEE TKDE、ACM SIGIR、WWW等本领域顶级期刊与国际会议发表论文40余篇,并荣获CIKM最佳论文奖和SIGIR最佳学生论文奖。|兰艳艳,女,中国科学院计算技术研究所副研究员、硕士生导师,目前主要从事机器学习与数据挖掘领域的研究工作,在ACM SIGIR、NIPS、ICML等本领域顶级会议发表论文20余篇,并荣获SIGIR最佳学生论文奖
  • 基金资助:
    国家重点基础研究发展计划(“973”计划)基金资助项目(2014CB340402);国家自然科学基金资助项目(61170008);国家自然科学基金资助项目(61272055)

Text Content Analysis for Web Big Data

Xueqi Cheng,Yanyan Lan   

  1. Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100019,China
  • Online:2015-06-20 Published:2020-09-28
  • Supported by:
    The National Basic Research Program of China(973 Program)(2014CB340402);The National Natural Science Foundation of China(61170008);The National Natural Science Foundation of China(61272055)

摘要:

文本内容分析是实现大数据的理解与价值发现的有效手段。尝试从短文本主题建模、单词表达学习和网页排序学习3个子方向,探讨网络大数据文本内容分析的挑战和研究成果,最后指出未来大数据文本内容分析的一些研究方向和问题。

关键词: 文本内容分析, 短文本主题建模, 单词表达, 排序学习

Abstract:

Text content analysis is an effective way to understand and acquire the “value” of big fata.The challenges and research results were investigated in the three hot topics: topic modeling for short texts,word embedding and learning to rank for web pages.In the end,some remaining problems in this area were proposed.

Key words: text content analysis, topic modeling for short texts, word embedding, learning to rank

中图分类号: 

No Suggested Reading articles found!