电信科学 ›› 2019, Vol. 35 ›› Issue (5): 97-103.doi: 10.11959/j.issn.1000-0801.2019076

• 研究与开发 • 上一篇    下一篇

基于峰值密度聚类的电信业投诉热点话题检测方法

江俊1,2,3,黄骅4,任条娟1,张登辉1   

  1. 1 浙江树人大学信息科技学院,浙江 杭州 310015
    2 浙江大学信息与电子工程学院,浙江 杭州 310058
    3 东方通信股份有限公司,浙江 杭州 310053
    4 万向集团公司万向研究院,浙江 杭州 311215
  • 修回日期:2019-04-12 出版日期:2019-05-20 发布日期:2019-05-21
  • 作者简介:江俊(1983- ),男,博士,东方通信股份有限公司工作站及浙江大学流动站博士后,浙江树人大学讲师,主要研究方向为人工智能、数据科学与大数据处理、信息检索等。|黄骅(1983- ),男,博士,浙江大学流动站博士后,主要研究方向为文本挖掘、信息检索和自然语言处理等。|任条娟(1965- ),女,浙江树人大学信息科技学院院长、教授,中国电子学会理事,主要研究方向为无线传感网和车联网、数据科学与大数据处理等。|张登辉(1970- ),男,浙江树人大学信息科技学院副院长、教授,主要研究方向为机器学习与社交计算、数据科学与大数据处理等。

Telecom complaint hot topic detection method based on density peaks clustering

Jun JIANG1,2,3,Hua HUANG4,Tiaojuan REN1,Denghui ZHANG1   

  1. 1 College of Information Science and Technology,Zhejiang Shuren University,Hangzhou 310015,China
    2 College of Information Science and Electronic Engineering,Zhejiang University,Hangzhou 310058,China
    3 Eastern Communications Co.,Ltd.,Hangzhou 310053,China
    4 Wan Xiang Research Institute of Wan Xiang Group Corporation,Hangzhou 311215,China
  • Revised:2019-04-12 Online:2019-05-20 Published:2019-05-21

摘要:

针对电信业对投诉热点话题缺乏有效的检测方法问题,提出一种基于峰值密度聚类算法的投诉热点话题检测方法。首先建立电信业专用词库用于投诉样本的文本分词,采用向量空间模型表示文本分词,然后通过计算文本分词相似度和密度,并运用密度峰值聚类算法对分词进行聚类分析。最终通过类簇关键词选取并排序,从而得到热点话题描述。将本方法应用到某电信企业投诉热点话题检测中,结果表明本方法有效并具有实际应用价值。

关键词: 热点话题检测, 文本分词, 聚类分析

Abstract:

In view of the lack of effective detection methods for hot topics in telecom industry,a method of complaint hotspots detection based on density peaks clustering algorithm was proposed.Firstly,a special vocabulary for telecommunication industry was established to segment the complaint samples.The vector space model was used to represent the text segmentation.Then,the similarity and density of the text segmentation were calculated,and the clustering analysis of the words was carried out by using the density peaks clustering algorithm.Finally,keywords were selected and sorted by clustering.This method was applied to the complaint hotspots detection tasks within a telecom company.The results show that this method is effective and has practical application value.

Key words: hot topic detection, text segmentation, cluster analysis

中图分类号: 

No Suggested Reading articles found!