摘要:
在基于聚类的话题检测方法上提出了一种基于 SVM 过滤的检测方法,该方法在聚类前将微博文本特征抽象成用于输入向量机的向量,对微博文本进行过滤,降低了计算量。井针对微博聚类的长尾现象提出了基于高频词排序的改进单遍聚类方法,能很好地检测孤立点的存在。实验表明,该方法在海量微博数据中能有效地检测出新闻话题。
程俊霞,李芝棠,邹明光,肖津. 基于SVM过滤的微博新闻话题检测方法[J]. 通信学报, 2013, 34(Z2): 74-78.
Jun-xia CHENG,Zhi-tang LI,Ming-guang ZOU,Jin XIAO. Novel topic detection method for microblog based on SVM filtration[J]. Journal on Communications, 2013, 34(Z2): 74-78.