通信学报

• • 上一篇    下一篇

用于文本相似度计算的新核函数

王秀红,鞠时光   

  • 出版日期:2012-12-25 发布日期:2012-12-15

  • Online:2012-12-25 Published:2012-12-15

摘要: 为了提高文本相似检测的综合表现,在文本文档相似特征的基础上构造了新的核函数S_Wang核函数。结合文本相似计算过程中的实际情况,将待比对的文本表示成向量,考虑通过2个向量间的乘积和欧氏距离来描述向量之间的相似程度,从而构造了适合文本相似度计算的新核函数。并根据Mercer定理证明了所构造函数可以作为核函数。实验验证了新构造的核函数在文本文档相似度计算中的表现,实验结果表明S_Wang核其相似度计算精度和综合指标均分别优于Cauchy核,潜在语义核(LSK)以及CLA复合核。S_Wang核适用于文本相似度计算。

No Suggested Reading articles found!