电信科学 ›› 2022, Vol. 38 ›› Issue (2): 103-110.doi: 10.11959/j.issn.1000-0801.2022031

• 研究与开发 • 上一篇    下一篇

基于矩阵分解和注意力多任务学习的客服投诉工单分类

宋勇1, 严志伟2, 秦玉坤2, 赵东明3, 叶晓舟1, 柴园园1, 欧阳晔1   

  1. 1 亚信科技(中国)有限公司,北京 100193
    2 亚信科技(南京)有限公司,江苏 南京 210013
    3 中国移动通信集团天津有限公司,天津 300020
  • 修回日期:2021-12-27 出版日期:2022-02-20 发布日期:2022-02-01
  • 作者简介:宋勇(1989- ),男,亚信科技(中国)有限公司通信人工智能实验室通信业务与应用算法研究部负责人,主要研究方向为NLP、知识图谱、AIOps、推荐等
    严志伟(1994- ),男,博士,亚信科技(南京)有限公司通信人工智能实验室算法工程师,主要研究方向为NLP、AIOps
    秦玉坤(1987- ),男,亚信科技(南京)有限公司通信人工智能实验室算法工程师,主要研究方向为NLP、AIOps、知识图谱
    赵东明(1984- ),男,博士,中国移动通信集团天津有限公司技术专家,天津移动 AI 实验室/天津移动博士后科研工作站负责人,主要研究方向为知识图谱、智能语音情感、认知概念网络
    叶晓舟(1980- ),男,博士,亚信科技(中国)有限公司通信人工智能实验室资深总监、首席科学家,主要研究方向为通信网络与人工智能
    柴园园(1980- ),女,博士,亚信科技(中国)有限公司通信人工智能实验室首席算法科学家,主要研究方向为深度学习、人工智能、数据科学及管理
    欧阳晔(1981- ),男,博士,亚信科技(中国)有限公司首席技术官、高级副总裁,主要研究方向为移动通信、人工智能、数据科学、科技研发创新与管理

Customer service complaint work order classification based on matrix factorization and attention multi-task learning

Yong SONG1, Zhiwei YAN2, Yukun QIN2, Dongming ZHAO3, Xiaozhou YE1, Yuanyuan CHAI1, Ye OUYANG1   

  1. 1 AsiaInfo Technologies (China) Co., Ltd., Beijing 100193, China
    2 AsiaInfo Technologies (Nanjing) Co., Ltd., Nanjing 210013, China
    3 China Mobile Communications Group Tianjin Co., Ltd., Tianjin 300020, China
  • Revised:2021-12-27 Online:2022-02-20 Published:2022-02-01

摘要:

投诉工单自动分类是通信运营商客服数字化、智能化发展的要求。客服投诉工单的类别有多层,每一层有多个标签,层级之间有所关联,属于典型的层次多标签文本分类问题,现有解决方法大多数基于分类器同时处理所有的分类标签,或者对每一层级分别使用多个分类器进行处理,忽略了层次结构之间的依赖。提出了一种基于矩阵分解和注意力的多任务学习的方法(MF-AMLA),处理层次多标签文本分类任务。在通信运营商客服场景真实投诉工单分类数据下,与该场景常用的机器学习算法和深度学习算法的 Top1 F1 值相比分别最大提高了21.1%和5.7%。已在某移动运营商客服系统上线,模型输出的正确率97%以上,对客服坐席单位时间的处理效率提升22.1%。

关键词: 层次多标签分类, 注意力机制, 多任务学习, 客服工单分类

Abstract:

The automatic classification of complaint work orders is the requirement of the digital and intelligent development of customer service of communication operators.The categories of customer service complaint work orders have multiple levels, each level has multiple labels, and the levels are related, which belongs to a typical hierarchical multi-label text classification (HMTC) problem.Most of the existing solutions are based on classifiers to process all classification labels at the same time, or use multiple classifiers for each level, ignoring the dependence between hierarchies.A matrix factorization and attention-based multi-task learning approach (MF-AMLA) to deal with hierarchical multi-label text classification tasks was proposed.Under the classification data of real complaint work orders in the customer service scenario of communication operators, the maximum Top1 F1 value of MF-AMLA is increased by 21.1% and 5.7% respectively compared with the commonly used machine learning algorithm and deep learning algorithm in this scenario.It has been launched in the customer service system of one mobile operator, the accuracy of model output is more than 97%, and the processing efficiency of customer service agent unit time has been improved by 22.1%.

Key words: hierarchical multi-label classification, attention mechanism, multi-task learning, customer service work order classification

中图分类号: 

No Suggested Reading articles found!