大数据 ›› 2021, Vol. 7 ›› Issue (3): 97-115.doi: 10.11959/j.issn.2096-0271.2021028

所属专题: 知识图谱

• 专题:基于大数据的知识图谱及其应用 • 上一篇    下一篇

大规模知识图谱预训练模型及电商应用

陈华钧1,2, 张文3, 黄志文4, 叶橄强1, 文博1, 张伟2,4   

  1. 1 浙江大学计算机科学与技术学院,浙江 杭州 310007
    2 阿里巴巴-浙江大学前沿技术联合研究中心,浙江 杭州 311121
    3 浙江大学软件学院,浙江 杭州 310007
    4 阿里巴巴集团,浙江 杭州 311121
  • 出版日期:2021-05-15 发布日期:2021-05-01
  • 作者简介:陈华钧(1978- ),男,浙江大学计算机科学与技术学院教授,主要研究方向为知识图谱、自然语言处理、大数据系统。
    张文(1992- ),女,博士,浙江大学软件学院助理研究员,主要研究方向为知识图谱、知识表示和知识推理。
    黄志文(1993- ),男,阿里巴巴集团商品知识图谱团队算法工程师,主要研究方向为深度学习和知识图谱。
    叶橄强(1996- ),男,浙江大学计算机科学与技术学院硕士生,主要研究方向为知识图谱表示学习和预训练。
    文博(1994- ),男,浙江大学计算机科学与技术学院硕士生,主要研究方向为知识图谱和推荐计算。
    张伟(1983- ),男,博士,阿里巴巴集团资深算法专家,主要研究方向为自然语言处理和知识图谱。
  • 基金资助:
    国家自然科学基金资助项目(91846204);国家自然科学基金资助项目(U19B2027)

Large scale pre-trained knowledge graph model and e-commerce application

Huajun CHEN1,2, Wen ZHANG3, Chi-Man WONG4, Ganqiang YE1, Bo WEN1, Wei ZHANG2,4   

  1. 1 College of Computer Science and Technology, Zhejiang University, Hangzhou 310007, China
    2 Alibaba-Zhejiang University Joint Research Institute of Frontier Technologies, Hangzhou 311121, China
    3 School of Software Technology, Zhejiang University, Hangzhou 310007, China
    4 Alibaba Group, Hangzhou 311121, China
  • Online:2021-05-15 Published:2021-05-01
  • Supported by:
    The National Natural Science Foundation of China(91846204);The National Natural Science Foundation of China(U19B2027)

摘要:

近年来,知识图谱因具有以统一的方式组织数据等优势,被广泛应用于许多需要知识的任务,并且在电子商务领域大放光彩。然而知识服务通常需要烦琐的数据选择和知识注入模型的设计,这会给业务带来不良影响。为了更好地解决这一问题,提出了“预训练+知识向量服务”的模式,并设计了知识图谱预训练模型(PKGM),在不直接访问商品知识图谱中三元组数据的情况下,以知识向量的方式为下游任务提供知识图谱服务。在商品分类、同款商品识别和商品推荐等知识图谱下游任务中进行测试,实验结果表明,知识图谱预训练模型能够有效地提高每个任务的性能。

关键词: 知识图谱, 预训练, 电商

Abstract:

In recent years, knowledge graph has been widely applied to organize data in a uniform way and enhance many tasks that require knowledge.For example, it has been widely used in the field of e-commerce.However, such knowledge services usually include tedious data selection and model design for knowledge infusion, which might bring inappropriate results.Thus, to solve this problem, the method of first pre-training then providing knowledge vector service was put forward, and a pre-trained knowledge graph model (PKGM) was proposed for our billionscale e-commerce product knowledge graph, providing item knowledge services in a uniform way for embeddingbased models without accessing triple data in the knowledge graph.PKGM was tested in three knowledge-related tasks including item classification, same item identification, and recommendation.Experimental results show PKGM successfully improves the performance of each task.

Key words: knowledge graph, pre-training, e-commerce

中图分类号: 

No Suggested Reading articles found!