大数据 ›› 2019, Vol. 5 ›› Issue (1): 25-38.doi: 10.11959/j.issn.2096-0271.2019003

• 专题:健康医疗大数据 • 上一篇    下一篇

基于深度学习的异构时序事件患者数据表示学习框架

刘卢琛,沈剑豪,张铭(),王子昌,李浩然,刘泽群   

  1. 北京大学信息科学技术学院,北京 100871
  • 出版日期:2019-01-01 发布日期:2019-02-01
  • 作者简介:刘卢琛(1991- ),男,北京大学信息科学技术学院博士生,主要研究方向为深度学习、医疗大数据等。|沈剑豪(1995- ),男,北京大学信息科学技术学院博士生,主要研究方向为机器学习、自然语言处理等。|张铭(1966- ),女,北京大学信息科学技术学院教授、博士生导师,教育部高等学校大学计算机课程教学指导委员会委员,中国计算机学会(CCF)教育工作委员会副主任,ACM教育专家委员会唯一的中国理事,中国ACM教育专家委员会主席。主要研究方向为数据挖掘、机器学习、知识图谱等。|王子昌(1996- ),男,北京大学信息科学技术学院硕士生,主要研究方向为深度学习、医疗大数据、知识图谱等。|李浩然(1993- ),男,北京大学信息科学技术学院硕士生,主要研究方向为知识图谱和医疗大数据。|刘泽群(1997- ),女,北京大学信息科学技术学院本科生,研究兴趣为深度学习、医疗数据挖掘等。
  • 基金资助:
    国家自然科学基金资助项目(No.61772039);国家自然科学基金资助项目(No.91646202);国家自然科学基金资助项目(No.61472006);北京市科学技术委员会重点研发基金资助项目(No.Z181100008918005)

Deep learning based patient representation learning framework of heterogeneous temporal events data

Luchen LIU,Jianhao SHEN,Ming ZHANG(),Zichang WANG,Haoran LI,Zequn LIU   

  1. School of Electronics Engineering and Computer and Computer Science, Peking University, Beijing 100871, China
  • Online:2019-01-01 Published:2019-02-01
  • Supported by:
    The National Natural Science Foundation of China(No.61772039);The National Natural Science Foundation of China(No.91646202);The National Natural Science Foundation of China(No.61472006);Beijing Municipal Commission of Science and Technology Grant(No.Z181100008918005)

摘要:

患者数据的表示学习可以将患者历史信息综合表达为一个向量,用于预测未来可能发生的疾病。患者的历史记录可以被建模为多来源数据构成的采样频率差异很大、包含非线性时序关系的异构时序事件。提出了一个新的异构事件长短期记忆表示学习框架,用于学习患者异构时序事件的联合表征。异构事件长短期记忆模型加入了一个可以控制事件访问频率的门,以对不同事件的不规则采样频率建模,同时抓住事件中的复杂时序依赖关系。真实临床数据的实验表明,该方法可以在一系列先进模型的基础上,提升死亡预测和异常实验结果预测的准确度。

关键词: 电子病历, 患者数据表示学习, 异构时序事件, 深度学习

Abstract:

Patient representation embeds patients' longitude records from multiple sources into continuous low-dimension vectors, which can be used to predict whether a disease will happen in the future. However, the problem is very challenging since patients' history records contain multiple heterogeneous temporal events. The visiting patterns of different types of events vary significantly, and there exist complex nonlinear relationships between different events. A novel model for learning the joint representation of heterogeneous temporal events was proposed. The model adds a new gate to control the visiting rates of different events which effectively models the irregular patterns of different events and their nonlinear correlations. Experiment results with real-world clinical data on the tasks of predicting death and abnormal lab tests prove the effectiveness of the proposed approach over competitive baselines.

Key words: electronic health record, patient representation learning, heterogeneous temporal events, deep learning

中图分类号: 

No Suggested Reading articles found!