健康医疗大数据应用发展是催生健康医疗新技术、新方法、新手段、新模式、新业态发展的强大动力,对于提升经济发展新动能起到了巨大的促进作用,并助推健康产业早日成为国民经济的重要支柱产业。首先梳理了健康医疗大数据发展的国家政策背景和社会发展的时代需求,在此基础上,提出并分析了“全息数字人”的概念和内涵,探讨了发展“全息数字人”新科技和构建医疗健康服务的新模式、发展“全息数字人”应用需要的新思维以及“全息数字人”发展的途径与成果共享方式。
以专病真实世界研究为背景,分析了医疗数据治理和数据可用性存在的各种问题。从医院数据治理出发,延伸到区域数据治理、专科联盟数据治理以及医疗标注数据与知识型数据的治理,总结了不同层次、不同层面数据治理的共性方法与个性方法。在此基础上,进一步探讨了数据治理中的主数据管理、元数据管理、数据质量控制等关键技术和关键环节。最后,给出了医疗大数据标准的基本框架,并基于现有的数据治理评估标准,对医疗大数据治理的现状进行了评估。
患者数据的表示学习可以将患者历史信息综合表达为一个向量,用于预测未来可能发生的疾病。患者的历史记录可以被建模为多来源数据构成的采样频率差异很大、包含非线性时序关系的异构时序事件。提出了一个新的异构事件长短期记忆表示学习框架,用于学习患者异构时序事件的联合表征。异构事件长短期记忆模型加入了一个可以控制事件访问频率的门,以对不同事件的不规则采样频率建模,同时抓住事件中的复杂时序依赖关系。真实临床数据的实验表明,该方法可以在一系列先进模型的基础上,提升死亡预测和异常实验结果预测的准确度。
近年来,人工智能成为学术界和工业界的研究热点,并已经成功应用于医疗健康等领域。着重介绍了人工智能在医学影像领域最新的研究与应用进展,包括智能成像设备、智能图像处理与分析、影像组学、医学影像与自然语言处理的结合等前沿方向。分析了研究和发展从源头入手的全链条人工智能技术的重要性和可行性,阐述了学术界和工业界在这一重要方向上的创新性工作。同时指出,人工智能在医学影像领域中的研究尚处于起步阶段,人工智能与医学影像的结合将成为国际上长期的研究热点。
为了辅助医护人员利用触诊成像技术判定乳腺癌,提出了触诊成像乳腺癌智能诊断模型和方法。采用乳腺癌早期筛查及风险评估的临床数据,以触诊成像诊断结果为对比数据,通过决策树等机器学习算法以及投票法,对乳腺肿瘤的良恶性质进行判定。使用SMOTE算法对数据进行处理,建立了诊断模型和方法,自动完成对乳腺肿瘤性质的诊断。实验结果表明,乳腺癌正确筛查的准确性达到98%,提出的方法具有很好的应用价值。
金融互联网化的迅速发展要求金融数据库系统同时具备高性能、可扩展、高可用和高容错等特性,传统数据库管理系统难以同时满足这些特性。为了应对金融互联网化带来的挑战,响应国家对技术自主可控需求,交通银行专注于支持金融行业典型交易的新一代数据库系统研发,通过实现轻量级分布式选举协议和分布式事务功能,开发了具备高性能、可扩展、高可用和高容错特性的分布式数据库,并成功将其运用于交通银行多个关键业务系统中。
针对共享单车运营过程中出现的分配不均衡和调度不合理的问题,基于某城市10个区域的共享单车骑行记录数据,综合应用时空统计及回归演绎分析和群智能算法,在分析共享单车时空分布特征的基础上,研究了基于蚁群算法的单车调度路径优化,设计了基于满足程度的共享单车区域最佳分配方案,并建立了共享单车投放量和打车人次间的回归模型,探讨了共享单车对打车市场的影响。研究结果对解决共享单车运营中存在的问题和提高共享单车运营效率及管理水平有重要的指导意义。
对百度贴吧“恐艾吧”中在线高危人群的帖子内容、线上活动时间规律进行了分析,利用LDA话题模型,对比分析了有无HIV感染者参与的主贴讨论的话题之间的差异,使用基于关键词的机器学习方法区分了在“恐艾吧”中发布话题的用户的性取向,计算不同性取向人群中HIV的流行率。研究结果说明,使用在线数据挖掘的技术和方法比传统方法更加高效,可以作为高危人群研究的重要补充。此外,基于机器学习对人群性取向进行智能判别,对于公共卫生管理部门监测疫情在不同人群中的发展状况有重要意义。