随着人工智能(AI)技术的发展,AI应用进入了快速普及期,面对快速增长的市场需求,AI平台有必要引入自动化方法提升开发效率。在分析生成技术研究进展、AI平台现状及挑战的基础上,基于生成技术实现了AI平台的前后端适配、性能优化、模型安全提升等核心工作的自动化。新方法可以根据上下文的需要,生成数据或代码,以一种更灵活的方式满足AI应用及内核优化的需求,避免了大量的手工工作,有效提升了开发效率,降低了开发成本。
利用现有的数据进一步挖掘分析并帮助干部组织工作,是一个既有挑战又具有潜力的方向。针对干部信息数据的特点,使用基于关系图谱的人岗相宜研判方法分析领导班子,通过整合干部履历表以及人员基本信息库中的多源信息,构建关系图谱;将基于网络表示学习算法提取的关系图谱中的节点及关系等信息作为特征并输入分类模型,实现人岗关系研判。实验结果表明,基于关系图谱的方法可以很好地捕获人员和岗位之间的复杂关系信息,准确地判断人岗关系。
随着以数据为关键要素的数字经济的快速发展,涉及数据的纠纷和案件越来越多。由于数据要素是一个新生事物,因此有必要理清数据的经济活动类型及其需要的权利。结合数据的特点,将数据的经济活动分为数据生产再生产、数据确权、数据使用和数据服务、数据交易、科学研究五大类,相应地提出了数据生产权、数据所有权、数据使用权和数据交易权4类所需要的权利,以期为数据运用立法和数字经济的发展提供参考。
在教育信息化加速建设和政务数据逐步开放的背景下,教育数据共享开放成为亟待解决的问题,面向数据共享的教育数据标准体系建设需求应运而生。通过分析教育数据共享需求和标准化建设需求,研究数据共享标准在教育数据标准体系中的定位,明确教育数据共享标准应规范的内容。最后以上海教育数据标准体系建设为例,阐述了具体实践方法和建设特点,以期为其他地区开展教育数据共享工作提供参考。
数据采集是实现教育大数据应用价值潜能的基础,因此对于教育大数据建设与应用至关重要。阐述了教育大数据的采集内容、采集方式、采集手段及标准与规范,并结合当前教育大数据建设与应用中的实际问题,分别从平衡数据共享与隐私保护、驱动数据治理与人才创新、创新采集机制与相关技术3个方面,对教育大数据采集研究提出对策与建议。
先序关系指知识主题之间学习的先后依赖关系。已有的先序关系挖掘方法大多是流线型的方式,易导致错误累计,且严重依赖可能导致错误先序关系的超链接。为了解决以上问题,先对知识主题间的先序关系进行统计分析,发现了先序关系的不对称性特征;接着提出从文本中挖掘知识主题间的先序关系的端到端先序关系挖掘模型。该模型基于文本中抽取出的术语间上下位关系,计算知识主题的相关术语集间先序关系的不对称性,进而预测知识主题间的先序关系。实验结果表明,该方法具有较优的先序关系抽取性能。
数据智能引领是新时期区域教育大平台建设与应用的重要方向。从区域教育大平台建设与应用的现状和挑战出发,从理念视角阐述了基于数据智能的区域教育大平台的发展阶段,提出运用迭代思维推进平台建设、坚持3个导向统筹平台建设、聚焦3个重点推动平台建设、创新建设机制助推生态构建等方面的建设思路,从技术视角分析了平台的整体框架与核心关键技术,从应用视角提出了平台应用的推进路径、着力点及推进方式,并给出典型实践案例,为相关领域的研究者与实践者提供借鉴。
随着大数据技术在教育领域应用的不断深入,教育数据采集、分析及共享等环节可能带来的个人隐私安全等潜在风险不容忽视。如何保障教育数据安全,对教育数据进行合理、合规的分析和利用是当前亟须解决的问题。基于教育大数据的特征,重点阐明了教育大数据的隐私内涵,围绕教育数据生命周期内各利益相关方的隐私保护需求,提出了教育大数据隐私保护框架,并针对性地梳理了目前可用于教育领域的隐私保护技术体系,以期为教育大数据各个应用环节提供支撑,推动教育大数据的规范有序发展。
近年来,联邦学习作为解决数据孤岛问题的技术被广泛关注,已经开始被应用于金融、医疗健康以及智慧城市等领域。从3个层面系统阐述联邦学习算法。首先通过联邦学习的定义、架构、分类以及与传统分布式学习的对比来阐述联邦学习的概念;然后基于机器学习和深度学习对目前各类联邦学习算法进行分类比较和深入分析;最后分别从通信成本、客户端选择、聚合方式优化的角度对联邦学习优化算法进行分类,总结了联邦学习的研究现状,并提出了联邦学习面临的通信、系统异构、数据异构三大难题和解决方案,以及对未来的期望。
医学影像是临床诊断的重要辅助工具,医学影像数据占临床数据的90%,因此,充分挖掘医学影像信息将对临床智能诊断、智能决策以及预后起到重要的作用。随着深度学习的出现,利用深度神经网络分析医学影像已成为目前研究的主流。根据医学影像分析的流程,从医学影像数据的产生、医学影像的预处理,到医学影像的分类预测,充分阐述了深度学习在每一环节的应用研究现状,并根据其面临的问题,对未来的发展趋势进行了展望。
定制公交作为一种新的公交服务模式,对其需求的辨识具有重要实践意义,也是后续线路设计流程的基础。在大数据背景下,通过对海量出行数据中时空信息的挖掘分析,提出一个基于多源数据的定制公交需求分析框架,包括从公交和互联网用户中辨识通勤用户、出行需求的融合及站点选址方法。最后将该方法应用到成都市的出行数据中以验证其有效性,其需求分析结果可为定制公交的线路设计提供依据。