推荐文章
  
    专题:数据驱动的软件智能化开发
    导读
    谢冰, 彭鑫
    大数据. 2021, 7(1):  0.  doi:10.11959/j.issn.2096-0271.2021001-1
    摘要 ( 79 )   在线阅读 ( 42 )   PDF下载 (689KB) ( 60 )   可视化    收藏
    参考文献 | 相关文章
    基于大数据的软件智能化开发方法与环境
    谢冰, 彭鑫, 尹刚, 李宣东, 魏峻, 孙海龙
    大数据. 2021, 7(1):  0.  doi:10.11959/j.issn.2096-0271.2021001
    摘要 ( 81 )   在线阅读 ( 32 )   PDF下载 (2620KB) ( 58 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    阐述了围绕软件工程大数据的汇聚组织、知识表示提炼、软件工具智能化和智能开发服务环境等关键技术开展的一系列研究工作,建立了基于大数据的软件智能化开发技术体系,研发关键性的软件智能化开发工具,形成了“人-工具-数据”融合的新一代软件智能化开发环境,并构建了软件智能化开发云平台。面向万众创新的社会需求,构建了服务大众的公共服务平台;针对企业创新能力的提升,提供了智能化的企业软件开发环境。

    基于大数据的软件项目知识图谱构造及问答方法
    邹艳珍, 王敏, 谢冰, 林泽琦
    大数据. 2021, 7(1):  0.  doi:10.11959/j.issn.2096-0271.2021002
    摘要 ( 117 )   在线阅读 ( 48 )   PDF下载 (2526KB) ( 76 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    随着软件规模的不断扩大、软件演化周期的不断延长,构建软件项目知识图谱对软件维护、软件开发的意义越来越重大。如何基于软件项目开发过程中产生的源代码、邮件列表、缺陷报告等多源异构大数据,快速构建语义关联丰富的软件知识图谱,是软件工程领域亟待解决的关键问题。提出了以代码结构为核心的软件知识图谱模型,建立了“知识抽取-知识融合”两层软件知识图谱构造框架,该框架支持软件项目知识图谱的自动构造以及基于知识图谱的软件项目智能问答,有效提高了软件项目理解和软件复用的效率。目前,软件项目知识图谱已经在Apache开源社区以及国内著名软件企业成功展开应用实践。

    基于上下文的智能化代码复用推荐
    彭鑫, 陈驰, 林云
    大数据. 2021, 7(1):  0.  doi:10.11959/j.issn.2096-0271.2021003
    摘要 ( 23 )   在线阅读 ( 13 )   PDF下载 (2071KB) ( 11 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    基于代码大数据分析、挖掘和学习的智能化代码复用推荐能够有效地提高软件复用的效率和质量,包括特定领域内的共性代码单元以及与领域无关的通用代码单元。围绕基于上下文的智能化代码复用推荐这一主题,阐述了基于模板挖掘的代码复用推荐和基于深度学习的代码复用推荐两个方面的研究工作。在此基础上,针对基于上下文的智能化代码复用推荐的未来发展方向进行了展望。

    基于大数据的开源项目缺陷报告智能预检技术
    席圣渠, 徐锋, 陈鑫, 李宣东
    大数据. 2021, 7(1):  0.  doi:10.11959/j.issn.2096-0271.2021004
    摘要 ( 25 )   在线阅读 ( 13 )   PDF下载 (1432KB) ( 17 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    缺陷报告预检目标在于确定优先级和修复措施,是保障软件可信的关键环节。然而,在日益普及的开源项目中,由于缺陷数量众多、缺乏组织管理等特性,人工预检难以及时完成,迫切需要基于大数据的自动化、智能化预检技术。结合工业界、学术界对缺陷报告预检的认知,提出了一种智能化缺陷报告预检技术框架,全面系统地归纳了缺陷报告预检中存在的3个关键任务:缺陷优先级分类、缺陷分派、缺陷再分派,并结合开源项目的特点提出了相关技术。实验结果初步验证了上述技术的合理性和有效性。

    基于领域知识的Docker镜像自动构建方法
    陈伟, 叶宏杰, 周家宏, 魏峻
    大数据. 2021, 7(1):  0.  doi:10.11959/j.issn.2096-0271.2021005
    摘要 ( 21 )   在线阅读 ( 10 )   PDF下载 (1552KB) ( 15 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    Dockerfile是构建Docker应用镜像的脚本代码,包含软件系统镜像构建所需的软件包及其依赖的下载、安装和配置的所有指令。编写Dockerfile需要丰富的领域知识,否则编写的Dockerfile容易产生镜像构建错误。针对此问题,提出一种基于领域知识的Docker镜像自动构建方法。该方法通过对大规模Dockerfile的自动解析,分析提取构建Docker镜像所需的软件依赖及安装配置等领域知识;在面向特定软件系统构建镜像时,从已构建的领域知识库中分析推断指定软件的依赖关系及安装操作,生成Dockerfile来构建Docker镜像。实验结果表明,该方法具有利用领域知识推断系统依赖关系和软件包安装方式、生成不同软件Dockerfile的能力。

    数据驱动的软件开发者智能协作技术
    张建, 孟祥鑫, 孙海龙, 王旭, 刘旭东
    大数据. 2021, 7(1):  0.  doi:10.11959/j.issn.2096-0271.2021006
    摘要 ( 24 )   在线阅读 ( 9 )   PDF下载 (2388KB) ( 25 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    通过挖掘并利用软件大数据中蕴含的知识来提高软件开发的智能化水平已成为软件工程领域的热点研究问题。然而,对软件开发者及其群体协作方法的研究尚未形成系统化的研究成果。针对此问题,以开发者群体为研究对象,通过深入分析开发者的行为历史数据,研究面向智能协作的关键技术,并以此为基础研制相应的支撑环境。首先,收集并分析了海量的开发者相关数据;第二,给出了软件开发者能力特征模型及其协作关系模型,并构建了开发者知识图谱;第三,以开发者知识图谱为支撑,阐述了基于智能推荐的协作开发方法。基于以上关键技术,研发了相应的支撑工具,并构建了智能协作开发环境系统;最后,对未来的工作进行了展望。

    面向智能化软件开发的开源生态大数据
    张洋, 王涛, 尹刚, 余跃, 黄井泉
    大数据. 2021, 7(1):  0.  doi:10.11959/j.issn.2096-0271.2021007
    摘要 ( 30 )   在线阅读 ( 10 )   PDF下载 (1840KB) ( 21 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    开源软件开发过程中包含大量有价值的数据,针对其数据规模巨大、碎片分散、快速膨胀的特点,研究了软件工程开源生态大数据体系,提出了一种自生长的采集处理框架与汇聚共享环境,阐述了基于软件工程开源生态大数据的智能化软件开发,以及基于软件工程开源生态大数据分析挖掘的典型应用,为面向智能化软件开发的开源生态大数据研究与应用提供相关指导。

    研究
    基于城市交通监控大数据的行程时间估计
    李文明, 刘芳, 吕鹏, 于彦伟
    大数据. 2021, 7(1):  0.  doi:10.11959/j.issn.2096-0271.2021008
    摘要 ( 82 )   在线阅读 ( 20 )   PDF下载 (1940KB) ( 51 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    随着智慧交通的发展,越来越多的监控摄像头被安装在城市道路路口,这使得利用城市交通监控大数据进行车辆行程时间估计和路径查询成为可能。针对城市出行的行程时间估计问题,提出一种基于城市交通监控大数据的行程时间估计方法UTSD。首先,将交通监控摄像头映射到城市路网,并根据交通监控数据记录构建有向加权的城市路网图;然后,针对行程时间估计,构建时空索引和反向索引结构,时空索引用于快速检索所有车辆的摄像头记录,反向索引用于快速获取每辆车辆的行程时间和经过的摄像头轨迹,这两个索引大大提升了数据查询和行程时间估计的效率;最后,基于构建的索引,给出一种有效的行程时间估计和路径查询方法,根据出发时间、出发地和目的地,在时空索引结构上匹配出发地与目的地共有的车辆,再利用反向索引,快速获得行程时间估计与车辆路线。使用某省会城市的真实交通监控大数据进行实验评估,所提方法UTSD的准确率比基于有向图的Dijkstra最短路径算法和百度算法分别提高了65.02%和40.94%,且UTSD在以7天监控数据作为历史数据的情况下,平均查询时间低于0.3 s,验证了所提方法的有效性和高效性。

    应用
    大数据技术在疫情精准防控中的应用
    李刚, 郑佳, 尹华山, 黄文超
    大数据. 2021, 7(1):  0.  doi:10.11959/j.issn.2096-0271.2021009
    摘要 ( 95 )   在线阅读 ( 36 )   PDF下载 (1746KB) ( 78 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    以X市为例,针对超大城市的实际情况,基于大数据处理和分析方法,提出了基于“四标四实”数据建设疫情防控大数据库,并通过大数据技术辅助疫情防控的思路,建立了一套疫情态势实时感知、人员精准管控、企业精准帮扶的系统,对该系统中的数据建设状况和采用的关联规则挖掘算法、基于期望最大化概率聚类的感染预警机制和基于文本挖掘的非结构化数据利用策略等具体技术手段做了详细分析。该系统节约基层人力十余万小时、准确定位并跟踪到了重点人群上万人,为阻断疫情感染、提升企业复工复产率、减少经济损失起到了巨大作用,对各地通过大数据技术辅助疫情防控具有较大的借鉴意义。

    论坛
    数据跨境监管初探
    朱扬勇, 熊贇
    大数据. 2021, 7(1):  0.  doi:10.11959/j.issn.2096-0271.2021010
    摘要 ( 40 )   在线阅读 ( 16 )   PDF下载 (993KB) ( 29 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    随着对数据价值的认识日益增强,数据跨境越来越受到关注。一方面,数据跨境是经济全球化和数字经济发展的必由之路;另一方面,数据跨境有可能危害国家数据安全。因此,需要对必要的、合理的数据跨境和恶意的、有害的数据跨境等进行研究、界定,并制定相应规制。首先分析并给出了当前数据跨境的两种类型和4种渠道,然后提出了基于数据分类的数据跨境监管措施,为数据跨境监管和数据跨境立法提供了支持。

下载排行
点击排行
引用排行