Please wait a minute...

当期目录

      
    专题:大数据创新实践
    结合深度学习的工业大数据应用研究
    李广, 杨欣
    2018, 4(5):  2018046.  doi:10.11959/j.issn.2096-0271.2018046
    摘要 ( 274 )   在线阅读 ( 36 )   PDF下载 (1343KB) ( 356 )   可视化   
    数据和表 | 参考文献 | 相关文章

    如何将大数据等核心技术与智能制造结合,进一步提高产能与质量,并且降低成本,是新一代制造业革新的关键任务。通过一个具体应用案例,即针对工业中常见的机床刀具消耗冗余的问题,提出了基于大数据和人工智能的方法,以准确预测机床刀具的崩刃,从而增加了机床的生产效率,降低了生产成本。相对于以往使用数据统计和传统机器学习进行刀具磨损预测的方法,新方法通过高速电流采集器获取主轴电流值,结合了卷积神经网络的强拟合性和异常检测算法的强泛化能力,对大数据量的电流值进行预测分析,实现了更快的网络收敛及更高的预测准确率和顽健性。

    基于公开数据的特殊人群在线活动特征挖掘
    刘楚楚,吕欣
    2018, 4(5):  2018047.  doi:10.11959/j.issn.2096-0271.2018047
    摘要 ( 147 )   在线阅读 ( 9 )   PDF下载 (2129KB) ( 104 )   可视化   
    数据和表 | 参考文献 | 相关文章

    通过采集百度贴吧中的相关数据,从时间、文本、网络3个维度分析不同人群的在线活动特征,探索社会特殊人群的活动规律和心理状态。研究发现,艾滋病人群在线活动更规律,在线活动的主要目的是了解病情知识、记录日记,对本类型贴吧的关注很集中;男同性恋人群活跃时间晚,大多是为了娱乐交友,对本类型贴吧的关注具有很强的偏好性。总体上,艾滋病人群对自身病情十分关心,但男同性恋人群的艾滋病防护意识还不强。

    基于社会化大数据的音乐文化研究进展
    耿屿,韩筱璞,吕琳媛
    2018, 4(5):  2018048.  doi:10.11959/j.issn.2096-0271.2018048
    摘要 ( 158 )   在线阅读 ( 12 )   PDF下载 (1205KB) ( 126 )   可视化   
    数据和表 | 参考文献 | 相关文章

    随着互联网的普及和技术的发展,一系列在线音乐社区和社交网站陆续出现,为音乐研究提供了大量的社会化数据。结合新兴的大数据分析方法和人工智能手段,研究者在音乐文化研究方面取得了一系列进展,在音乐文化感知、音乐文化社会学、音乐文化传播学等方面建立了大量新的认知,体现了大数据方法在音乐文化研究方面的广泛适用性。阐述了基于社会化大数据的音乐文化研究的进展,并总结了这一领域研究面临的问题与挑战。

    利用网络数据预测企业失信行为
    周涛, 李艳丽, 李倩, 陈端兵, 谢文波, 吴桐, 曾途
    2018, 4(5):  2018049.  doi:10.11959/j.issn.2096-0271.2018049
    摘要 ( 219 )   在线阅读 ( 23 )   PDF下载 (1178KB) ( 245 )   可视化   
    数据和表 | 参考文献 | 相关文章

    传统的企业信用水平分析方法多从企业规模、经营地、行业类别、注册与实缴资本等特征属性出发,缺少基于海量关联数据的深入分析。为了解决这个问题,采集、清洗了大量数据,建立了包含400多万家企业的有向投资网络,其中存在各类失信行为的企业有近26万家。研究结果显示,企业失信行为存在明显的“网络效应”,目标企业的股东或者投资企业若存在失信行为,则目标企业发生失信的风险远远大于平均值。基于此,提出了简单的预测企业失信行为的算法,其精确性远远超过了不考虑网络效应的回归方法。

    在线社交媒体信息冗余现象建模与实证研究
    秦烁,吕欣,孟凡辉,胡延庆
    2018, 4(5):  2018050.  doi:10.11959/j.issn.2096-0271.2018050
    摘要 ( 181 )   在线阅读 ( 2 )   PDF下载 (2003KB) ( 108 )   可视化   
    数据和表 | 参考文献 | 相关文章

    为深入了解社交媒体中的信息冗余现象,定义了一种以个体好友信息发布的重复情况度量信息冗余程度的指标。推导个体在传播过程中出现冗余现象的概率,分析了信息传播率、网络密度、集群系数对信息冗余的影响;通过新浪微博的实际数据观察了冗余信息的扩散特点,并从营销的角度探讨了信息冗余在广告推广和产品营销方面的意义。研究结果为进一步了解在线社交媒体的信息扩散特征提供了新的视角。

    研究
    工业大数据分析综述:模型与算法
    王宏志, 梁志宇, 李建中, 高宏
    2018, 4(5):  2018051.  doi:10.11959/j.issn.2096-0271.2018051
    摘要 ( 446 )   在线阅读 ( 62 )   PDF下载 (998KB) ( 604 )   可视化   
    参考文献 | 相关文章

    随着条形码、二维码、RFID、工业传感器、自动控制系统、工业互联网、ERP、CAD/CAM/CAE等信息技术在工业领域的广泛应用,大量与工业生产活动相关的数据被实时采集并存储到企业的信息系统中。对这些数据进行分析,有助于改进生产工艺、提高生产效率、降低生产成本,为实现智能制造奠定基础。因此,工业大数据分析引起了工业界和学术界的广泛关注。模型和算法是大数据分析理论和技术中的两个核心问题。介绍了工业大数据分析的基本概念,综述了几种流行的工业大数据分析模型在工业大数据分析领域的应用情况以及相应求解算法方面的研究成果,并探索了大数据分析模型和算法的未来研究方向。

    基于密度的停留点识别方法
    李毓瑞,陈红梅,王丽珍,肖清
    2018, 4(5):  2018052.  doi:10.11959/j.issn.2096-0271.2018052
    摘要 ( 115 )   在线阅读 ( 8 )   PDF下载 (1647KB) ( 142 )   可视化   
    数据和表 | 参考文献 | 相关文章

    从GPS轨迹点序列中识别停留点,是轨迹分析的重要预处理步骤,是用户行为分析、个性化兴趣点推荐等位置服务的基础,停留点识别方法的识别能力对位置服务的可用性和可靠性有根本性的影响。针对现有方法未考虑轨迹点的时间连续性或仅考虑时间连续性的一个方向所导致的停留点识别能力不足的问题,提出一种新的基于密度的停留点识别方法。该方法考虑了轨迹点的时空聚集,兼顾了轨迹点的时间连续性和方向性。在GeoLife数据集上的实验结果验证了该方法的识别能力强于基准方法,可以进一步识别基准方法不能识别的两类停留点。

    应用
    DeepEye:一个基于深度学习的程序化交易识别与分类方法
    徐广斌,张伟
    2018, 4(5):  2018053.  doi:10.11959/j.issn.2096-0271.2018053
    摘要 ( 282 )   在线阅读 ( 19 )   PDF下载 (1160KB) ( 202 )   可视化   
    数据和表 | 参考文献 | 相关文章

    基于沪市A股交易数据,对A股市场程序化交易行为进行系统分析,构建程序化交易识别及分类特征指标体系,结合深度学习技术提出A股市场程序化交易的智能识别与分类方法——DeepEye,该方法可对程序化交易进行识别并分类。在真实交易行为数据集上的实验表明,所提出的方法在识别和分类上取得了较高的准确率,验证了将深度学习用于证券市场行为监管的可行性和有效性。该方法已辅助用于资本市场投资者画像及市场一线行为监管。

    专栏:大数据领域国家工程实验室
    大数据系统软件创新平台与生态建设
    王建民,王晨,刘英博,刘璘
    2018, 4(5):  2018054.  doi:10.11959/j.issn.2096-0271.2018054
    摘要 ( 319 )   在线阅读 ( 24 )   PDF下载 (1720KB) ( 246 )   可视化   
    数据和表 | 参考文献 | 相关文章

    针对大数据系统软件开源生态发展现状、大数据系统软件技术与领域应用发展的迫切需求与工程化瓶颈,系统地介绍了大数据系统软件共性技术的研发思路以及大数据系统软件国家工程验室研制的“数为平台”的技术架构,包括大规模多源异构数据的一体化管理、异构数据的交互式分析框架、数据可视化与智能数据工程、大数据混源软件可信验证、领域大数据应用开发与运行环境等。给出了基于平台建设开放的大数据软件创新平台与生态的模式,并在工业制造业、气象环保服务领域开展应用示范。

下载排行
点击排行
引用排行