Please wait a minute...

当期目录

      
    专题
    面向大数据的并行聚类算法在股票板块划分中的应用
    海沫,牛怡晗,张悦今
    2015, 1(4):  2015036.  doi:10.11959/j.issn.2096-0271.2015036
    摘要 ( 241 )   在线阅读 ( 5 )   PDF下载 (1124KB) ( 380 )   可视化   
    数据和表 | 参考文献 | 相关文章

    上市公司的经营业绩在一定程度上反映股票的投资价值,因此以反映上市公司盈利能力、偿债能力、成长能力、资产管理质量及股东获利能力5个方面共15项财务指标作为股票投资价值的衡量指标,首次尝试使用面向大数据的并行聚类算法Mahout中的K-means聚类算法和模糊K-means聚类算法对中国A股市场约2 600支股票依据其财务指标进行聚类,以便进行股票板块的划分,并比较两种算法在不同距离度量方式下的迭代次数、执行时间、聚类间密度和聚类内密度。实验结果表明,谷本距离度量方式下的K-means算法聚类效果最好,因此可将该实验结果作为最终股票板块划分结果进行分析,从而为投资决策提供参考。

    基于大数据技术的P2P网贷平台风险预警模型
    林春雨,李崇纲,许方圆,许会泉,石磊,卢祥虎
    2015, 1(4):  2015037.  doi:10.11959/j.issn.2096-0271.2015037
    摘要 ( 357 )   在线阅读 ( 5 )   PDF下载 (1369KB) ( 361 )   可视化   
    数据和表 | 参考文献 | 相关文章

    近几年,我国P2P网贷行业在高速发展的过程中出现了大量的“失联跑路”事件。为此,基于P2P网贷及大数据相关概念的深入剖析,创新性地将平台的风险预警与大数据技术结合,通过对海量数据采集、Spark分布式平台计算、机器学习建模等大数据技术的整合,构建一个有效的P2P网贷平台风险预警模型。该模型在多维度风险评价指标的基础之上,可以实现对网贷平台风险的实时、精准、全面监测,从而有效降低平台集资诈骗、恶意跑路等恶意事件的发生频率,维护广大投资人的资金安全及社会稳定。

    面向国防安全的网络大数据分析与应用系统
    许洪波,陈波
    2015, 1(4):  2015038.  doi:10.11959/j.issn.2096-0271.2015038
    摘要 ( 183 )   在线阅读 ( 1 )   PDF下载 (1080KB) ( 299 )   可视化   
    数据和表 | 参考文献 | 相关文章

    在调研国内外大数据分析与应用研究现状的基础上,针对国防安全领域现有业务体系中存在的数据碎片化、不规范、难共享等突出问题,提出面向国防安全的网络大数据分析与应用方案,将国防安全现实需求与大数据技术有机结合,既能够发挥大数据技术在多源异构数据融合、深层次安全信息挖掘、打破信息孤岛实现广泛共享等方面的优势,又能够适应现有的业务体系,快速产生实际效果。最后,对面向国防安全的网络大数据挖掘和分析相关技术进行了系统性介绍。

    基于统计学习的网络异常行为检测技术
    周涛
    2015, 1(4):  2015039.  doi:10.11959/j.issn.2096-0271.2015039
    摘要 ( 440 )   在线阅读 ( 16 )   PDF下载 (1339KB) ( 931 )   可视化   
    数据和表 | 参考文献 | 相关文章

    高级持续性威胁(APT)已经成为企业级安全用户的首要安全威胁。传统基于特征检测、边界防护的安全防范措施在应对APT攻击时存在不足。为此,介绍了网络异常行为检测方法的现状;分析了基于统计学习的检测方法的技术路线和体系架构,并以命令控制通道、获取行为等APT攻击中的典型环节为例,介绍了相关的参数提取和统计分析建模方法;总结了基于大数据的异常行为检测的特点,并指出了后续研究方向。

    面向科技情报的互联网信息源自动发现技术
    高辉,陈钧,牛海波,罗威
    2015, 1(4):  2015040.  doi:10.11959/j.issn.2096-0271.2015040
    摘要 ( 144 )   在线阅读 ( 0 )   PDF下载 (1249KB) ( 238 )   可视化   
    数据和表 | 参考文献 | 相关文章

    自动获取高质量互联网信息源是科技情报工作的一项基础性研究内容。以网站/网页类信息源和Twitter信息源为研究对象,基于共引关系以及关注关系和文本内容,分别提出了两类信息源的自动发现方法,并面向科技情报领域进行了实验。对信息源自动发现技术应用形式进行了研究,分析了科技情报工作对信息源服务的具体要求,提出了3类应用场景。

    研究
    大数据时代的数据挖掘——从应用的角度看大数据挖掘
    李涛,曾春秋,周武柏,周绮凤,郑理
    2015, 1(4):  2015041.  doi:10.11959/j.issn.2096-0271.2015041
    摘要 ( 1263 )   在线阅读 ( 180 )   PDF下载 (4764KB) ( 1051 )   可视化   
    数据和表 | 参考文献 | 相关文章

    介绍了大数据时代数据挖掘的特点、任务及难点,分析了大数据挖掘的核心架构,提出大数据的核心和本质,即应用、算法、数据和平台4个要素的有机结合。在此基础上介绍了本团队研究设计的大数据挖掘系统FIU-Miner。该系统是一个用户友好并支持在分布式环境中进行高效率计算和算法快速集成的数据挖掘系统平台,使得数据分析人员能够快速有效地进行各类数据挖掘任务。最后,介绍了基于FIU-Miner的3个典型的成功应用案例:高端制造业数据挖掘、空间数据挖掘和商务智能数据挖掘。

    城市交通大数据技术及智能应用系统
    熊刚, 董西松, 朱凤华, 季统凯
    2015, 1(4):  2015042.  doi:10.11959/j.issn.2096-0271.2015042
    摘要 ( 638 )   在线阅读 ( 4 )   PDF下载 (2635KB) ( 444 )   可视化   
    数据和表 | 参考文献 | 相关文章

    城市交通大数据具有种类繁多、异质性、时空尺度跨越大、动态多变、高度随机性、局部性和生命周期较短等特征,如何有效地采集和利用交通大数据,满足高时效性的交通行政监管、交通企业经营管理、交通市民服务等应用需求,是城市交通和智慧城市面临的前所未有的机遇和挑战。重点分析总结了城市交通大数据的若干研究内容及核心技术,提出了城市交通大数据智能应用系统解决方案,列举了几种典型应用,在城市交通和智慧城市领域的大数据研发和应用领域进行了初步探讨。

    应用
    基于电力运营大数据分析实现节能减排
    方世清
    2015, 1(4):  2015043.  doi:10.11959/j.issn.2096-0271.2015043
    摘要 ( 161 )   在线阅读 ( 4 )   PDF下载 (1552KB) ( 318 )   可视化   
    数据和表 | 参考文献 | 相关文章

    研究解决全国火电机组出力系数普遍较低,旋转备用率偏大的问题。通过对近年来安徽电网发电、用电负荷特性数据以及2014年全国大机组竞赛的大量数据进行挖掘和分析,提出了解决问题的几个方案:一是优化电力调度,减少机组在网运行时间;二是增加机组利用小时;三是优化机组设计,降低主辅设备出力富裕度,按IEC标准定义湿冷机组的铭牌;四是发电集团内部机组电量分配优化;五是国家能源局修订电量偏差不大于2%的监管政策。据此可大幅提高火电机组的出力系数,降低旋转备用率和发电煤耗,减少主要污染物排放量,实现企业经济效益和社会效益双丰收。

    前沿
    动态
下载排行
点击排行
引用排行