全文下载排行

    一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

    当前位置: 全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 《欧盟数据保护通用条例》详解
    王融
    大数据    2016, 2 (4): 2016045-.   DOI: 10.11959/j.issn.2096-0271.2016045
    摘要513)   HTML30)    PDF(pc) (958KB)(3078)    可视化    收藏

    《欧盟数据保护通用条例》于2018年 5月25日正式生效。为踏上数字时代新秩序的起跑线,全球企业都在积极准备合规工作。全面梳理其带来的重大变化,既为企业提供参考,也为我国政府考虑大数据背景下的数据保护规则提供新视角。

    参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(8)
    2. 数据管理能力成熟度模型
    李冰,宾军志
    大数据    2017, 3 (4): 29-36.   DOI: 10.11959/j.issn.2096-0271.2017039
    摘要594)   HTML55)    PDF(pc) (1203KB)(2375)    可视化    收藏

    为促进大数据产业持续深入发展,提高政府、企事业单位大数据资产管理意识,借鉴国内外成熟度相关理论思想,结合数据生命周期管理各个阶段的特征,对数据管理能力进行了分析、总结,提炼出组织数据管理的八大过程域,并对每项能力进行了二级过程域和发展等级的划分以及相关功能介绍和评定标准的制定。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(1)
    3. 基于电子病历的临床医疗大数据挖掘流程与方法
    阮彤,高炬,冯东雷,钱夕元,王婷,孙程琳
    大数据    2017, 3 (5): 2017054-.   DOI: 10.11959/j.issn.2096-0271.2017054
    摘要985)   HTML34)    PDF(pc) (2153KB)(2094)    可视化    收藏

    以医院电子病历为核心的临床数据记录了病人的疾病、诊断和治疗信息。挖掘此类数据,可以辅助医生进行临床科研与临床诊疗。首先提出了临床大数据挖掘过程中碰到的各项难题,总结了临床医疗大数据挖掘的核心流程,流程包括以临床数据集成、基于知识图谱的临床专病库的构建过程、电子病历数据质量的评估方法以及以临床疗效分析与疾病预测为核心的临床医疗大数据应用等任务,进而对流程中的每个任务提出了解决方案,给出了实验结果。最后,展望了未来临床电子病历挖掘应用和技术的发展。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(3)
    4. 大数据隐私保护技术综述
    方滨兴,贾焰,李爱平,江荣
    大数据    2016, 2 (1): 2016001-.   DOI: 10.11959/j.issn.2096-0271.2016001
    摘要1234)   HTML94)    PDF(pc) (1420KB)(2083)    可视化    收藏

    大数据分析带来的隐私泄露问题日趋严重,如何在利用大数据为各行各业服务的同时,保护隐私数据和防止敏感信息泄露成为新的挑战。大数据具有规模大、来源多、动态更新等特点,传统的隐私保护技术大都已不再适用。为此,给出了大数据时代的隐私概念和生命周期保护模型;从大数据生命周期的发布、存储、分析和使用4个阶段出发,对大数据隐私保护中的技术现状进行了分类阐述,并对各技术的优缺点、适用范围等进行分析;对大数据隐私保护技术发展的方向和趋势进行了阐述。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(25)
    5. 基于HBase+ElasticSearch的海量交通数据实时存取方案设计
    董长青,任女尔,张庆余,田玉靖
    大数据    2017, 3 (1): 2017010-.   DOI: 10.11959/j.issn.2096-0271.2017010
    摘要733)   HTML45)    PDF(pc) (1487KB)(1955)    可视化    收藏

    交通流数据具有数据海量、存储和交互速率快等特征,因此其数据的采集、存储及检索成为了车辆远程监控平台中的关键问题。采用LVS集群技术进行数据采集负载均衡,队列缓存处理I/O时延,HBase进行分布式数据存储;针对Hadoop实时在线数据处理不足的问题,整合ElasticSearch并构建了分层索引。通过关键技术的设计和实现,车辆监控由400辆扩展到上万辆,PB级数据在线查询速度提升了10~20倍,验证了方案的高效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(3)
    6. 基于外卖物流配送大数据的调度系统
    蒋凡,徐明泉,崔代锐
    大数据    2017, 3 (1): 2017013-.   DOI: 10.11959/j.issn.2096-0271.2017013
    摘要292)   HTML22)    PDF(pc) (4034KB)(1789)    可视化    收藏
    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(5)
    7. 从全生命周期管理角度看大数据安全技术研究
    李树栋,贾焰,吴晓波,李爱平,杨小东,赵大伟
    大数据    2017, 3 (5): 2017047-.   DOI: 10.11959/j.issn.2096-0271.2017047
    摘要1154)   HTML24)    PDF(pc) (1537KB)(1739)    可视化    收藏

    数据信息在生产、存储、使用、传输、共享、销毁等环节暴露出的大数据安全问题突出,成为了制约大数据应用发展的瓶颈。总结了世界各国的大数据安全发展战略;从大数据的全生命周期管理角度出发,重点聚焦于大数据的收集、存储、传输、使用、开放(访问控制、共享安全与隐私保护)、销毁和管理策略(体系和标准建设)等阶段,对当前大数据安全防护技术的研究现状和趋势进行阐述。给出了未来大数据安全技术研究需要解决的几个新问题。

    图表 | 参考文献 | 相关文章 | 多维度评价
    8. 基于HBase的海量GIS数据分布式处理实践
    李雪梅,邢俊峰,刘大伟,王海洋,刘玮
    大数据    2016, 2 (3): 2016032-.   DOI: 10.11959/j.issn.2096-0271.2016032
    摘要382)   HTML10)    PDF(pc) (1857KB)(1468)    可视化    收藏

    设计了一种基于分布式数据库HBase的GIS数据管理系统。系统优化了栅格数据的生成和存储过程,将海量栅格数据直接写入HBase存储、索引。同时,针对矢量空间数据的存储、索引与检索,提出了一种新的rowkey设计,既考虑经纬度,又考虑空间数据类型和属性,使得在按空间位置检索矢量地理信息时,能通过HBase的rowkey迅速定位需要返回的数据。在HBase的集群环境上用真实GIS数据对上述方法进行了验证,结果表明,提出的系统具有较高的海量数据存储和检索性能,实现了海量地理信息数据的高效存储和实时高速检索。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(3)
    9. 深度学习在化学信息学中的应用
    徐优俊,裴剑锋
    大数据    2017, 3 (2): 2017019-.   DOI: 10.11959/j.issn.2096-0271.2017019
    摘要576)   HTML10)    PDF(pc) (2011KB)(1273)    可视化    收藏

    深度学习在计算机视觉、语音识别和自然语言处理三大领域中取得了巨大的成功,带动了人工智能的快速发展。将深度学习的关键技术应用于化学信息学,能够加快实现化学信息处理的人工智能化。化合物结构与性质的定量关系研究是化学信息学的主要任务之一,着重介绍各类深度学习框架(深层神经网络、卷积神经网络、循环或递归神经网络)应用于化合物定量构效关系模型的研究进展,并针对深度学习在化学信息学中的应用进行了展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(1)
    10. 大数据时代的数据挖掘——从应用的角度看大数据挖掘
    李涛,曾春秋,周武柏,周绮凤,郑理
    大数据    2015, 1 (4): 2015041-.   DOI: 10.11959/j.issn.2096-0271.2015041
    摘要1263)   HTML180)    PDF(pc) (4764KB)(1051)    可视化    收藏

    介绍了大数据时代数据挖掘的特点、任务及难点,分析了大数据挖掘的核心架构,提出大数据的核心和本质,即应用、算法、数据和平台4个要素的有机结合。在此基础上介绍了本团队研究设计的大数据挖掘系统FIU-Miner。该系统是一个用户友好并支持在分布式环境中进行高效率计算和算法快速集成的数据挖掘系统平台,使得数据分析人员能够快速有效地进行各类数据挖掘任务。最后,介绍了基于FIU-Miner的3个典型的成功应用案例:高端制造业数据挖掘、空间数据挖掘和商务智能数据挖掘。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(30)
    11. 医疗健康大数据:应用实例与系统分析
    董诚,林立,金海,廖小飞
    大数据    2015, 1 (2): 2015021-.   DOI: 10.11959/j.issn.2096-0271.2015021
    摘要661)   HTML74)    PDF(pc) (1263KB)(1041)    可视化    收藏

    从大数据和医疗健康大数据的介绍出发,首先阐述了医疗健康行业所面临的挑战和大数据对医疗健康行业的促进作用;然后介绍了大数据和医疗健康行业的背景知识;之后举例说明了大数据在医疗健康行业的应用以及医疗健康大数据系统和关键技术。

    图表 | 参考文献 | 相关文章 | 多维度评价
    12. 智慧城市多源异构大数据处理框架
    刘岩,王华,秦叶阳,朱兴杰
    大数据    2017, 3 (1): 2017007-.   DOI: 10.11959/j.issn.2096-0271.2017007
    摘要512)   HTML28)    PDF(pc) (1966KB)(993)    可视化    收藏

    智慧城市建设的重心已由传统IT系统和信息资源共享建设,转变为数据的深度挖掘利用和数据资产的运营流通。大数据中心是数据资产管理和利用的实体基础,其核心驱动引擎是大数据平台及各类数据挖掘与分析系统。讨论了智慧城市大数据中心建设的功能架构,围绕城市多源异构数据处理的实际需要,对数据中心大数据平台的架构进行了拆分讲解,并以视频大数据处理为例,阐述了数据中心中大数据平台的运转流程。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(5)
    13. 基于统计学习的网络异常行为检测技术
    周涛
    大数据    2015, 1 (4): 2015039-.   DOI: 10.11959/j.issn.2096-0271.2015039
    摘要440)   HTML16)    PDF(pc) (1339KB)(931)    可视化    收藏

    高级持续性威胁(APT)已经成为企业级安全用户的首要安全威胁。传统基于特征检测、边界防护的安全防范措施在应对APT攻击时存在不足。为此,介绍了网络异常行为检测方法的现状;分析了基于统计学习的检测方法的技术路线和体系架构,并以命令控制通道、获取行为等APT攻击中的典型环节为例,介绍了相关的参数提取和统计分析建模方法;总结了基于大数据的异常行为检测的特点,并指出了后续研究方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(8)
    14. 大数据标准体系
    张群,吴东亚,赵菁华
    大数据    2017, 3 (4): 11-19.   DOI: 10.11959/j.issn.2096-0271.2017037
    摘要1419)   HTML40)    PDF(pc) (1122KB)(926)    可视化    收藏

    随着大数据的发展,标准化的内容越来越广,标准化的对象也越来越复杂。系统地分析了国内外大数据标准化工作现状,结合《促进大数据发展行动纲要》、中华人民共和国国民经济和社会发展第十三个五年规划纲要等国家战略以及大数据产业发展对标准化工作的需求,分析我国大数据标准化工作面临的问题,描述了大数据参考架构,提出大数据标准体系框架,给出了未来的工作建议。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(3)
    15. 个人信息去标识化框架及标准化
    谢安明,金涛,周涛
    大数据    2017, 3 (5): 2017048-.   DOI: 10.11959/j.issn.2096-0271.2017048
    摘要385)   HTML8)    PDF(pc) (1343KB)(903)    可视化    收藏

    随着大数据的发展,个人信息保护面临严峻的安全形势,去标识化有助于平衡个人信息保护要求和数据共享利用需求。分析了国内外去标识化研究现状,结合我国法律有关要求和个人信息保护的迫切需求,提出了个人信息去标识化框架,给出了规范化的去标识化过程指南。考虑到相关工作的推进,结合大数据安全标准体系,提出了去标识化标准规范研究建议。

    图表 | 参考文献 | 相关文章 | 多维度评价
    16. 区块链与分享型数据库
    钱卫宁, 金澈清, 邵奇峰, 周傲英
    大数据    2018, 4 (1): 2018004-.   DOI: 10.11959/j.issn.2096-0271.2018004
    摘要896)   HTML180)    PDF(pc) (1180KB)(878)    可视化    收藏

    区块链可以实现无中心、高可信的账本管理,成功支撑了比特币等金融领域应用发展。区块链的本质是在不完全可信环境中的可信数据管理,它具有去中心化、防篡改、强一致和完整性等特性。同时,区块链也存在着数据管理功能弱、性能低等问题。通过对比区块链和传统数据管理技术,分析3个典型的金融领域以外的区块链应用,探讨区块链上新的研究问题,并讨论面向特定领域应用,研发分享型数据库系统(即支持核心业务,支撑分享经济业务模式,甚至本身也是以分享经济的方式实现的数据库)的必要性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    17. 政府大数据治理的挑战及对策
    范灵俊,洪学海,黄晁,华岗,李国杰
    大数据    2016, 2 (3): 2016028-.   DOI: 10.11959/j.issn.2096-0271.2016028
    摘要314)   HTML9)    PDF(pc) (1224KB)(825)    可视化    收藏

    大数据是城市智慧的“来源”,利用好大数据可以有效缓解或解决城市发展中的诸多问题。政府部门掌握的大数据关系国计民生,与公众生活息息相关,是高价值密度的数据,如何治理和利用政府大数据,是智慧城市建设的核心问题之一。以宁波市政府大数据为例,阐述了政府大数据治理面临的挑战,包括政府数据内部共享的需求和障碍、政府数据对外开放和利用的问题等,同时给出了相应的对策及建议。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(21)
    18. 网络表示学习
    陈维政,张岩,李晓明
    大数据    2015, 1 (3): 2015025-.   DOI: 10.11959/j.issn.2096-0271.2015025
    摘要432)   HTML1)    PDF(pc) (1864KB)(804)    可视化    收藏

    以Facebook、Twitter、微信和微博为代表的大型在线社会网络不断发展,产生了海量体现网络结构的数据。采用机器学习技术对网络数据进行分析的一个重要问题是如何对数据进行表示。首先介绍了网络表示学习的研究背景和相关定义。然后按照算法类别,介绍了当前5类主要的网络表示学习算法,特别地,对基于深度学习的网络表示学习技术进行了详细的介绍。之后讨论了网络表示学习的评测方法和应用场景。最后,探讨了网络表示学习的研究前景。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(4)
    19. 海洋大数据关键技术及在灾害天气下船舶行为预测上的应用
    王冬海,卢峰,方晓蓉,郭刚
    大数据    2017, 3 (4): 81-90.   DOI: 10.11959/j.issn.2096-0271.2017044
    摘要318)   HTML11)    PDF(pc) (1498KB)(804)    可视化    收藏

    随着海洋数据量的爆炸式增长,海洋大数据受到越来越多的关注。主要分析和总结了当前海洋大数据的研究现状和关键技术,聚焦了机器学习在海洋大数据中的模型预测研究的实例,对海上船舶在灾害天气(台风)下的行为进行了回归训练和预测。通过构建和对比决策树、Bagging、随机森林等多种机器学习算法,对样本数据进行学习、预测和检验评估。最终结果表明,随机森林方法在灾害天气下船舶密度的预测应用中具有良好和稳健的效果。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(2)
    20. 信用评分基本理论及其应用
    石勇,孟凡
    大数据    2017, 3 (1): 2017003-.   DOI: 10.11959/j.issn.2096-0271.2017003
    摘要645)   HTML25)    PDF(pc) (905KB)(767)    可视化    收藏

    信用评分是市场交易的基础,以大数据分析与挖掘为支撑的现代信用评分系统在当今全球经济发展中起着不可估量的作用。各行业与领域的信用评分系统将成为实现我国“十三五”规划中国家大数据战略的首要目标。主要介绍了金融信用评分系统的发展、相关技术、应用案例,并对大数据信用评分的发展进行了展望。

    参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(9)
    21. 工业大数据技术综述
    王建民
    大数据    2017, 3 (6): 2017057-.   DOI: 10.11959/j.issn.2096-0271.2017057
    摘要780)   HTML29)    PDF(pc) (3414KB)(757)    可视化    收藏

    工业大数据是工业数据的总称,包括信息化数据、物联网数据以及跨界数据,是工业互联网的核心要素。分析了工业大数据的发展背景和主体来源,剖析了工业大数据、企业信息化和工业互联网之间的相互关系,阐述了工业大数据“多模态、高通量、强关联”的数据特点以及“跨尺度、产业链、跨界”多源数据融合的应用特点,探讨了工业大数据软件系统架构,给出了制造环节的大数据应用实例。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(4)
    22. 大数据环境下的管理信息系统发展研究
    杨丽彬,李海林,张飞波
    大数据    2016, 2 (1): 2016010-.   DOI: 10.11959/j.issn.2096-0271.2016010
    摘要845)   HTML27)    PDF(pc) (1068KB)(735)    可视化    收藏

    大数据时代的到来给管理信息系统带来了一定的冲击和挑战,因此有必要研究大数据对现代管理信息系统的作用及影响,使得管理信息系统的性能和社会服务作用得到进一步提升。首先从数据的内涵与特征来理解大数据的概念,接着从数据处理过程的角度来讲述大数据对管理信息系统业务流程的变化和影响,同时,从管理信息系统的构成来解析大数据对于管理信息系统的推动与发展作用。最后,针对基于大数据环境下的信息安全和信息人才短缺等问题进行了探讨,并提出了相关的解决方案。

    参考文献 | 相关文章 | 多维度评价
    23. 百度大数据应用与实践
    陈尚义
    大数据    2015, 1 (1): 2015009-.   DOI: 10.11959/j.issn.2096-0271.2015009
    摘要283)   HTML12)    PDF(pc) (3416KB)(724)    可视化    收藏

    产生于互联网的大数据应用,现阶段正在向其他行业领域渗透,成为行业创新和转型的重要驱动力。根据百度多年来在大数据领域的创新与实践,阐述了大数据驱动搜索引擎的发展,介绍了百度大数据引擎和行业应用实践。重点分析了大数据发展的关键因素,并提出了大数据和人工智能是未来信息技术发展的重要方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(20)
    24. 边缘智能:边缘计算与人工智能融合的新范式
    周知,于帅,陈旭
    大数据    2019, 5 (2): 0-.   DOI: 10.11959/j.issn.2096-0271.2019013
    摘要415)   HTML69)    PDF(pc) (2589KB)(695)    可视化    收藏

    边缘计算与人工智能这两种高速发展的新技术之间存在着彼此赋能的巨大潜力。通过3个研究案例,展示协同边缘计算和人工智能这两种技术如何促进各自的进一步发展。从边缘计算赋能人工智能的维度,针对深度学习模型在网络边缘侧的部署,提出了基于边端协同的深度学习按需加速框架,通过协同优化模型分割和模型精简策略,实现时延约束下的高精度模型推理。从人工智能赋能边缘计算的维度,针对边缘计算服务的放置问题,提出了基于在线学习的自适应边缘服务放置机制和基于因子图模型的预测性边缘服务迁移方法。

    图表 | 参考文献 | 相关文章 | 多维度评价
    25. 区块链在数据流通中的应用
    闫树,卿苏德,魏凯
    大数据    2018, 4 (1): 2018001-.   DOI: 10.11959/j.issn.2096-0271.2018001
    摘要932)   HTML38)    PDF(pc) (1235KB)(689)    可视化    收藏

    大数据的流通是创造数据价值的关键一环,然而目前数据流通面临着诸多问题。区块链是一种分布式账本技术,具有去中心化和不可篡改特性,可以解决数据流通过程中的一些痛点问题。介绍了区块链技术的特性,阐述了利用区块链改造授权存证环节、进行数据溯源和实现智能合约的主要思路,梳理了实现数据流通的整体架构。在此基础上,给出了国外利用区块链进行数据流通的应用实例,并介绍了一些其他的数据流通新技术。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(5)
    26. 我国大数据征信的挑战及对策
    李友元,寇纲
    大数据    2017, 3 (1): 2017004-.   DOI: 10.11959/j.issn.2096-0271.2017004
    摘要585)   HTML11)    PDF(pc) (867KB)(689)    可视化    收藏

    大数据征信能够满足缺乏或没有信贷记录人群的金融需求,是传统征信的有益补充。发展好大数据征信对于实现普惠金融,促进我国社会信用体系建设有着重要的意义。阐述了美国和我国大数据征信的发展现状,总结了大数据征信的特点,探讨了我国大数据征信存在的不足以及面临的挑战。最后提出相应的对策及建议。

    参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(3)
    27. 基于区块链的供应链金融服务平台
    马小峰,杜明晓,余文兵,王意
    大数据    2018, 4 (1): 2018002-.   DOI: 10.11959/j.issn.2096-0271.2018002
    摘要1352)   HTML39)    PDF(pc) (1527KB)(682)    可视化    收藏

    区块链具有去中心化、稳定安全和防篡改的特点,随着区块链技术的进一步完善与应用,区块链将与金融、医疗、物流等传统行业结合。这将会颠覆部分行业中现有的运作模式,重构一张价值传递的网络。在供应链金融领域进行了区块链应用的探索,构建了一个基于联盟型区块链的供应链金融服务平台。该平台将区块链技术与传统系统结合,为供应链上的各方提供了更加便捷的融资方式,提高了供应链的透明度、可追溯性和安全性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    28. 群智大数据:感知、优选与理解
    郭斌,翟书颖,於志文,周兴社
    大数据    2017, 3 (5): 2017052-.   DOI: 10.11959/j.issn.2096-0271.2017052
    摘要318)   HTML7)    PDF(pc) (2035KB)(681)    可视化    收藏

    移动群智感知是一种新的大规模感知模式,它利用随身携带的智能移动终端(智能手机、可穿戴设备等)形成大规模、随时随地且与人们日常生活密切相关的感知系统。通过广大用户参与获取的感知数据具有多模态、富内容、时空性、人本性等特征。以群智大数据为目标对象,就其感知、优选和理解等关键问题进行阐述和探讨,并对笔者在该领域的最新研究成果进行介绍。

    图表 | 参考文献 | 相关文章 | 多维度评价
    29. 区块链交易数据隐私保护机制
    祝烈煌, 董慧, 沈蒙
    大数据    2018, 4 (1): 2018005-.   DOI: 10.11959/j.issn.2096-0271.2018005
    摘要976)   HTML36)    PDF(pc) (1160KB)(675)    可视化    收藏

    区块链技术是一种去中心化、去信任化、公开透明的分布式数据存储技术,能够降低信任成本,实现安全可靠的数据交互。然而,攻击者可以轻易地从公开的全局账本中获得所有数据,并通过大数据分析技术挖掘用户交易规律等隐私信息。分析区块链交易数据面临的隐私泄露威胁,描述基于数据分析的攻击方法;介绍以混币机制为代表的交易数据隐私保护机制,简要描述各种混币方法的基本原理,并针对混币过程是否需要中心节点参与的问题分析不同混币机制的优势与缺陷;最后,分析了现有区块链数据隐私保护技术中存在的不足,并展望未来的发展方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    30. 大数据与推荐系统
    李翠平,蓝梦微,邹本友,王绍卿,赵衎衎
    大数据    2015, 1 (3): 2015026-.   DOI: 10.11959/j.issn.2096-0271.2015026
    摘要868)   HTML17)    PDF(pc) (1151KB)(672)    可视化    收藏

    随着大数据时代的来临,网络中的信息量呈现指数式增长,随之带来了信息过载问题。推荐系统是解决信息过载最有效的方式之一,大数据推荐系统已经逐渐成为信息领域的研究热点。介绍了推荐系统的产生及其在大数据时代的发展现状、推荐系统的领域需求和系统架构、大数据环境下推荐系统的挑战及其关键技术、开源的大数据推荐软件、大数据推荐系统研究面临的问题,最后探讨了大数据推荐系统的未来发展趋势。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(14)
    31. 基于大数据的京沪人口流动流量、流向新变化
    周晓津,姚阳
    大数据    2016, 2 (3): 2016030-.   DOI: 10.11959/j.issn.2096-0271.2016030
    摘要323)   HTML6)    PDF(pc) (1137KB)(654)    可视化    收藏

    位置大数据为人口流动流量、流向及其变化研究提供了条件,大数据人口推断比人口普查更加精准且成本大幅度降低。基于大数据的人口流动分析表明,2015年末北京、上海外来人口规模稳中有降,外来人口来源构成与2010年全国第六次人口普查相比也发生了较大变化,来自于邻近省份的外来人口增加。在加快实施国家大数据战略的背景下,应加快共享公共数据,推进人口流动大数据研究,以尽快构建基于大数据的国家人口基础信息库。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(2)
    32. 大数据及其隐私保护
    方贤进,肖亚飞,杨高明
    大数据    2017, 3 (5): 2017051-.   DOI: 10.11959/j.issn.2096-0271.2017051
    摘要232)   HTML6)    PDF(pc) (1722KB)(646)    可视化    收藏

    在对大数据进行发布或数据挖掘的过程中,隐私泄露是人们最关心的问题,但目前关于大数据隐私保护的研究还处在初级阶段。介绍了有关隐私保护系统的基础知识,包括数据参与角色与数据操作的定义,给出了隐私保护系统的数学描述与隐私度量方法,分析了隐私保护的数学模型,包括k-匿名模型与差分隐私模型。回顾了基于位置服务的隐私保护及其应用,总结了大数据时代隐私保护的挑战与机遇,指出了用于改进现有隐私保护方法的研究方向,以满足大数据前所未有的各种计算需求。

    图表 | 参考文献 | 相关文章 | 多维度评价
    33. 高通量DNA测序数据的生物信息学方法
    詹晓娟,姚登举,朱怀球
    大数据    2016, 2 (2): 2016021-.   DOI: 10.11959/j.issn.2096-0271.2016021
    摘要339)   HTML8)    PDF(pc) (1227KB)(642)    可视化    收藏

    高通量测序技术产生的DNA序列数据长度较短,而且数据量非常巨大。分析了高通量测序环境下大数据的挑战和机遇,总结并讨论了数据压缩、宏基因组数据序列拼接、宏基因组数据序列分析方面的算法和工具等研究成果。最后,展望了高通量测序下DNA短读序列数据研究的发展趋势。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(4)
    34. 基于RDMA高速网络的高性能分布式系统
    魏星达,陈榕,陈海波
    大数据    2018, 4 (4): 2018036-.   DOI: 10.11959/j.issn.2096-0271.2018036
    摘要965)   HTML25)    PDF(pc) (1687KB)(637)    可视化    收藏

    高速的RDMA网络设备已经被广泛部署在现代数据中心。RDMA可以从两方面加速分布式系统:首先可以提供一种快速的消息处理机制,其次RDMA提供了新的硬件原语。这极大地提升了处理器的利用率以及对RDMA的使用率,但是需要重新设计系统。介绍了RDMA的研究进展,概述了近年来利用RDMA加速分布式系统的工作,包括基于RDMA重新设计的系统以及如何更好地利用RDMA的设计,并给出了未来的研究方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    35. 面向大规模图数据的并行图布局算法
    程致远,鲍玉斌,冷芳玲
    大数据    2016, 2 (5): 2016050-.   DOI: 10.11959/j.issn.2096-0271.2016050
    摘要167)   HTML3)    PDF(pc) (1959KB)(631)    可视化    收藏

    图模型是一种广泛使用的建模工具。图的可视化作为一种直观的图数据分析工具被广泛使用。图数据可视化中最关键的技术是图布局算法,但是目前并没有高效的并行图布局算法,因此目前对于海量图数据的可视化是一个挑战性问题。针对这一问题,在力导向布局算法基础上,忽略弱关联顶点间的斥力计算,提出了k-friend布局算法;并针对海量图数据设计了高效的并行图布局算法。在人工和实际数据集上的测试结果表明,在布局质量降低可容忍的情况下,该算法大幅度提升了布局的速度。

    图表 | 参考文献 | 相关文章 | 多维度评价
    36. 工业大数据分析综述:模型与算法
    王宏志, 梁志宇, 李建中, 高宏
    大数据    2018, 4 (5): 2018051-.   DOI: 10.11959/j.issn.2096-0271.2018051
    摘要450)   HTML63)    PDF(pc) (998KB)(630)    可视化    收藏

    随着条形码、二维码、RFID、工业传感器、自动控制系统、工业互联网、ERP、CAD/CAM/CAE等信息技术在工业领域的广泛应用,大量与工业生产活动相关的数据被实时采集并存储到企业的信息系统中。对这些数据进行分析,有助于改进生产工艺、提高生产效率、降低生产成本,为实现智能制造奠定基础。因此,工业大数据分析引起了工业界和学术界的广泛关注。模型和算法是大数据分析理论和技术中的两个核心问题。介绍了工业大数据分析的基本概念,综述了几种流行的工业大数据分析模型在工业大数据分析领域的应用情况以及相应求解算法方面的研究成果,并探索了大数据分析模型和算法的未来研究方向。

    参考文献 | 相关文章 | 多维度评价
    37. 大数据流式计算:应用特征和技术挑战
    孙大为
    大数据    2015, 1 (3): 2015032-.   DOI: 10.11959/j.issn.2096-0271.2015032
    摘要201)   HTML1)    PDF(pc) (1004KB)(627)    可视化    收藏

    在大数据时代,数据的时效性日益突出,数据的流式特征更加明显,越来越多的应用场景需要部署在流式计算平台中。大数据流式计算作为大数据计算的一种形态,其重要性也不断提升。针对大数据环境中流式计算应用所呈现出的诸多鲜明特征进行了系统化的分析,并从系统架构的角度,给出了大数据流式计算系统构建的原则性策略。结合当前比较典型的流式计算平台,重点研究了当前大数据流式计算在在线环境下的资源调度和节点依赖环境下的容错策略等方面的技术挑战。

    图表 | 参考文献 | 相关文章 | 多维度评价
    38. 大数据机器学习系统研究进展
    黄宜华
    大数据    2015, 1 (1): 2015004-.   DOI: 10.11959/j.issn.2096-0271.2015004
    摘要644)   HTML49)    PDF(pc) (1747KB)(619)    可视化    收藏

    要实现高效的大数据机器学习,需要构建一个能同时支持机器学习算法设计和大规模数据处理的一体化大数据机器学习系统。研究设计高效、可扩展且易于使用的大数据机器学习系统面临诸多技术挑战。近年来,大数据浪潮的兴起,推动了大数据机器学习的迅猛发展,使大数据机器学习系统成为大数据领域的一个热点研究问题。介绍了国内外大数据机器学习系统的基本概念、基本研究问题、技术特征、系统分类以及典型系统;在此基础上,进一步介绍了本实验室研究设计的一个跨平台统一大数据机器学习系统——Octopus(大章鱼)。

    图表 | 参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(27)
    39. 零知识证明应用到区块链中的技术挑战
    李康,孙毅,张珺,李军,周继华,李忠诚
    大数据    2018, 4 (1): 2018006-.   DOI: 10.11959/j.issn.2096-0271.2018006
    摘要894)   HTML40)    PDF(pc) (1209KB)(617)    可视化    收藏

    区块链是一种以密码学算法为基础的点对点分布式账本技术,然而,公开透明的区块链账本辅以社会学挖掘、数据挖掘等统计学方法,使得用户的隐私面临重大威胁,因而隐私保护成为当前区块链技术研究的热点。总结了已有的隐私保护方案,重点聚焦于零知识证明技术,阐述并分析了零知识证明应用到区块链隐私保护方案中的技术挑战,并给出了具有指导意义的解决方案。

    图表 | 参考文献 | 相关文章 | 多维度评价
    40. 大数据是数据、技术,还是应用
    朱扬勇,熊赟
    大数据    2015, 1 (1): 2015007-.   DOI: 10.11959/j.issn.2096-0271.2015007
    摘要748)   HTML54)    PDF(pc) (1211KB)(614)    可视化    收藏

    通常认为大数据是一个现有技术难以处理的复杂而庞大的数据集,这将导致一个谬误的出现:大数据都不能被处理,能处理的都不是大数据。显然,如何定义大数据是一个问题。分析了已有的大数据定义和现象,发现数据、技术和应用是大数据的三要素,定义大数据是为决策提供服务的大数据集、大数据技术和大数据应用的总称。其中,大数据集是指一个决策问题所用到的所有可能的数据,而不是一个领域的所有数据。还给出了大数据应用遇到的问题及技术挑战,并指出大数据未来的研究方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
下载排行
点击排行
引用排行