全文下载排行

    一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

    当前位置: 三年内
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 联邦学习隐私保护研究进展
    王健宗, 孔令炜, 黄章成, 陈霖捷, 刘懿, 卢春曦, 肖京
    大数据    2021, 7 (3): 130-149.   DOI: 10.11959/j.issn.2096-0271.2021030
    摘要1805)   HTML317)    PDF(pc) (1923KB)(2839)    收藏

    针对隐私保护的法律法规相继出台,数据孤岛现象已成为阻碍大数据和人工智能技术发展的主要瓶颈。联邦学习作为隐私计算的重要技术被广泛关注。从联邦学习的历史发展、概念、架构分类角度,阐述了联邦学习的技术优势,同时分析了联邦学习系统的各种攻击方式及其分类,讨论了不同联邦学习加密算法的差异。总结了联邦学习隐私保护和安全机制领域的研究,并提出了挑战和展望。

    图表 | 参考文献 | 补充材料 | 相关文章 | 多维度评价
    2. 医学知识图谱构建关键技术及研究进展
    谭玲, 鄂海红, 匡泽民, 宋美娜, 刘毓, 陈正宇, 谢晓璇, 李峻迪, 范家伟, 王晴川, 康霄阳
    大数据    2021, 7 (4): 80-104.   DOI: 10.11959/issn.2096-0271.2021040
    摘要1887)   HTML300)    PDF(pc) (1542KB)(2213)    收藏

    随着互联网技术的不断迭代更新,对海量数据的语义理解变得越来越重要。知识图谱是一种揭示实体之间关系的语义网络,医学是知识图谱应用较广的垂直领域之一,医学知识图谱的构建也是目前国内外人工智能领域研究的热点。从医学知识图谱本体构建出发,依次对命名实体识别、实体关系抽取、实体对齐、实体链接、知识图谱存储、知识图谱应用进行综述,详细介绍了近年来医学知识图谱构建过程中涉及的难点、现有技术、挑战及未来研究方向,并介绍了医学知识图谱应用,最后对未来发展方向进行了展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    3. 知识图谱多跳问答推理研究进展、挑战与展望
    杜会芳, 王昊奋, 史英慧, 王萌
    大数据    2021, 7 (3): 60-79.   DOI: 10.11959/j.issn.2096-0271.2021026
    摘要1941)   HTML381)    PDF(pc) (1744KB)(2079)    收藏

    近年来,知识图谱问答在医疗、金融、政务等领域被广泛应用。用户不再满足于关于实体属性的单跳问答,而是更多地倾向表达复杂的多跳问答需求。为了应对上述复杂多跳问答,各种不同类型的推理方法被陆续提出。系统地介绍了基于嵌入、路径、逻辑的多跳知识问答推理的最新研究进展以及相关数据集和评测指标,并重点围绕前沿问题进行了讨论。最后总结了现有方法的不足,并展望了未来的研究方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    4. 事件图谱的构建、推理与应用
    胡志磊, 靳小龙, 陈剑赟, 黄冠利
    大数据    2021, 7 (3): 80-96.   DOI: 10.11959/j.issn.2096-0271.2021027
    摘要2209)   HTML329)    PDF(pc) (1381KB)(2047)    收藏

    近些年,知识图谱的构建技术得到了极大的发展,构建好的知识图谱已经被应用到众多领域。在此基础上,研究者将目光从知识图谱转向事件图谱。事件图谱以事件为核心,准确地描述了事件信息以及事件之间的关联关系。基于此,总结了事件图谱在构建、推理与应用方面的关键技术,主要包括事件抽取、事件信息补全、事件关系推断以及事件预测技术。给出了事件图谱的具体应用场景,并且针对事件图谱研究中存在的挑战,对未来的研究趋势进行了展望。

    图表 | 参考文献 | 补充材料 | 相关文章 | 多维度评价
    5. 联邦学习攻击与防御综述
    吴建汉, 司世景, 王健宗, 肖京
    大数据    2022, 8 (5): 12-32.   DOI: 10.11959/j.issn.2096-0271.2022038
    摘要1756)   HTML255)    PDF(pc) (2537KB)(1941)    收藏

    随着机器学习技术的广泛应用,数据安全问题时有发生,人们对数据隐私保护的需求日渐显现,这无疑降低了不同实体间共享数据的可能性,导致数据难以共享,形成“数据孤岛”。联邦学习可以有效解决“数据孤岛”问题。联邦学习本质上是一种分布式的机器学习,其最大的特点是将用户数据保存在用户本地,模型联合训练过程中不会泄露各参与方的原始数据。尽管如此,联邦学习在实际应用中仍然存在许多安全隐患,需要深入研究。对联邦学习可能受到的攻击及相应的防御措施进行系统性的梳理。首先根据联邦学习的训练环节对其可能受到的攻击和威胁进行分类,列举各个类别的攻击方法,并介绍相应攻击的攻击原理;然后针对这些攻击和威胁总结具体的防御措施,并进行原理分析,以期为初次接触这一领域的研究人员提供详实的参考;最后对该研究领域的未来工作进行展望,指出几个需要重点关注的方向,帮助提高联邦学习的安全性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    6. 数据流通市场中数据产品的特性及其交易模式
    黄丽华, 窦一凡, 郭梦珂, 汤奇峰, 李根
    大数据    2022, 8 (3): 3-14.   DOI: 10.11959/j.issn.2096-0271.2022045
    摘要1296)   HTML284)    PDF(pc) (1700KB)(1651)    收藏

    数据的流通交易是数据要素市场化配置的关键环节。我国前期的数据市场探索过程中暴露出一系列问题,迫切需要从理论角度对数据市场基本逻辑进行重新梳理。从交易成本理论、电子市场框架和电子交易模式等不同视角分析了数据产品流通过程,并提出数据的可计算性给数据交易带来了两类影响:一方面,可计算性使得数据能够被不断分析从而更加符合垂直领域的需求;另一方面,可计算性也会推动数据交易过程离开市场,呈现去平台化的趋势。基于电子市场经典理论框架将数字产品分为4个象限并进行相应分析,提出了对数据供方和数据市场管理者的建议。

    图表 | 参考文献 | 相关文章 | 多维度评价
    7. 数据资产价值评估与定价:研究综述和展望
    尹传儒, 金涛, 张鹏, 王建民, 陈嘉一
    大数据    2021, 7 (4): 14-27.   DOI: 10.11959/issn.2096-0271.2021035
    摘要1167)   HTML215)    PDF(pc) (1814KB)(1598)    收藏

    在数字经济时代,数据成为新的关键生产要素。数据资产作为一种新的资产形式,如何对其进行价值管理成为一个新的研究课题。通过文献研究,对国内外学者关于数据资产价值管理的研究成果进行系统梳理,在此基础上提出数据资产价值指数概念,用于衡量数据资产的相对价值水平;总结了运用层次分析法和层次分析法+模糊综合评价法计算数据资产价值指数的过程,并对其进行步骤分解;讨论了数据资产价值和价格、数据资产价值评估和数据资产定价之间的内在联系和区别,并对数据资产价值管理的未来研究进行展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    8. 大数据技术前瞻
    梅宏, 杜小勇, 金海, 程学旗, 柴云鹏, 石宣化, 靳小龙, 王亚沙, 刘驰
    大数据    2023, 9 (1): 1-20.   DOI: 10.11959/j.issn.2096-0271.2023009
    摘要2609)   HTML970)    PDF(pc) (1087KB)(1537)    收藏

    世界主要国家高度重视大数据发展,我国也将发展大数据作为国家战略,发展大数据技术具有重要意义。大数据技术涉及从采集、传输到管理、处理、分析、应用的全生命周期以及生命周期各阶段的数据治理。选取数据生命周期中的管理、处理和分析技术以及大数据治理技术来梳理国内外技术发展现状,特别是研判我国大数据技术发展与国际先进技术之间的差距。另外,在大数据应用需求的驱动下,计算技术体系正面临重构,从“以计算为中心”向“以数据为中心”转型,在新的计算技术体系下,一系列基础理论和核心技术问题亟待破解,新型大数据系统技术成为重要发展方向。在计算体系重构的背景下,提出大数据技术发展的四大技术挑战和十大发展趋势。

    参考文献 | 相关文章 | 多维度评价
    9. 基于观测数据的时间序列因果推断综述
    曾泽凡, 陈思雅, 龙洗, 金光
    大数据    2023, 9 (4): 139-158.   DOI: 10.11959/j.issn.2096-0271.2022059
    摘要658)   HTML67)    PDF(pc) (2614KB)(1473)    收藏

    数据存储量的扩大和计算能力的提升为基于观测数据推断时间序列的因果关系开辟了新途径。在时间序列因果推断的基本性质和研究现状的基础上,系统梳理了5种基于观测数据的时间序列因果推断方法,即Granger因果分析方法、基于信息论的方法、因果网络结构学习算法、基于结构因果模型的方法和基于非线性状态空间模型的方法。然后,根据不同应用场景的数据特点,结合方法的功能和适配性,对基于观测数据的时间序列因果推断方法在经济金融、医疗和生物学、地球系统科学和其他工程领域的典型应用进行了简要介绍。最后,结合时间序列因果推断的重难点问题,比较5种方法的优缺点,分析下一步研究重点,展望未来的研究方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    10. 基于金融知识图谱的会计欺诈风险识别方法
    陈强, 代仕娅
    大数据    2021, 7 (3): 116-129.   DOI: 10.11959/j.issn.2096-0271.2021029
    摘要1023)   HTML206)    PDF(pc) (2017KB)(1354)    收藏

    针对商业银行会计案件日益复杂且频发的问题,将会计案防领域的行业知识与金融知识图谱技术结合,以更精准地识别与防范商业银行会计风险。采用图分析、图挖掘等技术,提取深层关联风险特征,并与行业经验知识相结合,构建了249条单点规则及425条组合规则,形成了丰富、可灵活配置的反欺诈策略体系。将该智能化反欺诈方法应用于银行活期账户的风险排查,与传统规则策略相比,识别精准度大幅提升,且对于筛选出的高度可疑账户,识别精准度达到85%左右,极大提升了会计案件核查的效率。

    图表 | 参考文献 | 相关文章 | 多维度评价
    11. 知识图谱推理:现代的方法与应用
    王文广
    大数据    2021, 7 (3): 42-59.   DOI: 10.11959/j.issn.2096-0271.2021025
    摘要1259)   HTML211)    PDF(pc) (2680KB)(1351)    收藏

    知识图谱推理技术旨在根据已有的知识推导出新的知识,是使机器智能具有和人类一样的推理和决策能力的关键技术之一。系统地研究了知识图谱推理的现代方法,以统一的框架介绍了向量空间中进行知识图谱推理的模型,包括基于几何运算嵌入欧几里得空间和双曲空间的方法,基于卷积神经网络、胶囊网络、图神经网络等深度网络模型的方法。同时,系统地梳理了知识推理技术在各技术领域和各行业的应用情况,指出了当前存在的挑战以及其中蕴含的机会。

    图表 | 参考文献 | 相关文章 | 多维度评价
    12. 时态知识图谱补全的方法及其进展
    申宇铭, 杜剑峰
    大数据    2021, 7 (3): 30-41.   DOI: 10.11959/j.issn.2096-0271.2021024
    摘要943)   HTML122)    PDF(pc) (1275KB)(1323)    收藏

    时态知识图谱是将时间信息添加到传统的知识图谱而得到的。近年来,时态知识图谱补全受到了学术界的高度关注,并成为研究热点之一。总结了目前时态知识图谱补全的两大类方法,即基于符号逻辑的方法和基于知识表示学习的方法,比较分析了两类方法的优缺点,展望了未来时态补全方法的发展方向,还总结了7个用于时态知识图谱补全的基准数据集和若干代表性模型在基准数据集上的评测结果。

    图表 | 参考文献 | 相关文章 | 多维度评价
    13. 联邦推荐系统综述
    朱智韬, 司世景, 王健宗, 肖京
    大数据    2022, 8 (4): 105-132.   DOI: 10.11959/j.issn.2096-0271.2022032
    摘要1087)   HTML137)    PDF(pc) (2663KB)(1160)    收藏

    在联邦学习范式中,原始数据被本地存储在独立的用户客户端中,而脱敏数据被发送到中心服务器中加以聚合,这给众多领域提供了一种新颖的设计思路。考虑到传统推荐系统的研究方向集中于提高推荐效果,在资源节约、跨领域推荐、隐私保护等方面还具有很大改进空间,如何将联邦学习与推荐系统结合以解决这些问题成为当前的一个研究热点。对近年来基于联邦学习的推荐系统进行了全面的总结、比较与分析,首先介绍了推荐系统的传统实现方式及面临的瓶颈;然后引入了联邦学习范式,描述了联邦学习在隐私保护、利用多领域用户数据两方面给推荐系统带来的增益,以及二者结合的技术挑战,进而详细说明了现有的联邦推荐系统部署方式;最后,对联邦推荐系统未来的研究进行了展望与总结。

    图表 | 参考文献 | 相关文章 | 多维度评价
    14. 元宇宙数字经济:现状、特征与发展建议
    王陈慧子, 蔡玮
    大数据    2022, 8 (3): 140-150.   DOI: 10.11959/j.issn.2096-0271.2022048
    摘要840)   HTML166)    PDF(pc) (1379KB)(1069)    收藏

    随着美国科技公司Facebook更名为Meta,元宇宙成为2021年年底非常火爆的科技名词。首先通过梳理元宇宙技术概念的发展过程,阐述了该行业在这一历史阶段发展的必然性和必要性。在此基础上,通过对国外元宇宙数字经济发展现状的剖析,揭示了去中心化数字经济的风险与挑战。最后,指出去中心化的关键精神内核在于全球普适的反垄断思潮,并由此展望国内元宇宙产业的前景。

    图表 | 参考文献 | 补充材料 | 相关文章 | 多维度评价
    15. 大数据定价方法的国内外研究综述及对比分析
    刘枬, 郝雪镜, 陈俞宏
    大数据    2021, 7 (6): 89-102.   DOI: 10.11959/j.issn.2096-0271.2021063
    摘要957)   HTML177)    PDF(pc) (1377KB)(1030)    收藏

    大数据独特的价值特征导致数据定价问题复杂,尽管研究者对此展开了大量研究,但大多角度单一且缺乏实际应用性。鉴于此,对大数据定价方法进行了综述,梳理出成本导向、市场导向、需求导向、利润导向以及基于生命周期定价的5种定价类型,对比了成本法、协议定价、市场法、收益法、基于质量以及基于查询的定价6种主流定价方法的优劣势;最后通过大数据定价流程分析进一步展现了不同定价方法各自的特点,并对数据定价方向进行了展望,以期为今后的相关研究提供一定的参考。

    图表 | 参考文献 | 相关文章 | 多维度评价
    16. AIPerf:大规模人工智能算力基准测试程序
    翟季冬
    大数据    2021, 7 (3): 153-155.   DOI: 10.11959/j.issn.2096-0271.2021032
    摘要371)   HTML72)    PDF(pc) (350KB)(1002)    收藏

    参考文献 | 相关文章 | 多维度评价
    17. 数据治理价值链模型与数据基础制度分析
    黄科满, 杜小勇
    大数据    2022, 8 (4): 3-16.   DOI: 10.11959/j.issn.2096-0271.2022062
    摘要918)   HTML351)    PDF(pc) (1444KB)(969)    收藏

    培育数据要素市场是实现数据价值充分释放的重要机制。而数据要素市场的繁荣需要一个可持续的、健康发展的数商生态来支撑。基于数据治理价值链模型,厘清数据价值释放需要具备的基本活动和辅助活动,进而构建数商生态市场主体模型,明晰数据要素市场需要具备的核心市场主体和职能,为构建数据基础制度提供系统化分析框架,以更好地支撑数据要素市场的建设。

    图表 | 参考文献 | 相关文章 | 多维度评价
    18. 基于博弈论和拍卖的数据定价综述
    张小伟, 江东, 袁野
    大数据    2021, 7 (4): 61-79.   DOI: 10.11959/issn.2096-0271.2021039
    摘要688)   HTML82)    PDF(pc) (1656KB)(966)    收藏

    在大数据时代,随着数据爆炸式的增长,将数据视为一种商品,建立一个高效的数据交易市场,通过数据交易市场为数据拥有者提供利益补偿,为数据需求者提供数据或服务,使得数据能够在数据拥有者和数据需求者之间充分地自由流动显得尤为重要。然而如何为数据设定合理的价格是必须考虑的。对基于博弈论和拍卖的数据定价进行了研究,调查了该分类下不同的数据定价模型,并将其分为不同的类型,综合比较各个模型的优劣。将常见的数据交易市场进行分类,指出不同的数据交易框架在实现过程中的优点和挑战。对已有的数据定价研究进行总结,以便数据定价领域的学者能更轻松地掌握该领域的研究现状及重点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    19. 大规模知识图谱预训练模型及电商应用
    陈华钧, 张文, 黄志文, 叶橄强, 文博, 张伟
    大数据    2021, 7 (3): 97-115.   DOI: 10.11959/j.issn.2096-0271.2021028
    摘要908)   HTML137)    PDF(pc) (2518KB)(946)    收藏

    近年来,知识图谱因具有以统一的方式组织数据等优势,被广泛应用于许多需要知识的任务,并且在电子商务领域大放光彩。然而知识服务通常需要烦琐的数据选择和知识注入模型的设计,这会给业务带来不良影响。为了更好地解决这一问题,提出了“预训练+知识向量服务”的模式,并设计了知识图谱预训练模型(PKGM),在不直接访问商品知识图谱中三元组数据的情况下,以知识向量的方式为下游任务提供知识图谱服务。在商品分类、同款商品识别和商品推荐等知识图谱下游任务中进行测试,实验结果表明,知识图谱预训练模型能够有效地提高每个任务的性能。

    图表 | 参考文献 | 相关文章 | 多维度评价
    20. MadFS:高性能超算缓存文件系统
    陈康, 武永卫, 郑纬民
    大数据    2021, 7 (3): 150-152.   DOI: 10.11959/j.issn.2096-0271.2021031
    摘要495)   HTML94)    PDF(pc) (370KB)(939)    收藏

    参考文献 | 相关文章 | 多维度评价
    21. 基于区块链的大数据交易模式研究与探索
    李源, 高宁, 孙晶, 赵会群
    大数据    2021, 7 (4): 37-48.   DOI: 10.11959/issn.2096-0271.2021037
    摘要743)   HTML161)    PDF(pc) (1533KB)(927)    收藏

    数据是数字经济的基础,然而目前数据的确权问题存在争议。数据作为新型资产,其资产化标准和定价标准仍处于摸索阶段,大数据交易平台的建设方兴未艾。分析了数据确权、定价和交易的现状及存在的主要问题,并基于此提出新型大数据交易模式,即数据确权、定价和交易之间的迭代交互关系。最终,结合区块链的技术特点,提出了一个基于联盟链的大数据交易平台的方案,从个人和数据交易双方的角度,对平台的权益保护、定价机制和交易模式进行了探索性设计。

    图表 | 参考文献 | 相关文章 | 多维度评价
    22. 基于区块链技术的数据资产管理机制研究
    赵明, 董大治
    大数据    2021, 7 (4): 49-60.   DOI: 10.11959/issn.2096-0271.2021038
    摘要680)   HTML110)    PDF(pc) (1423KB)(877)    收藏

    使用区块链技术可以保证数据资产管理的高安全性、高隐私性以及可追溯性等。通过对当前基于区块链的数据资产管理机制进行深入研究,总结得出当前管理机制只针对区块链体系框架中的某一层进行应用的结论。为了解决这一问题,提出了基于区块链技术的数据资产管理新模式,对区块链体系中的各个层次进行结合应用。该模式在网络层增加了节点权限控制机制,在共识层实现了共识机制可自定义属性,在数据层通过优化结构和建立索引来提高数据查询效率,在智能合约层实现了数据智能化管理和共享,在交易层实现了可自定义加密算法的信息加密。实验结果表明,相比于传统模式,基于区块链技术的数据资产管理新模式在链上数据查询效率上提升了2.33倍。

    图表 | 参考文献 | 相关文章 | 多维度评价
    23. 数据要素价值化发展路径与对策研究
    杨云龙, 张亮, 杨旭蕾
    大数据    2023, 9 (6): 100-109.   DOI: 10.11959/j.issn.2096-0271.2022080
    摘要670)   HTML106)    PDF(pc) (2022KB)(859)    收藏

    基于国内外数据要素市场化的发展情况,总结了国外数据要素价值化发展的路径及特点。概括了我国数据要素市场在交易市场、应用场景等方面的现状,针对目前我国数据要素市场的发展情况,结合我国数据要素市场环境及发展特色,提出了构建中国特色数据要素市场模式的建议,以加快释放数据要素价值。

    图表 | 参考文献 | 相关文章 | 多维度评价
    24. 强化学习在资源优化领域的应用
    王金予, 魏欣然, 石文磊, 张佳
    大数据    2021, 7 (5): 131-149.   DOI: 10.11959/j.issn.2096-0271.2021053
    摘要541)   HTML90)    PDF(pc) (1364KB)(855)    收藏

    资源优化问题广泛存在于社会、经济的运转中,积累了海量的数据,给强化学习技术在这一领域的应用奠定了基础。由于资源优化问题覆盖广泛,从覆盖广泛的资源优化问题中划分出3类重要问题,即资源平衡问题、资源分配问题和装箱问题。并围绕这3类问题总结强化学习技术的最新研究工作,围绕各研究工作的问题建模、智能体设计等方面展开详细阐述。

    参考文献 | 相关文章 | 多维度评价
    25. 数据权属界定面临的问题困境与破解思路
    何波
    大数据    2021, 7 (4): 3-13.   DOI: 10.11959/issn.2096-0271.2021034
    摘要671)   HTML116)    PDF(pc) (1009KB)(835)    收藏

    随着数据成为关键生产要素,如何界定数据权属成为各方高度关注的重要问题。首先分析数据权属界定不明带来的国家、企业和个人层面诸多亟待解决的问题,包括国家数据主权和数字治理的挑战,企业数据集中和无序竞争难题,以及个人数据保护问题;然后指出数据权属界定也面临理论和实践的双重困境;最后提出在坚持发展和规范并重、严守个人信息保护底线以及分级分类等原则的基础上,持续完善法律制度设计,尝试设立“基础数据”管理制度,分类探索数据权属划分规则;强化行政监管措施,提高数据处理透明度和个人信息保护力度;积极发挥技术手段作用,推动破解数据权属困境。

    参考文献 | 相关文章 | 多维度评价
    26. 专题导读
    靳小龙, 阮彤
    大数据    2021, 7 (3): 1-2.   DOI: 10.11959/j.issn.2096-0271.2021022-1
    摘要534)   HTML261)    PDF(pc) (755KB)(774)    收藏

    参考文献 | 相关文章 | 多维度评价
    27. 去中心化金融的交易机制综述
    邓钇敏, 司世景, 王健宗, 李泽远, 肖京
    大数据    2022, 8 (4): 67-84.   DOI: 10.11959/j.issn.2096-0271.2022064
    摘要620)   HTML86)    PDF(pc) (2925KB)(773)    收藏

    去中心化金融(DeFi)是一种基于区块链和智能合约提供金融服务的新范式,现已涉及包括借贷及其衍生品在内的众多领域。因此,作为DeFi基础的交易机制成为重要的关注点,其直接影响着上层应用的稳定性。主要讨论DeFi领域的交易机制,首先介绍与交易机制相关的概念和协议;然后通过实现方式对交易机制进行分类,分别详细讨论了基于交易委托账本、自动做市商和聚合器方法的交易机制实现,并比较归纳实现方案之间的区别与联系;最后分析并总结了去中心化交易面临的公平性、安全性、匿名性问题,提出了相关的未来研究方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    28. 遥感卫星大数据高精度一体化处理技术
    仇晓兰, 胡玉新, 上官松涛, 付琨
    大数据    2022, 8 (2): 15-27.   DOI: 10.11959/j.issn.2096-0271.2022013
    摘要517)   HTML87)    PDF(pc) (2526KB)(763)    收藏

    我国空天信息获取技术飞速发展,空天数据呈现出数据量大、种类多、增长快、价值密度相对较低的大数据特点。遥感卫星数据是空天大数据的重要组成部分,如何利用遥感卫星数据的规模效应和异构数据互补优势,提升处理精度并提高处理效率,是遥感卫星大数据处理系统需要解决的关键问题。简要回顾了我国遥感卫星数据地面处理系统的发展历程,指出了地面处理系统面临的核心难点,提出了基于稳定特性挖掘的遥感卫星大数据高精度处理技术的思路,并给出了初步的实现方法,以期为我国空天大数据处理系统的发展提供有益参考。

    图表 | 参考文献 | 相关文章 | 多维度评价
    29. 遥感大数据在公路交通领域中的应用与实践
    袁胜古, 罗伦, 郭榕刚, 毛恒彬, 王芳, 蔡红玥, 肖和平
    大数据    2022, 8 (2): 103-119.   DOI: 10.11959/j.issn.2096-0271.2022011
    摘要713)   HTML131)    PDF(pc) (6679KB)(749)    收藏

    遥感大数据对交通行业产生了深远的影响,并在交通规划、建设、管理、养护等方面起到了积极的推动作用。首先介绍了交通遥感大数据的内涵及特征,并概述了遥感大数据在公路交通领域的应用现状;然后结合近几年交通运输业务部门基于遥感大数据开展的相关工作,重点阐述了遥感大数据在公路灾毁智能提取分析、公路建设与规划分析、公路智慧养护3个方向的典型应用;最后对交通遥感大数据的发展趋势和前景做出展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    30. 计量科学大数据分级分类
    智峰, 田锋, 赵若凡
    大数据    2022, 8 (1): 60-72.   DOI: 10.11959/j.issn.2096-0271.2022006
    摘要613)   HTML140)    PDF(pc) (1394KB)(729)    收藏

    基于我国数据共享开放的发展趋势以及科研数据安全管理的相关政策,对我国计量行业数据分级分类的现存方案进行研究。对国内20个国家级数据共享平台以及美国的相关数据分级分类方法展开调研,讨论了我国计量科研数据分级分类方法的不足,并从数据安全以及数据管理的角度提出了计量数据安全等级划分模型以及计量数据分级分类编码方法。

    图表 | 参考文献 | 相关文章 | 多维度评价
    31. 基于分布式缓存加速容器化深度学习的优化方法
    张凯, 车漾
    大数据    2021, 7 (5): 150-163.   DOI: 10.11959/j.issn.2096-0271.2021054
    摘要562)   HTML66)    PDF(pc) (1442KB)(717)    收藏

    使用GPU运行容器化深度学习模型训练任务,性能往往受限于数据加载和预处理效率。很多GPU计算资源浪费在等待从远程存储服务读取数据的过程中。首先介绍了基于容器和分布式缓存技术加速深度学习训练的方法,以及使用Alluxio和Kubernetes实现的系统架构和初步优化手段;然后阐述了TDCS及其训练任务与缓存数据互感知的协同调度策略;接着在Kubernetes容器集群中实现了TDCS,增强了分布式缓存加速大规模深度学习训练的可扩展性;最后用ResNet50图像分类模型训练任务进行性能验证。实验结果表明,相较于直接从远程存储服务中读取数据,TDCS可对运行在128块NVIDIA V100 GPU设备上的分布式训练任务实现2~3倍加速。

    图表 | 参考文献 | 相关文章 | 多维度评价
    32. 基于NLP的中医医案文本快速结构化方法
    肖晓霞, 刘明婷, 杨冯天赐, 刘鉴建县, 杨阳, 石月
    大数据    2022, 8 (3): 128-139.   DOI: 10.11959/j.issn.2096-0271.2022025
    摘要457)   HTML89)    PDF(pc) (2564KB)(702)    收藏

    中医医案是中医医生学习临床经验的重要文献资料,对中医医案进行结构化处理有利于采用机器学习等方法总结临床经验,加速中医传承。为了实现中医医案快速结构化,提出了一种基于自然语言处理的中医医案文本快速结构化方法。将《中国现代名中医医案精粹》作为结构化对象,采用光学字符识别技术识别医案截图的文本,同时对文本做初步结构化。构建简单症状词典,采用结合词典的改进的N-gram模型获取医案文本中的症状、体征等词,并在结构化过程中更新词典,实现了对4 754份文本医案的结构化。随机选取666份医案文本对最终模型进行测试,其F1值达到82.99%。

    图表 | 参考文献 | 相关文章 | 多维度评价
    33. 我国海洋卫星遥感大数据及其应用服务
    刘建强, 叶小敏, 兰友国
    大数据    2022, 8 (2): 75-88.   DOI: 10.11959/j.issn.2096-0271.2022016
    摘要568)   HTML69)    PDF(pc) (1861KB)(689)    收藏

    我国海洋水色卫星、海洋动力环境卫星和海洋监视监测卫星3个系列卫星星座以及配套的地面应用系统已基本建成。阐述了我国海洋卫星的发展历程、海洋系列卫星及其载荷、产品体系、数据获取和分发方式;从数据体量、数据种类、数据时效、数据价值等方面分析了海洋卫星遥感数据的大数据特征;同时分析了海洋卫星遥感基础数据集及其在灾害与环境监测中的典型应用及公共服务情况。

    图表 | 参考文献 | 相关文章 | 多维度评价
    34. 空天大数据在新型智慧城市建设中的关键技术与应用探索
    史经业, 李攀
    大数据    2022, 8 (2): 120-133.   DOI: 10.11959/j.issn.2096-0271.2022018
    摘要575)   HTML96)    PDF(pc) (1608KB)(680)    收藏

    新型智慧城市的提出及发展带来了新的变革,也对空天大数据等技术的应用提出了更高的要求。分析了空天大数据在新型智慧城市建设中的应用价值,研究了空天大数据在新型智慧城市应用的关键技术,同时展示了空天大数据的典型应用场景,并提出了利用空天大数据推进新型智慧城市建设的建议。

    图表 | 参考文献 | 相关文章 | 多维度评价
    35. 结合语言知识和深度学习的中文文本情感分析方法
    徐康庭, 宋威
    大数据    2022, 8 (3): 115-127.   DOI: 10.11959/j.issn.2096-0271.2022026
    摘要465)   HTML86)    PDF(pc) (1968KB)(674)    收藏

    在目前的中文文本情感分析研究中,基于语义规则和情感词典的方法通常需要人工设置情感阈值;而基于深度学习的方法由于未能运用语义规则和情感词典等语言知识,不能充分提取情感特征。针对这两种方法的缺点,提出了一种将语言知识和深度学习结合的文本情感分析方法。该方法首先根据语义规则提取文本中的关键情感片段,再根据情感词典从关键情感片段中抽取出情感更加明确的情感词来构建情感集合,然后利用深度学习模型分别从原始文本、关键情感片段、情感集合中抽取深层次特征,最后对提取的特征进行加权融合,并利用分类器实现情感极性的判断。实验结果表明,与未引入语言知识的深度学习模型相比,该方法的情感极性分类能力有明显提升。

    图表 | 参考文献 | 相关文章 | 多维度评价
    36. 数据交易相关法规比较研究
    文英姿, 曲杨, 张旭东, 徐珺, 李建平
    大数据    2022, 8 (3): 66-77.   DOI: 10.11959/j.issn.2096-0271.2022043
    摘要393)   HTML68)    PDF(pc) (1653KB)(672)    收藏

    随着国家将数据确定为生产要素,各地加快了与数据交易相关的立法,探索构建数据要素市场,推动数字经济发展。对比分析了数据交易相关法规,认为各地在交易原则、禁止交易数据、数据安全等方面基本形成共识,条文相对清晰且具有一定的可操作性;而交易标的、数据权属等方面的规定仍不够清晰且难以落地,同时还存在数据安全监管难度大、数据交易生态不完善等问题。最后,对未来制定数据交易法规、建设数据交易市场提出了建议。

    图表 | 参考文献 | 相关文章 | 多维度评价
    37. 隐私计算在车路协同场景应用的探索与实践
    李明, 吕阿斌
    大数据    2022, 8 (5): 74-87.   DOI: 10.11959/j.issn.2096-0271.2022069
    摘要447)   HTML74)    PDF(pc) (2493KB)(666)    收藏

    基于车路协同的发展现状,总结车路协同场景中隐私计算、人工智能等技术的研究进展。设计并实现YITATFL平台,为数据管理、模型训练、模型管理及协同推理提供完备的隐私保护方案,为人工智能结合隐私计算在交通行业的应用提供参考。

    图表 | 参考文献 | 相关文章 | 多维度评价
    38. 基于主体掩码的实体关系抽取方法
    郑慎鹏, 陈晓军, 向阳, 沈汝超
    大数据    2021, 7 (3): 3-14.   DOI: 10.11959/j.issn.2096-0271.2021022
    摘要403)   HTML91)    PDF(pc) (1632KB)(659)    收藏

    实体关系抽取技术能够自动化地从海量无结构文本中抽取信息,构建大规模知识图谱,丰富现有知识图谱的内容,为知识图谱推理和应用提供支持。目前级联式的实体关系抽取技术已经取得了不错的成绩,但其在主体的向量表示和指针网络解码上存在不足。针对主体向量表示问题,提出利用注意力机制和掩码机制生成主体向量的方法。另外,针对指针网络中因遗漏标注而解码出过长实体的问题,提出引入实体序列标记任务,辅助指针网络解码实体。在大规模实体关系数据集DuIE2.0上进行实验验证得出,相较于先前模型,所提方法取得了0.88%的提升。

    图表 | 参考文献 | 相关文章 | 多维度评价
    39. 开放科学背景下的科学数据开放共享:国家青藏高原科学数据中心的实践
    潘小多, 李新, 冉有华, 郭学军
    大数据    2022, 8 (1): 113-120.   DOI: 10.11959/j.issn.2096-0271.2022010
    摘要316)   HTML76)    PDF(pc) (3012KB)(658)    收藏

    介绍了开放科学和开放数据实践活动的概念、内涵和对科学研究的重要性;详细阐述了现阶段开放数据面临的挑战,如数据引用、数据计量、数据互操作和大数据分析等;并以国家青藏高原科学数据中心为例,阐述其在数据引用、数据互操作和大数据分析等开放数据方面的举措和数据共享成效;最后展望了数据中心对开放数据的促进作用。

    图表 | 参考文献 | 相关文章 | 多维度评价
    40. 面向非易失性内存的持久索引数据结构研究综述
    王永锋, 陈志广
    大数据    2021, 7 (6): 78-88.   DOI: 10.11959/j.issn.2096-0271.2021062
    摘要508)   HTML48)    PDF(pc) (1258KB)(652)    收藏

    随着非易失性内存从理论走向实用,现代存储系统的设计与实现将迎来颠覆性变革。针对传统存储设备设计的存储系统并不能充分利用非易失性内存带来的性能红利。为了构建高吞吐、低时延、大规模的存储系统,迫切需要设计与非易失性内存硬件特性相匹配的持久索引数据结构,从而进一步提升性能。从持久索引数据结构出发,分别对B+-Tree和哈希表在非易失性内存上的设计和优化进行分析,比较其优缺点,并展望了该方向的机遇与面临的挑战。

    图表 | 参考文献 | 相关文章 | 多维度评价
下载排行
点击排行