摘要点击排行

    一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 医学知识图谱构建关键技术及研究进展
    谭玲, 鄂海红, 匡泽民, 宋美娜, 刘毓, 陈正宇, 谢晓璇, 李峻迪, 范家伟, 王晴川, 康霄阳
    大数据    2021, 7 (4): 80-104.   DOI: 10.11959/issn.2096-0271.2021040
    摘要511)   HTML117)    PDF(pc) (1542KB)(549)    收藏

    随着互联网技术的不断迭代更新,对海量数据的语义理解变得越来越重要。知识图谱是一种揭示实体之间关系的语义网络,医学是知识图谱应用较广的垂直领域之一,医学知识图谱的构建也是目前国内外人工智能领域研究的热点。从医学知识图谱本体构建出发,依次对命名实体识别、实体关系抽取、实体对齐、实体链接、知识图谱存储、知识图谱应用进行综述,详细介绍了近年来医学知识图谱构建过程中涉及的难点、现有技术、挑战及未来研究方向,并介绍了医学知识图谱应用,最后对未来发展方向进行了展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    2. 论大数据视角下的地球空间信息学的机遇与挑战
    李德仁, 张过, 蒋永华, 沈欣, 刘伟玲
    大数据    2022, 8 (2): 3-14.   DOI: 10.11959/j.issn.2096-0271.2022012
    摘要453)   HTML101)    PDF(pc) (1585KB)(123)    收藏

    大数据时代已经到来,并且已经深入人类生活的方方面面。作为地球科学与信息科学交叉融合催生出的地球空间信息学,大数据时代的来临在为其提供更丰富的数据保障的同时,也带来数据存储、管理、分析和挖掘方面的新挑战,甚至造成了某种程度上的“数据爆炸”。从大数据视角,梳理了当前地球空间信息学涉及的地理信息系统、智慧城市、遥感大数据和空间数据挖掘4个核心领域的瓶颈和挑战;指出在大数据时代,地球空间信息学可为地球科学研究提供更加精准、实时的空间信息框架和更加智能高效的信息处理手段,从而服务于智慧城市、智慧地球建设和人类社会的可持续发展。而且,大数据时代下,地球空间信息学的发展面临着软件和硬件水平的双重考验。

    参考文献 | 相关文章 | 多维度评价
    3. 基于多方计算技术的数据交易机制研究
    刘小霞, 张嘉熙, 王申, 杨祖艳
    大数据    2022, 8 (3): 54-65.   DOI: 10.11959/j.issn.2096-0271.2022028
    摘要408)   HTML51)    PDF(pc) (1729KB)(81)    收藏

    近年来,数据要素交易与数据要素市场建设受到社会各界的高度关注。区别于传统生产要素,数据要素存在“准公共品”性、信息不对称性与负外部性等经济特征,这些特征是当前阶段阻碍其大规模流通的主要因素。结合数据要素的经济特征,从技术视角切入,探索基于多方计算的数据交易机制在现有政策与市场环境下的实践应用,通过“数据可用不可见、数据使用可控可计量”的交易机制,为现阶段数据要素大规模流通提供一种解决思路。同时,深入分析北京国际大数据交易所已上线的数据安全融合产品,为基于多方计算的数据大规模流通工程化落地与数据要素市场建设提供借鉴。

    图表 | 参考文献 | 相关文章 | 多维度评价
    4. 数据资产价值评估与定价:研究综述和展望
    尹传儒, 金涛, 张鹏, 王建民, 陈嘉一
    大数据    2021, 7 (4): 14-27.   DOI: 10.11959/issn.2096-0271.2021035
    摘要391)   HTML89)    PDF(pc) (1814KB)(389)    收藏

    在数字经济时代,数据成为新的关键生产要素。数据资产作为一种新的资产形式,如何对其进行价值管理成为一个新的研究课题。通过文献研究,对国内外学者关于数据资产价值管理的研究成果进行系统梳理,在此基础上提出数据资产价值指数概念,用于衡量数据资产的相对价值水平;总结了运用层次分析法和层次分析法+模糊综合评价法计算数据资产价值指数的过程,并对其进行步骤分解;讨论了数据资产价值和价格、数据资产价值评估和数据资产定价之间的内在联系和区别,并对数据资产价值管理的未来研究进行展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    5. 基于区块链的大数据交易模式研究与探索
    李源, 高宁, 孙晶, 赵会群
    大数据    2021, 7 (4): 37-48.   DOI: 10.11959/issn.2096-0271.2021037
    摘要357)   HTML103)    PDF(pc) (1533KB)(370)    收藏

    数据是数字经济的基础,然而目前数据的确权问题存在争议。数据作为新型资产,其资产化标准和定价标准仍处于摸索阶段,大数据交易平台的建设方兴未艾。分析了数据确权、定价和交易的现状及存在的主要问题,并基于此提出新型大数据交易模式,即数据确权、定价和交易之间的迭代交互关系。最终,结合区块链的技术特点,提出了一个基于联盟链的大数据交易平台的方案,从个人和数据交易双方的角度,对平台的权益保护、定价机制和交易模式进行了探索性设计。

    图表 | 参考文献 | 相关文章 | 多维度评价
    6. 数据权属界定面临的问题困境与破解思路
    何波
    大数据    2021, 7 (4): 3-13.   DOI: 10.11959/issn.2096-0271.2021034
    摘要328)   HTML93)    PDF(pc) (1009KB)(272)    收藏

    随着数据成为关键生产要素,如何界定数据权属成为各方高度关注的重要问题。首先分析数据权属界定不明带来的国家、企业和个人层面诸多亟待解决的问题,包括国家数据主权和数字治理的挑战,企业数据集中和无序竞争难题,以及个人数据保护问题;然后指出数据权属界定也面临理论和实践的双重困境;最后提出在坚持发展和规范并重、严守个人信息保护底线以及分级分类等原则的基础上,持续完善法律制度设计,尝试设立“基础数据”管理制度,分类探索数据权属划分规则;强化行政监管措施,提高数据处理透明度和个人信息保护力度;积极发挥技术手段作用,推动破解数据权属困境。

    参考文献 | 相关文章 | 多维度评价
    7. 大数据定价方法的国内外研究综述及对比分析
    刘枬, 郝雪镜, 陈俞宏
    大数据    2021, 7 (6): 89-102.   DOI: 10.11959/j.issn.2096-0271.2021063
    摘要320)   HTML71)    PDF(pc) (1377KB)(229)    收藏

    大数据独特的价值特征导致数据定价问题复杂,尽管研究者对此展开了大量研究,但大多角度单一且缺乏实际应用性。鉴于此,对大数据定价方法进行了综述,梳理出成本导向、市场导向、需求导向、利润导向以及基于生命周期定价的5种定价类型,对比了成本法、协议定价、市场法、收益法、基于质量以及基于查询的定价6种主流定价方法的优劣势;最后通过大数据定价流程分析进一步展现了不同定价方法各自的特点,并对数据定价方向进行了展望,以期为今后的相关研究提供一定的参考。

    图表 | 参考文献 | 相关文章 | 多维度评价
    8. 基于区块链技术的数据资产管理机制研究
    赵明, 董大治
    大数据    2021, 7 (4): 49-60.   DOI: 10.11959/issn.2096-0271.2021038
    摘要303)   HTML64)    PDF(pc) (1423KB)(293)    收藏

    使用区块链技术可以保证数据资产管理的高安全性、高隐私性以及可追溯性等。通过对当前基于区块链的数据资产管理机制进行深入研究,总结得出当前管理机制只针对区块链体系框架中的某一层进行应用的结论。为了解决这一问题,提出了基于区块链技术的数据资产管理新模式,对区块链体系中的各个层次进行结合应用。该模式在网络层增加了节点权限控制机制,在共识层实现了共识机制可自定义属性,在数据层通过优化结构和建立索引来提高数据查询效率,在智能合约层实现了数据智能化管理和共享,在交易层实现了可自定义加密算法的信息加密。实验结果表明,相比于传统模式,基于区块链技术的数据资产管理新模式在链上数据查询效率上提升了2.33倍。

    图表 | 参考文献 | 相关文章 | 多维度评价
    9. 专题导读
    陈刚
    大数据    2021, 7 (5): 1-2.   DOI: 10.11959/j.issn.2096-0271.2021045-1
    摘要277)   HTML216)    PDF(pc) (661KB)(192)    收藏
    参考文献 | 相关文章 | 多维度评价
    10. 计量科学大数据分级分类
    智峰, 田锋, 赵若凡
    大数据    2022, 8 (1): 60-72.   DOI: 10.11959/j.issn.2096-0271.2022006
    摘要272)   HTML86)    PDF(pc) (1394KB)(120)    收藏

    基于我国数据共享开放的发展趋势以及科研数据安全管理的相关政策,对我国计量行业数据分级分类的现存方案进行研究。对国内20个国家级数据共享平台以及美国的相关数据分级分类方法展开调研,讨论了我国计量科研数据分级分类方法的不足,并从数据安全以及数据管理的角度提出了计量数据安全等级划分模型以及计量数据分级分类编码方法。

    图表 | 参考文献 | 相关文章 | 多维度评价
    11. 专题导读
    周斌, 秦永彬
    大数据    2021, 7 (6): 1-2.   DOI: 10.11959/j.issn.2096-0271.2021056-1
    摘要263)   HTML182)    PDF(pc) (761KB)(134)    收藏
    参考文献 | 相关文章 | 多维度评价
    12. 基于遥感大数据的信息提取技术综述
    刘伟权, 王程, 臧彧, 胡倩, 于尚书, 赖柏锜
    大数据    2022, 8 (2): 28-57.   DOI: 10.11959/j.issn.2096-0271.2022014
    摘要260)   HTML109)    PDF(pc) (9092KB)(112)    收藏

    随着遥感技术的快速发展,我国已建立了比较完善的航天遥感和灵活多样的航空遥感数据获取体系。遥感大数据以海量遥感数据为主,综合了其他多源遥感数据,并运用大数据思维与手段,发掘海量数据中的知识规律和高价值信息。回顾了近年来基于遥感大数据的信息提取技术研究工作,从遥感目标检测、遥感地物分割、遥感变化检测三方面阐述了遥感信息提取技术的发展历程,对各个发展阶段及代表性方法进行了梳理与归纳,并对基于遥感大数据的信息提取技术进行了展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    13. 盒装数据:一种基于数据盒的数据产品形态
    叶雅珍, 朱扬勇
    大数据    2022, 8 (3): 15-25.   DOI: 10.11959/j.issn.2096-0271.2022030
    摘要251)   HTML10)    PDF(pc) (2257KB)(135)    收藏

    与通常的商品市场一样,数据市场中流通的数据商品也分为标准产品和非标准产品两大类。目前,市场中有效流通的数据产品是音乐、图片、电影等标准数据产品,而一般意义上的、大规模的大数据流通则遇到了诸多障碍,其中一个障碍就是数据产品的计量计价问题,需要设计一个可计量的标准数据产品形态。基于数据盒模型,设计了一种数据产品的基础标准形态,称之为盒装数据。一个盒装数据产品包括盒内数据、盒外包装两部分,其中,盒内数据是指“时间+空间+内容”三维度的数据立方体组织,一般包括图像、图形、视频、音频、文本、结构化数据等多种数据类型;盒外包装包括产品登记证书,以及产品说明书、质量证书、合规证书等内容。盒装数据旨在为数据要素市场提供一个可计量计价的标准数据产品形态。

    图表 | 参考文献 | 相关文章 | 多维度评价
    14. 基于BERT阅读理解框架的司法要素抽取方法
    黄辉, 秦永彬, 陈艳平, 黄瑞章
    大数据    2021, 7 (6): 19-29.   DOI: 10.11959/j.issn.2096-0271.2021057
    摘要249)   HTML59)    PDF(pc) (2376KB)(221)    收藏

    司法要素抽取是司法智能化辅助应用的重要基础,其目的是判别裁判文书涉及的关键案情要素。以往司法要素抽取通常采用多标签分类方法进行建模,模型主要依赖于裁判文书文本特征,忽略了要素标签的语义信息。同时,由于司法数据集存在样本分布不均衡的情况,分类方法会因负例过多而导致模型性能不佳。针对上述问题,提出基于BERT阅读理解框架的司法要素抽取方法。该方法引入标签信息和法律先验知识构造辅助问句,利用BERT机器阅读理解模型建立辅助问句和裁判文书之间的语义联系。同时,在问句中标签所在位置前后增加特殊标识符以增强模型的学习能力。实验结果表明,该方法在CAIL2019要素抽取公开数据集上性能得到显著提升,在婚姻家庭、劳动争议、借款合同3种案由上分别提升F1值2.7%、11.3%、5.6%。

    图表 | 参考文献 | 相关文章 | 多维度评价
    15. 基于博弈论和拍卖的数据定价综述
    张小伟, 江东, 袁野
    大数据    2021, 7 (4): 61-79.   DOI: 10.11959/issn.2096-0271.2021039
    摘要242)   HTML40)    PDF(pc) (1656KB)(267)    收藏

    在大数据时代,随着数据爆炸式的增长,将数据视为一种商品,建立一个高效的数据交易市场,通过数据交易市场为数据拥有者提供利益补偿,为数据需求者提供数据或服务,使得数据能够在数据拥有者和数据需求者之间充分地自由流动显得尤为重要。然而如何为数据设定合理的价格是必须考虑的。对基于博弈论和拍卖的数据定价进行了研究,调查了该分类下不同的数据定价模型,并将其分为不同的类型,综合比较各个模型的优劣。将常见的数据交易市场进行分类,指出不同的数据交易框架在实现过程中的优点和挑战。对已有的数据定价研究进行总结,以便数据定价领域的学者能更轻松地掌握该领域的研究现状及重点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    16. 基于国产处理器架构的高能物理数据处理系统
    程耀东, 程垚松, 毕玉江, 高宇, 李海波, 汪璐, 姚秋玲
    大数据    2021, 7 (5): 17-30.   DOI: 10.11959/j.issn.2096-0271.2021046
    摘要212)   HTML60)    PDF(pc) (2099KB)(133)    收藏

    随着规模的不断扩大,高能物理实验产生了越来越多的科学数据,迫切需要先进的数据处理系统来支撑科学研究。目前,以ARM架构等为代表的国产处理器发展迅速,高能物理数据处理系统面临着新的机遇与挑战。首先总结了高能物理数据处理系统的需求及体系架构;然后描述了在国产处理器上开展的高能物理数据处理软件移植等相关工作,并提出了一种新的面向高能物理数据处理的可计算存储技术方案;最后给出了在国产处理器架构上的典型应用评测结果。

    图表 | 参考文献 | 相关文章 | 多维度评价
    17. 基于法律裁判文书的法律判决预测
    张虎, 潘邦泽, 谭红叶, 李茹
    大数据    2021, 7 (5): 164-175.   DOI: 10.11959/j.issn.2096-0271.2021055
    摘要211)   HTML41)    PDF(pc) (2304KB)(156)    收藏

    针对智慧司法服务领域中“法律判决预测”任务的实际需求,探讨了法律判决预测任务的研究思路与实现路径,介绍了法律判决预测的整体框架和具体过程。基于从中国裁判文书网获取的海量真实案件数据和2018“中国法研杯”司法人工智能挑战赛的评测数据,整理了实验数据类别,规范了实验数据格式,形成了基于法律裁判文书大数据的法律判决预测数据集。在判决预测模型中,首先使用判决要素抽取方法提取出高质量的判决要素句,然后借鉴法官的判案思路,将整个法律判决预测任务转换为法条预测、罪名预测和刑期预测3项子任务,并分别构建了基于判决要素的预测模型。实验结果表明,所提方法在刑法类判决预测数据集上得到了有效的结果。

    图表 | 参考文献 | 相关文章 | 多维度评价
    18. 数据要素市场的组织形式和估值框架
    邹传伟
    大数据    2021, 7 (4): 28-36.   DOI: 10.11959/issn.2096-0271.2021036
    摘要211)   HTML61)    PDF(pc) (1166KB)(236)    收藏

    数据要素市场的组织形式和估值框架是当前政府管理和行业发展需要回答的两个重要问题。针对这两个问题,提出不是只有所有权清晰的数据要素才能参与市场配置,数据要素事实上的控制权更为重要;然后分析了数据要素市场与金融系统之间存在的同构关系,并从金融系统的组织形式推测数据要素市场的组织形式;最后提出数据要素估值框架DataRank,以有效反映数据要素价值的主观性、时变性和外部性等特点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    19. 强化学习在资源优化领域的应用
    王金予, 魏欣然, 石文磊, 张佳
    大数据    2021, 7 (5): 131-149.   DOI: 10.11959/j.issn.2096-0271.2021053
    摘要209)   HTML50)    PDF(pc) (1364KB)(156)    收藏

    资源优化问题广泛存在于社会、经济的运转中,积累了海量的数据,给强化学习技术在这一领域的应用奠定了基础。由于资源优化问题覆盖广泛,从覆盖广泛的资源优化问题中划分出3类重要问题,即资源平衡问题、资源分配问题和装箱问题。并围绕这3类问题总结强化学习技术的最新研究工作,围绕各研究工作的问题建模、智能体设计等方面展开详细阐述。

    参考文献 | 相关文章 | 多维度评价
    20. 基于深度学习的大脑性别差异分析
    温景熙, 于胡飞, 辛江, 唐艳
    大数据    2021, 7 (4): 130-140.   DOI: 10.11959/issn.2096-0271.2021043
    摘要207)   HTML61)    PDF(pc) (3204KB)(135)    收藏

    深度学习被广泛应用于大脑的相关研究中。通过构建深度学习模型对弥散张量成像数据的各向异性分数进行了性别分类,并通过深度学习特征可视化方法提取了不同性别的重要特征,最后对可视化结果进行了基于体素的分析。结果显示,提出的模型能够准确预测性别,并且达到了96.2%的分类准确率。在可视化的结果中,发现男女大脑之间存在明显差异,其中存在差异的脑区主要表现在胼胝体、顶叶下叶和基底神经节等,这些脑区揭示了男女之间的大脑差异可能与运动能力、数学运算、身体形象感知和情绪控制等方面的能力相关。

    图表 | 参考文献 | 相关文章 | 多维度评价
    21. 元宇宙数字经济:现状、特征与发展建议
    王陈慧子, 蔡玮
    大数据    2022, 8 (3): 140-150.   DOI: 10.11959/j.issn.2096-0271.2022048
    摘要204)   HTML10)    PDF(pc) (1379KB)(182)    收藏

    随着美国科技公司Facebook更名为Meta,元宇宙成为2021年年底非常火爆的科技名词。首先通过梳理元宇宙技术概念的发展过程,阐述了该行业在这一历史阶段发展的必然性和必要性。在此基础上,通过对国外元宇宙数字经济发展现状的剖析,揭示了去中心化数字经济的风险与挑战。最后,指出去中心化的关键精神内核在于全球普适的反垄断思潮,并由此展望国内元宇宙产业的前景。

    图表 | 参考文献 | 相关文章 | 多维度评价
    22. 智慧医院建设背景下的电子病历分析利用框架
    徐良辰, 郭崇慧
    大数据    2021, 7 (4): 141-156.   DOI: 10.11959/issn.2096-0271.2021044
    摘要199)   HTML71)    PDF(pc) (3125KB)(168)    收藏

    作为核心的医疗大数据,电子病历成为智慧医院建设的基础,对电子病历的分析利用进行研究对于智慧医院建设具有重要意义。提出了电子病历的生成、分析及利用一体化研究框架,阐述了电子病历的内涵,分析了电子病历系统与其他医疗信息系统的关系,梳理了电子病历的分析挖掘流程,并从计算机辅助诊断、治疗推荐以及管理支持3个角度总结了电子病历分析的应用;讨论了电子病历分析对智慧医院相关分级的影响,指出电子病历分析挖掘是智慧医院较高等级的要求,将助力高等级智慧医院建设;最后,从数据层面、模型层面以及应用层面对当前电子病历分析利用存在的问题进行分析,并给出相应意见和建议,为电子病历分析利用以及智慧医院的建设提供参考。

    图表 | 参考文献 | 相关文章 | 多维度评价
    23. 面向多星多任务的大数据处理系统设计
    马福利, 石涛, 陈玲, 郑岩, 熊森林
    大数据    2021, 7 (5): 3-16.   DOI: 10.11959/j.issn.2096-0271.2021045
    摘要198)   HTML75)    PDF(pc) (3287KB)(115)    收藏

    随着我国发射的空间科学卫星越来越多,科学数据量爆发式增长,空间科学卫星大数据处理逐渐成为空间科学创新发展过程中被重点关注的环节,建设一套高性能的地面数据处理系统是建设我国自主可控的空间科学大数据生态、助力科学成果产出的重要推手。面向多星多任务并行处理的任务需求,针对空间科学卫星大数据处理中的多分级分类、多源产品融合组织以及高时效性要求等特点,提出了适用于大数据处理业务场景的高可靠硬件环境设计方案,并针对科学卫星处理任务类型多的特点,提出了基于任务类型感知的统一资源调度系统。完成了面向多星多任务的可扩展地面大数据处理系统的研制,支撑了中国科学院空间科学先导专项中的科学卫星数据处理任务。

    图表 | 参考文献 | 相关文章 | 多维度评价
    24. 基于分布式缓存加速容器化深度学习的优化方法
    张凯, 车漾
    大数据    2021, 7 (5): 150-163.   DOI: 10.11959/j.issn.2096-0271.2021054
    摘要193)   HTML40)    PDF(pc) (1442KB)(125)    收藏

    使用GPU运行容器化深度学习模型训练任务,性能往往受限于数据加载和预处理效率。很多GPU计算资源浪费在等待从远程存储服务读取数据的过程中。首先介绍了基于容器和分布式缓存技术加速深度学习训练的方法,以及使用Alluxio和Kubernetes实现的系统架构和初步优化手段;然后阐述了TDCS及其训练任务与缓存数据互感知的协同调度策略;接着在Kubernetes容器集群中实现了TDCS,增强了分布式缓存加速大规模深度学习训练的可扩展性;最后用ResNet50图像分类模型训练任务进行性能验证。实验结果表明,相较于直接从远程存储服务中读取数据,TDCS可对运行在128块NVIDIA V100 GPU设备上的分布式训练任务实现2~3倍加速。

    图表 | 参考文献 | 相关文章 | 多维度评价
    25. 大数据认知计算在内容安全管控中的应用
    杜雪涛
    大数据    2021, 7 (6): 53-66.   DOI: 10.11959/j.issn.2096-0271.2021060
    摘要192)   HTML73)    PDF(pc) (1912KB)(80)    收藏

    通信网络中存在海量垃圾和不良信息,这些信息需要被阅读和理解,以便对其进行有效的特征提取和拦截封堵。基于人工分析的方法已经无法达到目的,需要使用基于大数据的认知计算技术代替人工进行海量的数据分析和理解,帮助人们制订内容安全管控策略。针对电信诈骗治理、不良消息治理、变体消息治理和不良网站治理4个方面遇到的实际问题,分别提出了大数据认知计算的解决方案,并给出了创新性实践的效果。实践表明,提出的解决方案能够快速发现不良信息,有效地提升内容管控质量。

    图表 | 参考文献 | 相关文章 | 多维度评价
    26. 面向非易失性内存的持久索引数据结构研究综述
    王永锋, 陈志广
    大数据    2021, 7 (6): 78-88.   DOI: 10.11959/j.issn.2096-0271.2021062
    摘要191)   HTML24)    PDF(pc) (1258KB)(155)    收藏

    随着非易失性内存从理论走向实用,现代存储系统的设计与实现将迎来颠覆性变革。针对传统存储设备设计的存储系统并不能充分利用非易失性内存带来的性能红利。为了构建高吞吐、低时延、大规模的存储系统,迫切需要设计与非易失性内存硬件特性相匹配的持久索引数据结构,从而进一步提升性能。从持久索引数据结构出发,分别对B+-Tree和哈希表在非易失性内存上的设计和优化进行分析,比较其优缺点,并展望了该方向的机遇与面临的挑战。

    图表 | 参考文献 | 相关文章 | 多维度评价
    27. 专题导读
    陈刚
    大数据    2022, 8 (1): 3-4.   DOI: 10.11959/j.issn.2096-0271.2022001-1
    摘要187)   HTML145)    PDF(pc) (706KB)(132)    收藏
    参考文献 | 相关文章 | 多维度评价
    28. 专题导读
    付琨, 邓波, 孙显
    大数据    2022, 8 (2): 1-2.   DOI: 10.11959/j.issn.2096-0271.2022012-1
    摘要179)   HTML107)    PDF(pc) (877KB)(108)    收藏
    参考文献 | 相关文章 | 多维度评价
    29. 企业电力征信大数据价值挖掘与应用
    辛保江, 李德文, 王兰兰
    大数据    2021, 7 (6): 138-146.   DOI: 10.11959/j.issn.2096-0271.2021067
    摘要178)   HTML52)    PDF(pc) (4850KB)(105)    收藏

    针对传统电力征信平台稳定性不足、测试准确性低等缺点,研究设计了一个电力征信大数据平台。使用联机分析法对电力大数据进行分析,并将其分为用户行为、费用细则、用户价值与个人信用四大类。以模块化结构为基础,分别对数据采集模块、数据分析模块、用户交互模块进行优化设计,采用KNN算法和交叉验证法对用电数据进行分类与决策处理,得出区域的用电规律,以此设计和调整配电方案。最后将提出的平台与传统电力征信平台进行对比,实验结果表明,提出的平台的稳定性和准确性都有所提升,在测试过程中准确性高达98.9%。

    图表 | 参考文献 | 相关文章 | 多维度评价
    30. 基于材料数值计算大数据的材料辐照机理发现
    任帅, 陈丹丹, 储根深, 白鹤, 李慧昭, 何远杰, 胡长军
    大数据    2021, 7 (6): 3-18.   DOI: 10.11959/j.issn.2096-0271.2021056
    摘要177)   HTML49)    PDF(pc) (2478KB)(65)    收藏

    材料辐照效应的数值模拟计算是认识核材料服役性能的重要手段,基于超级计算机的大规模、高保真材料数值模拟计算会产生海量数值计算数据,如何针对数值计算大数据的特点,在实现其高效存储的基础上,通过挖掘总结辐照损伤机理和性能演化规律,对于核材料设计研发、核安全等具有重要意义。论述了材料数值计算大数据的定义及其本质特征,综述了近年来的相关工作。以自主研发的材料辐照效应分子动力学软件MISA-MD和随机团簇动力学软件MISA-SCD在国产超级计算机上的实际算例为基础,提出了一种适用于材料数值计算大数据的、多尺度关联与耦合的分布式数值计算大数据存储体系(NDSA);采用XGBoost算法实现了MD中Frenkel缺陷对数的精确预测,基于并查集算法实现了级联碰撞团簇的划分;基于密度聚类的方法对KMC数值计算大数据进行挖掘,发现了类环状团簇,实现了原子团簇的识别与分类;基于第一性原理数值计算大数据库对现有的势函数模型进行了改进,提出了新的势函数模型构建方法AIPM。最后对材料数值计算大数据的应用前景进行了展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
下载排行
点击排行