全文下载排行

    一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

    当前位置: 一年内发表文章
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于观测数据的时间序列因果推断综述
    曾泽凡, 陈思雅, 龙洗, 金光
    大数据    2023, 9 (4): 139-158.   DOI: 10.11959/j.issn.2096-0271.2022059
    摘要601)   HTML55)    PDF(pc) (2614KB)(1348)    收藏

    数据存储量的扩大和计算能力的提升为基于观测数据推断时间序列的因果关系开辟了新途径。在时间序列因果推断的基本性质和研究现状的基础上,系统梳理了5种基于观测数据的时间序列因果推断方法,即Granger因果分析方法、基于信息论的方法、因果网络结构学习算法、基于结构因果模型的方法和基于非线性状态空间模型的方法。然后,根据不同应用场景的数据特点,结合方法的功能和适配性,对基于观测数据的时间序列因果推断方法在经济金融、医疗和生物学、地球系统科学和其他工程领域的典型应用进行了简要介绍。最后,结合时间序列因果推断的重难点问题,比较5种方法的优缺点,分析下一步研究重点,展望未来的研究方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    2. 数据要素价值化发展路径与对策研究
    杨云龙, 张亮, 杨旭蕾
    大数据    2023, 9 (6): 100-109.   DOI: 10.11959/j.issn.2096-0271.2022080
    摘要630)   HTML95)    PDF(pc) (2022KB)(762)    收藏

    基于国内外数据要素市场化的发展情况,总结了国外数据要素价值化发展的路径及特点。概括了我国数据要素市场在交易市场、应用场景等方面的现状,针对目前我国数据要素市场的发展情况,结合我国数据要素市场环境及发展特色,提出了构建中国特色数据要素市场模式的建议,以加快释放数据要素价值。

    图表 | 参考文献 | 相关文章 | 多维度评价
    3. 基于数据全生命周期的数据资产价值评估方法及应用
    李冬青, 刘吟啸, 邓镭, 李铭洋
    大数据    2023, 9 (3): 39-55.   DOI: 10.11959/j.issn.2096-0271.2023044
    摘要375)   HTML85)    PDF(pc) (3924KB)(483)    收藏

    数据资产价值评估是现代数据资产管理和运营以及数据流通的基础。基于数据全生命周期理论,从第一性原则出发,通过评估单张数据资产表的成本、数据管理以及数据应用价值,实现对单张数据资产表的系统性评估。利用数据仓库和图算法等技术,以层为单位,每层分摊,血缘路径继承,精确计算得到单张数据资产表的成本价值;然后利用层次分析法得到数据资产非经济因素权重,进而得到数据资产阶梯价值;最后通过实例分析验证了新方法的合理性和可行性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    4. 高等教育数字化转型的现状与发展研究
    钱海红, 王茂异, 熊贇
    大数据    2023, 9 (3): 56-70.   DOI: 10.11959/j.issn.2096-0271.2023032
    摘要420)   HTML96)    PDF(pc) (3934KB)(475)    收藏

    推进数字化转型成为实现教育高质量发展的关键。基于国内外教育数字化现状的调研,分析了教育数字化转型的核心、发展阶段及其技术。梳理了我国高等教育数字化转型面临的挑战,聚焦教学和管理,从数据、技术、人才等角度提出建议,探索高等教育数字化转型发展解决方案,为促进教育数字化提供参考。

    图表 | 参考文献 | 相关文章 | 多维度评价
    5. “东数西算”工程建设的现状、问题与对策
    童楠楠, 陈东, 李慧颖, 朱洪林
    大数据    2023, 9 (5): 9-19.   DOI: 10.11959/j.issn.2096-0271.2023055
    摘要294)   HTML112)    PDF(pc) (1659KB)(462)    收藏

    “东数西算”工程是构建我国国土空间领域内算力资源东西平衡、按需调度的重大战略工程。自我国全面启动“东数西算”工程建设以来,供需端、能源端、技术端、机制端等暴露出诸多问题,迫切需要从理论层面对“东数西算”工程的内在逻辑进行重新分析与定义。从经济形态、技术趋势、科技竞争、成本收益等不同视角分析了“东数西算”的内在逻辑,即算力基础设施化,并提出打造全国算力一张网的新型基础设施,以及从政策布局、网络直连、技术支持、机制创新等方面构建国家算力网的对策建议。

    图表 | 参考文献 | 相关文章 | 多维度评价
    6. 数字化转型服务平台:面向新竞争格局的企业竞争力建设
    叶雅珍, 朱扬勇
    大数据    2023, 9 (3): 3-14.   DOI: 10.11959/j.issn.2096-0271.2023029
    摘要427)   HTML184)    PDF(pc) (1743KB)(445)    收藏

    随着数据能力的提升和新兴技术的发展,经济形态和行业竞争格局正在发生深刻变化。为了能更好地应对未来的机遇和挑战,提高新格局下企业的竞争力,有必要理解和掌握数字化转型的有关内容。论述了传统企业将逐渐被新型企业取代的新竞争格局,辨析了数字化与数字化转型二者的区别,指出了传统企业在开展数字化转型时主要面临缺资金、缺人才、缺数据、缺意识等方面的挑战,提出了面向新竞争格局的数字化转型服务平台,为企业竞争力建设和数字化转型提供了一个可行方案。

    图表 | 参考文献 | 相关文章 | 多维度评价
    7. 生成式人工智能大模型赋能的元宇宙生命体:前瞻和挑战
    王皓, 潘昱杉, 潘毅
    大数据    2023, 9 (3): 85-96.   DOI: 10.11959/j.issn.2096-0271.2023033
    摘要379)   HTML95)    PDF(pc) (2778KB)(401)    收藏

    元宇宙已在医药、制造、金融产业、教育和公共服务等领域有所讨论,但基于虚拟现实的应用场景并未真正实现“现实-虚拟-现实”回路交互方式。其交互模式也没有真正意义上赋予虚拟世界等同现实世界的意识和感知。以医药为例,探讨了生成式人工智能大模型在元宇宙生命体中的前瞻应用和挑战,包括数字化生物细胞,构建数字化细胞之间的连接和数字神经元等,以促进元宇宙生命体具有与物理世界一致的感知和生物化学反应,从而赋能医药领域的发展。针对目前元宇宙和生成式人工智能大模型各自的优缺点,进一步讨论通过巧妙设计人机协同机制,促进人与元宇宙生命体在医药中的有意识交互。

    图表 | 参考文献 | 相关文章 | 多维度评价
    8. 数字内容生成、检测与取证技术综述
    曹娟, 朱勇椿, 亓鹏, 黄子尧, 杨天韵, 王政嘉, 卜语嫣
    大数据    2023, 9 (5): 150-173.   DOI: 10.11959/j.issn.2096-0271.2023066
    摘要207)   HTML55)    PDF(pc) (3015KB)(400)    收藏

    近年来,数字生成内容技术得到了极大的发展,数字内容的检测和取证技术面临新的挑战。首先从自然语言大模型、视觉生成技术、多模态生成技术3个方面介绍数字内容生成技术,从生成文本检测、生成图片检测、生成音视频检测3个方面介绍数字内容检测技术,从利用事实信息和伪造痕迹两方面介绍数字内容取证技术;接着介绍这些技术的应用场景;最后对该研究领域的未来工作进行展望,指出几个需要重点关注的方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    9. 我国中小企业数字化发展评价与区域差异研究
    冯旭, 曹浩, 胡杨, 王秀芹, 张皓翔, 凌端新
    大数据    2023, 9 (3): 168-180.   DOI: 10.11959/j.issn.2096-0271.2023045
    摘要157)   HTML34)    PDF(pc) (1945KB)(396)    收藏

    基于2021年省级数据,从政策、设施、服务、投入和成效5个方面构建区域中小企业数字化发展评价指标体系,采用层次分析法和熵权法进行指标权重设置,采用分级打分法进行指标数据标准化处理,对我国省域中小企业数字化发展水平进行了测算。研究发现,我国中小企业数字化发展区域差异明显,东部地区综合指数最高,中部、西部和东北部地区依次递减,且均低于全国平均水平;综合指数与进出口总额呈明显正相关关系,且相关性高于综合指数与GDP的相关性;分项指数中政策引导指数领先,要素投入指数相对较低。基于此,提出了强化数字资金支持、降低数字设施使用门槛、提升数字化转型服务支撑和加强数字化人才供给4个政策建议,以促进中小企业的数字化发展。

    图表 | 参考文献 | 相关文章 | 多维度评价
    10. “东数西算”战略与问题的分析研究
    石勇, 寇纲, 李彪
    大数据    2023, 9 (5): 3-8.   DOI: 10.11959/j.issn.2096-0271.2023054
    摘要257)   HTML103)    PDF(pc) (1302KB)(361)    收藏

    2021年3月,“十四五”规划正式发布,加快数字化发展、建设数字中国是未来数字经济发展模式的目标。作为数字经济的基础,国家发布了多项规定来统筹规划、促进大数据中心一体化和算力枢纽节点(即“东数西算”)的整体建设,服务于数字经济的发展。本刊的“东数西算”专题中,根据对八大节点的实地调研情况,详细分析各地特点及面临的一系列问题。同时,基于调研结果和研究成果从地方建设和就业收益平衡、网络基础建设、政府指导和市场化并举、大数据自主软硬件评价体系、涉外数据交流和监管、人才队伍培养6 个方面提出了发现的问题和相应的建议,以助力高质量地加快实施全国一体化大数据中心。

    参考文献 | 相关文章 | 多维度评价
    11. 数据管道模型:场外流式数据市场形态探索
    任洪润, 朱扬勇
    大数据    2023, 9 (3): 15-28.   DOI: 10.11959/j.issn.2096-0271.2023031
    摘要156)   HTML49)    PDF(pc) (2587KB)(338)    收藏

    当前数据要素市场建设探索主要集中在数据交易场所(场内)建设,而流式数据市场指数据供应商向数据使用者持续、快速地供应特定数据的市场,流式数据并不适合在场内交易,因此需要探索流式数据的场外交易模式。研究了当前流式数据市场的运行现状,指出了市场无序、监管工具不足是存在的主要问题,提出了场外流式数据市场的数据管道模型,包括管道流通要件(数据管道、数据工厂、数据供应链)、市场规范要件(数据计量表、质量抽检器、合规审核仪)等,论证了数据管道模型的技术可行性,以期为场外数据市场建设、规范和监管提供理论和技术支持。

    图表 | 参考文献 | 相关文章 | 多维度评价
    12. 算法应用风险与治理研究
    李婧文, 李雅文
    大数据    2023, 9 (3): 140-149.   DOI: 10.11959/j.issn.2096-0271.2023028
    摘要197)   HTML63)    PDF(pc) (1243KB)(332)    收藏

    随着信息技术的迅猛发展和深入应用,算法被广泛地运用到交通、医疗、电子商务、信息服务和公共管理等领域。但其自身呈现的数据依赖性、逻辑黑箱性和通用目的性等特征,也引发了算法训练中的数据滥用、公共管理中的算法歧视、信息服务中的算法操纵、市场竞争中的算法合谋等问题。为了应对算法应用带来的问题,各国积极采取措施,加强对算法应用的治理。推进算法的合规利用,有必要进一步强化顶层设计、完善治理格局、丰富治理手段、加强国际协作,不断健全算法治理体系。

    参考文献 | 相关文章 | 多维度评价
    13. 专题:东数西算
    石勇, 寇纲, 李彪
    大数据    2023, 9 (5): 1-2.   DOI: 10.11959/j.issn.2096-0271.2023054-1
    摘要229)   HTML226)    PDF(pc) (831KB)(329)    收藏
    参考文献 | 相关文章 | 多维度评价
    14. 基于过程视角的我国政府数据共享流通管道建设关键问题和策略研究
    王跃
    大数据    2023, 9 (3): 29-38.   DOI: 10.11959/j.issn.2096-0271.2023037
    摘要127)   HTML31)    PDF(pc) (2199KB)(321)    收藏

    探讨了数据流通管道的概念及组成要素,从政府数据管理部门实施数据共享的中观管理推进角度,构建面向共享全过程的我国政府数据共享流通分析框架,结合学术界提出的影响分析维度,基于对全国主要政府数据管理部门的调研分析,明晰我国政府数据共享流通管道的最新情况,分析明确当前最主要的影响因素与关键问题,进而围绕政府数据共享流通管道的技术平台、组织制度、数据资源三大组成要素,提出针对性建设策略建议。

    图表 | 参考文献 | 相关文章 | 多维度评价
    15. 高校数据资产编目研究
    刘豆豆, 焦宝臣
    大数据    2023, 9 (3): 71-84.   DOI: 10.11959/j.issn.2096-0271.2023030
    摘要124)   HTML30)    PDF(pc) (3577KB)(321)    收藏

    在网络、数据安全愈发重要的数字经济时代,在尚缺乏科学合理的适用于高校的数据资产编目模型的现状下,分析了高校数据资产编目的功能和作用,提出了以数据应用为切入点、以数据服务为目标的高校数据资产编目模型。该模型由相辅相成、互为支撑的数据资产目录建设、数据安全、数据服务三部分构成。基于模型总结了高校数据资产编目五步骤工作框架,包括数据盘点、数据分类、数据分级、数据标签、数据开放。以南开大学为例,依据构建的模型和工作框架具体实施数据资产编目工作,取得了较好的应用效果。这表明提出的模型和工作框架具有较强的可操作性,能够为各高校开展数据资产编目提供科学可行的技术路线和方法指导。

    图表 | 参考文献 | 相关文章 | 多维度评价
    16. “东数西算”背景下贵州省大数据产业发展现状、问题与对策
    邓伟, 邓周灰
    大数据    2023, 9 (5): 90-99.   DOI: 10.11959/j.issn.2096-0271.2023061
    摘要146)   HTML69)    PDF(pc) (2296KB)(315)    收藏

    “东数西算”工程是基于国家战略、区域协同、能源优化、产业技术发展的科学规划,是为了实现全国算力规模化、集约化以及跨域调度,优化算力资源的全国一体化空间布局。基于数字经济发展和数字产业生态体系的视角,分析贵州在“东数西算”背景下的数字经济产业基础,并从算力资源建设、数据流通、数据应用等角度提出对策建议。

    图表 | 参考文献 | 相关文章 | 多维度评价
    17. 大数据安全与隐私计算
    凌捷
    大数据    2023, 9 (6): 1-2.   DOI: 10.11959/j.issn.2096-0271.2023074-1
    摘要251)   HTML150)    PDF(pc) (816KB)(315)    收藏
    参考文献 | 相关文章 | 多维度评价
    18. 基于数据市场类型的数据定价模型研究
    任洪润, 朱扬勇
    大数据    2023, 9 (4): 116-138.   DOI: 10.11959/j.issn.2096-0271.2023052
    摘要158)   HTML42)    PDF(pc) (1503KB)(313)    收藏

    市场是产品价格形成的过程,不同市场的价格形成方式是不一样的,产品定价模型是对市场形成产品价格过程的一种抽象。当前,数据的市场需求已经形成,但有效的数据市场尚未形成,数据定价还在探索阶段。现有的数据定价模型大部分是针对某些特定数据交易场景设计的,而不是针对特定数据市场类型设计的。考虑数据市场的经济学市场类型,从经济学视角将当前数据市场划分为卖方垄断市场、买方垄断市场、寡头垄断市场、中心化完全竞争市场以及去中心化完全竞争市场5种数据市场类型,将现有的数据定价模型归纳到相应的数据市场类型中。通过分析数据市场类型与数据定价模型的依存关系,提出数据定价的“市场类型原则”,为数据要素市场建设及数据定价提供理论指导。

    图表 | 参考文献 | 相关文章 | 多维度评价
    19. 虚拟人形象合成技术综述
    邓钇敏, 张旭龙, 司世景, 王健宗, 肖京
    大数据    2023, 9 (3): 114-139.   DOI: 10.11959/j.issn.2096-0271.2022081
    摘要195)   HTML41)    PDF(pc) (3812KB)(298)    收藏

    随着元宇宙兴起,针对虚拟人形象化高效建模的需求日益迫切。从人类图像数据集中构建人类模型一直是计算机视觉的热门话题,其中3D虚拟人合成可以视作三维重建的子模块,重点在于对复杂的人体结构和表面细节的还原。对近年来虚拟人形象构建相关文献进行了全面调研,研究范围覆盖了全身形象、头部形象以及衣物建模等领域。分析归纳构建工作的基本原理,从各自技术路线层面出发将虚拟人合成方法分为基于网格、基于图像、基于体素、基于隐式表示、混合表示5类。首先介绍各类方法的基本原理,然后结合现有工作讨论具体技术,并指出各类方法的优缺点。此外还介绍了部分常见的模型质量评估的数据集和评价指标,简要介绍了虚拟人的常见应用。最后对虚拟人合成技术未来发展方向进行了展望,以合成高质量、高保真度、低延迟的虚拟人形象。

    图表 | 参考文献 | 相关文章 | 多维度评价
    20. “东数西算”甘肃枢纽庆阳集群:现状与前景
    王华存, 刘伯霞, 丑一斐, 朱洪林
    大数据    2023, 9 (5): 111-133.   DOI: 10.11959/j.issn.2096-0271.2023063
    摘要174)   HTML38)    PDF(pc) (4058KB)(295)    收藏

    旨在分析“东数西算”甘肃枢纽庆阳集群的发展现状、查找存在问题、展望发展前景、加快甘肃枢纽庆阳集群建设步伐。采用文献调研及实地调研方法对庆阳集群的特色优势、取得的成绩、面临的挑战、存在的问题进行了调研和分析,并对庆阳集群建设前景进行了展望。建议从国家、省级、集群3个层面部署,通过实施产业创新发展期、产业生态提升期、产业高地铸造期三步走战略,完成“七大战略”任务,重点发展“东数西算”核心、衍生、赋能“三大产业”,形成智算、智能、智产“三大体系”,建成“绿色化、科技型、安全式”智慧园区。

    图表 | 参考文献 | 相关文章 | 多维度评价
    21. “东数西算”全国一体协同数据安全防护体系建设思路初探
    朱洪林, 国强, 寿贝宁
    大数据    2023, 9 (5): 140-149.   DOI: 10.11959/j.issn.2096-0271.2023065
    摘要284)   HTML68)    PDF(pc) (2531KB)(295)    收藏

    对“东数西算”工程安全防护能力建设面临的体系化布局、统筹组织推进、统一标准规范等若干问题进行了分析,在此基础上提出了构建全国一体协同的数据安全防护体系建设思路。

    图表 | 参考文献 | 相关文章 | 多维度评价
    22. 大数据与计算模型
    李国杰
    大数据    2024, 10 (1): 9-16.   DOI: 10.11959/j.issn.2096-0271.2024017
    摘要308)   HTML143)    PDF(pc) (1457KB)(293)    收藏

    当前,人工智能持续升温,大语言模型吸引了众多人士的关注,并在全球范围内掀起了一股热潮。人工智能的成功本质上不是大算力“出奇迹”,而是改变了计算模型。首先,肯定了数据对于人工智能的基础性作用,指出合成数据将是未来数据的主要来源。然后,回顾了计算模型的发展历程,重点介绍了神经网络模型与图灵模型的历史性竞争;指出了大模型的重要标志是机器涌现智能,强调大模型的本质是“压缩”;分析了大模型产生“幻觉”的原因。最后,呼吁科技界在智能化科研中要重视大科学模型。

    参考文献 | 相关文章 | 多维度评价
    23. 专题:数据资产化与数字化转型
    朱扬勇, 王兴伟
    大数据    2023, 9 (3): 1-2.   DOI: 10.11959/j.issn.2096-0271.2023029-1
    摘要313)   HTML147)    PDF(pc) (806KB)(280)    收藏
    参考文献 | 相关文章 | 多维度评价
    24. “东数西算”宁夏节点数字经济产业发展研究
    石勇, 刘平, 冯锦源
    大数据    2023, 9 (5): 100-110.   DOI: 10.11959/j.issn.2096-0271.2023062
    摘要122)   HTML42)    PDF(pc) (1525KB)(277)    收藏

    基于宁夏大数据产业的发展现状,利用PESTEL模型对大数据产业的发展环境进行评估,并采用SWOT分析法,将宁夏大数据产业与宁夏的传统产业和其他地区的大数据产业进行多方面对比分析。基于分析结果,分别从完善大数据发展环境、优化大数据产业结构、绿色发展等角度提出发展建议。

    图表 | 参考文献 | 相关文章 | 多维度评价
    25. 工业数字化转型:故障诊断方法研究进展
    杨彪, 熊贇, 傅玲, 徐蔚峰, 李婧
    大数据    2024, 10 (1): 110-126.   DOI: 10.11959/j.issn.2096-0271.2023041
    摘要390)   HTML53)    PDF(pc) (3317KB)(273)    收藏

    工业数字化是我国工业产业转型升级的重要手段,数字化转型成为我国工业发展的重要趋势。工业系统的可靠性和稳定性对于工业生产的高质量和可持续发展具有重要作用。故障会影响工业系统的运行,甚至造成重大的安全事故和经济损失。为应对这一问题,故障诊断技术应运而生并逐步发展。高效、高质的故障诊断数字化技术已经成为工业数字化转型的关键技术。分析了工业领域故障诊断数字化方法的研究进展,按照其发展特点划分为领域经验主导的建模方法、数据驱动与领域经验结合的数字化方法、数据驱动主导与可解释性结合的数字化方法3个阶段,重点探究每个阶段方法的基本思想及其特点等,并探讨未来的研究方向,为推动工业数字化转型提供参考。

    图表 | 参考文献 | 相关文章 | 多维度评价
    26. “东数西算”背景下数据中心碳减排效益分析
    周瑜, 张炜乐, 段婉婷
    大数据    2023, 9 (5): 48-60.   DOI: 10.11959/j.issn.2096-0271.2023058
    摘要117)   HTML15)    PDF(pc) (2148KB)(270)    收藏

    作为算力承接地,西部地区拥有丰厚的自然资源禀赋,需充分发挥其在能源、气候等方面的优势。“东数西算”背景下,数据中心急需对算力转移过程的碳减排效益进行量化分析。在考虑可再生能源、气候因素和传输过程3个影响因素的情况下,构建了数据中心工作负载转移的碳排放量核算模型,以“东数西算”八大节点为例进行算例分析。结果发现,相较于可再生能源和气候因素所减少的碳排放量,传输过程造成的额外碳排放量微乎其微,在仅考虑前两者的情况下,每转移1 kW·h的工作负载,碳排放量可减少0.053~0.344 kg。为提高负载转移带来的碳排放效益,西部地区应当引导数据中心向资源密集处聚集,大力发展清洁能源产业,加大清洁能源开发力度,促进清洁能源消纳程度,同时把握此次机遇,吸引数字产业落地,推动传统产业数字化转型。

    图表 | 参考文献 | 相关文章 | 多维度评价
    27. 大数据技术在数据安全治理中的应用
    程伟, 马成, 凌捷
    大数据    2023, 9 (6): 3-14.   DOI: 10.11959/j.issn.2096-0271.2023074
    摘要289)   HTML103)    PDF(pc) (2444KB)(269)    收藏

    面对新形势下的数据安全治理挑战,顺应数据安全领域的技术发展趋势,针对大型国企在数据安全治理实际应用中突出的关键权限人员识别问题,提出了一种基于图算法的关键权限人员识别技术。该技术可以发现系统中潜在的权限影响因素,并可从多个角度衡量不同含义的权重影响力,识别结果可解释性强。针对数据安全治理中的用户与实体行为异常检测问题,提出一种基于生成对抗网络的用户与实体行为异常检测方法,实验结果表明,所提方法的精确率、召回率和F1值的平均值均优于对比基线模型方法。设计开发了数据安全平台,平台在降低数据安全风险、辅助企业合规建设、促进数据开发利用等方面起到了重要作用,已在多个数据集中管理项目中得到应用,能满足安全场景下的大数据处理需求,具有较好的应用推广价值。

    图表 | 参考文献 | 相关文章 | 多维度评价
    28. 长三角国家算力枢纽节点赋能制造业数字化转型的机理与路径
    刘业政, 黄丽华, 朱扬勇, 孙见山, 宋靖达
    大数据    2023, 9 (5): 61-77.   DOI: 10.11959/j.issn.2096-0271.2023059
    摘要153)   HTML33)    PDF(pc) (1409KB)(265)    收藏

    长三角作为先进制造业最集聚、发展基础最雄厚、创新型经济最活跃和最具潜力的国家级创新策源地,“东数西算”工程中国家算力枢纽节点的建设,对加快推动长三角先进制造业实现升级转型具有重要意义。因此,结合当前制造业数字化转型过程中遇到的困境与问题,探寻长三角国家算力枢纽节点赋能制造业数字化转型的逻辑机理、现实挑战和实现路径,以期推动制造业转型升级和长三角区域一体化绿色高质量发展。

    参考文献 | 相关文章 | 多维度评价
    29. “东数西算”粤港澳大湾区(广东)枢纽的国际化发展及保障机制
    杜洋, 蔡小芳, 李彪
    大数据    2023, 9 (5): 78-89.   DOI: 10.11959/j.issn.2096-0271.2023060
    摘要126)   HTML28)    PDF(pc) (1387KB)(264)    收藏

    数字经济已成为国家经济发展的重点,广东与港澳合作探索数字化发展,在数字中国建设中起着重要作用。算力中心是数字经济发展的基石,粤港澳大湾区的协同发展为算力中心的建设提供了机遇。从澳港大湾区的起源、经济状况、数字经济规划、创新制度等角度出发,探讨了大湾区的基础情况和算力发展情况,进而从算力支撑、CDO角色职责等角度提出发展建议。

    图表 | 参考文献 | 相关文章 | 多维度评价
    30. 跨信任域的联邦k-支配Sk yline查询算法
    史烨轩, 童咏昕, 周昊, 许可, 吕卫锋
    大数据    2023, 9 (4): 32-43.   DOI: 10.11959/j.issn.2096-0271.2023047
    摘要79)   HTML4)    PDF(pc) (3073KB)(259)    收藏

    k-支配Skyline查询是一种主流的Skyline查询变种,其在多目标决策与推荐领域有着广泛的应用。随着这些应用规模不断扩大,在由多个参与方组成的数据联邦中进行跨域k-支配Skyline查询的需求日益旺盛。然而,由于数据联邦中的参与方之间彼此不互信,进行跨信任域的查询计算需引入大量安全操作,效率较低。为此提出了一种基于跨域隐私向量聚合的算法,从而实现高效的联邦k-支配Skyline查询,并运用一种密文压缩技术进一步优化查询效率,最后通过充分的实验验证了所提方案的优越性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    31. 漫威电影中的智能穿戴
    王元卓, 张琨, 陆源
    大数据    2023, 9 (3): 181-183.   DOI: 10.11959/j.issn.2096-0271.2023046
    摘要93)   HTML31)    PDF(pc) (2394KB)(257)    收藏
    图表 | 参考文献 | 相关文章 | 多维度评价
    32. “东数西算”背景下四川战略定位与策略研究
    李彪, 李少昆, 寇纲, 陈星潼, 卓训方
    大数据    2023, 9 (5): 20-31.   DOI: 10.11959/j.issn.2096-0271.2023056
    摘要162)   HTML46)    PDF(pc) (2313KB)(256)    收藏

    四川“东数西算”枢纽节点建设是全国一体化大数据中心创新体系建设的重要组成部分,作为承担“东数”“西算”双重任务的关键节点,其发展具有特殊性。为此,基于四川省在工业体系、能源禀赋、算力成本、科教人才方面的优势,围绕四川与其他东部节点、西部节点和重庆三者之间的竞争关系,对四川在“东数西算”背景下的战略定位与发展策略进行了系统剖析。针对关键问题,提出统筹定位发展、做好算力消纳、优化电价机制等建议。

    图表 | 参考文献 | 相关文章 | 多维度评价
    33. 基于多源异构时空数据融合的交通流量预测模型
    安洋, 孙健玮, 李倩, 宫永顺
    大数据    2023, 9 (4): 69-82.   DOI: 10.11959/j.issn.2096-0271.2023042
    摘要117)   HTML25)    PDF(pc) (3423KB)(252)    收藏

    交通流量预测问题具有多源异构性,未来时刻的流量不仅与之前时刻的流量相关,同时也受城市区域间关系、天气情况、兴趣点(point of interest,POI)等异构时空数据的影响。针对此问题,提出一种基于多源异构时空数据融合的交通流量预测模型MHF-STNet。首先使用聚类方法获得城市区域不同的流量模式,并使用拼接、权重相加、注意力机制等多种方式融合交通流量、城市区域间的位置关系、天气、POI、工作日、假期多个模态的时空数据,使用深度学习方法对异构数据统一建模,预测未来时刻的交通流量。在北京出租车、纽约出租车和纽约自行车3个流量数据集上进行实验,与经典的交通流量预测模型相比,MHFSTNet的预测准确度有所提升。结果验证了MHF-STNet对异构时空数据统一建模的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    34. 数据中台框架与实践
    吴信东, 应泽宇, 盛绍静, 蒋婷婷, 卜晨阳, 张赞
    大数据    2023, 9 (6): 137-159.   DOI: 10.11959/j.issn.2096-0271.2023034
    摘要218)   HTML75)    PDF(pc) (4476KB)(244)    收藏

    数据中台将一个机构(企业、事业或政府部门)的数据作为战略资产进行管理,是从数据收集到处理应用的一套管理机制,以期提高数据质量,实现广泛的数据共享,最终实现数据价值最大化。给出数据中台的定义,提出数据中台参考技术框架,并分别对物理管理、逻辑管理、数据资产管理、数据服务和信息安全管理的组成和技术进行了展开讨论。最后以华谱系统建设为例,介绍面向家谱大数据、结合HAO智能模型的数据中台实现——华谱数据中台。

    图表 | 参考文献 | 相关文章 | 多维度评价
    35. 基于概率分布差异的医学命名实体识别方法
    刘聪, 吕雪峰, 王宏林, 王晓伟, 陆瑾, 孙顺, 胡松奇
    大数据    2023, 9 (4): 159-171.   DOI: 10.11959/j.issn.2096-0271.2023008
    摘要58)   HTML5)    PDF(pc) (3402KB)(241)    收藏

    医学命名实体识别是从医学文本中抽取出指代特定概念的医学实体,是医学信息抽取的基础性任务。当前主流的医学命名实体识别算法普遍基于深度学习技术,需要大量高质量的标注样本进行模型训练。然而医学领域的样本标注成本很高,严重限制了模型性能的提升。为了降低模型对标注样本的需求,一种重要的方法是基于主动学习思想,设计合理的样本采样策略,自动选取高价值样本优先标注,从而使模型提前收敛。现有算法普遍基于样本长度、样本识别的概率等特征来设计采样策略,忽视了样本类别分布这一深层次特征,导致命名实体识别召回率较低。提出了一种基于概率分布差异的主动学习算法,通过计算样本间的概率分布差异来评估样本的标注价值,并在标注样本更新时动态优化模型。在真实的医学检查文本上的实验表明,相比已有算法,达到同等的模型性能,该算法所需要的标注数据可缩减10%以上;在相同标注样本量的情况下,本算法F1值提高5%以上。

    图表 | 参考文献 | 相关文章 | 多维度评价
    36. 构建支持大模型训练的计算机系统需要考虑的4个问题
    郑纬民
    大数据    2024, 10 (1): 1-8.   DOI: 10.11959/j.issn.2096-0271.2024016
    摘要188)   HTML134)    PDF(pc) (56597KB)(236)    收藏

    支持大模型训练的计算机系统有3种类型,其中基于国产AI芯片系统的生态系统不是很好,要想改变这个局面,需要做好AI编译器、并行加速等10个关键软件;基于超级计算机的系统需要做好软硬件协同设计,从而更好地服务于大模型训练。针对如何搭建大模型的基础设施,提出4点平衡设计,以确保系统的性能、可靠性和可扩展性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    37. 基于数据政策文件的产业分析和思考
    毕亲波, 潘柱廷
    大数据    2023, 9 (5): 174-184.   DOI: 10.11959/j.issn.2096-0271.2023036
    摘要208)   HTML56)    PDF(pc) (1240KB)(235)    收藏

    交叉解读3个数据政策文件,从数据产业发展趋势、用户数据认知和科技创新技术应用的视角提出了有关产业发展的若干思考,认为文件所聚焦的数据以及以数据为关键要素的产业发展会精准点燃经济发展的引爆点。首先,论述了数据政策文件对产业发展的影响——将能够加快数据产业和数据安全产业的发展进程,并赋能实体经济,使其成为高质量发展的主干道和主赛场。其次,阐述了数据政策文件对用户数据认知的影响——有助于理解数据要素和数据安全的价值共生关系,建立数据要素及安全一体化治理的数据认知,探索数据运营新思路、新机制、新方法。最后,围绕数据流通,描述了数据政策文件对技术和学术研究的影响——基于“需求牵引、业务驱动和实践先行”的原则,开展相关技术攻关研究,补齐供给侧技术短板,提高科技创新供给能力。

    参考文献 | 相关文章 | 多维度评价
    38. 跨空间域数据管理分布式共识算法:现状、挑战和展望
    李伟明, 李彤, 张大方, 戴隆超, 柴云鹏
    大数据    2023, 9 (4): 3-15.   DOI: 10.11959/j.issn.2096-0271.2023040
    摘要105)   HTML18)    PDF(pc) (2422KB)(230)    收藏

    随着数字经济的飞速发展,以及“全国一体化数据中心”和“东数西算”等基础设施的不断完善,数据要素流通的大趋势使数据服务逐步由面向单一空间域的数据管理转变为面向跨空间域的数据管理。跨域数据管理需要通过分布式共识算法使数据一致。然而,已有的分布式共识算法仅考虑单数据中心的情况,没有考虑跨数据中心之间的网络通信的不确定性,从而在跨空间域场景下面临日志同步时延大、系统吞吐量低下等问题。系统地梳理了跨空间域下的分布式共识算法的现状以及面临的新挑战,并针对解决这些挑战的技术路线进行了展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    39. 基于多方安全计算的公共数据融合创新模式研究及应用
    金加和, 赵程遥, 求昊泽, 刘鹏
    大数据    2023, 9 (6): 15-27.   DOI: 10.11959/j.issn.2096-0271.2023073
    摘要129)   HTML25)    PDF(pc) (2302KB)(223)    收藏

    多方安全计算技术已广泛应用于金融、互联网等领域,用于解决“数据孤岛”难题,然而其在公共数据领域的应用尚不成熟。针对公共数据领域提出了基于多方安全计算的公共数据融合创新模式,开发设计了在保护数据安全前提下利用各主体公共数据联合计算的技术架构。该模式通过技术创新突破制度制约,实现数据价值提升和保障数据安全的兼顾。主要分析了模式中多方安全计算核心系统的3个子层:联合计算子结构层、安全关系代数层和多方安全计算基础算子层。此外,还给出了实现公共数据融合创新模式的通用流程,并对公共数据融合创新模式的应用实例进行了阐述,为助力数字中国建设、畅通数据资源大循环提供新模式的借鉴。

    图表 | 参考文献 | 相关文章 | 多维度评价
    40. 人工参与的迭代式数据清洗方法研究
    刘一达, 丁小欧, 王宏志, 杨东华
    大数据    2023, 9 (4): 59-68.   DOI: 10.11959/j.issn.2096-0271.2023048
    摘要67)   HTML14)    PDF(pc) (2826KB)(220)    收藏

    数据采集技术的进步导致了数据集规模的飞速上涨,由于数据的大规模和高复杂性引起了严重的数据质量问题,数据清洗是数据活动中必要且重要的环节。为了在保证清洗准确率的情况下有效地降低人工标注成本,提出了一种人工参与的迭代式的数据清洗方法(IDCHI)。该方法在检测模块中提出了数据选择优化方法,使分类器在初始阶段就拥有较高的准确度;并进一步提出了待人工标注数据选择方法,有效地降低人工标注的数据量。实验结果表明该方法可有效且高效地清洗错误数据。

    图表 | 参考文献 | 相关文章 | 多维度评价
下载排行
点击排行