通信学术平台

编辑部公告

更多...

【喜报】《大数据》成功入选“RCCSE中国核心学术期刊（A）”！ 2024-06-28

《大数据》专题征文：数据流通安全治理（截稿时间：2024年8月15日） 2024-06-12

【喜报】《大数据》再次获评国家哲学社会科学文献中心年度综合性人文社会科学最受欢迎.. 2024-06-04

《大数据》专题征文：数据知识产权探索（截稿时间：2024年8月31日） 2024-06-04

《大数据》专题征文：大模型与知识图谱（截稿时间：2024年7月31日） 2024-04-28

《大数据》专题一览表 2024-01-31

推荐文章

更多...

表现性语音合成综述

唐浩彬, 张旭龙, 王健宗, 程宁, 肖京

大数据. 2023, 9 (6): 53-71. doi: 10.11959/j.issn.2096-0271.2022082

摘要( 358 )

在线阅读 (147)

PDF下载 (3524KB)(454)

可视化

图表 | 参考文献 | 相关文章 | 多维度评价

“东数西算”工程建设的现状、问题与对策

童楠楠, 陈东, 李慧颖, 朱洪林

大数据. 2023, 9 (5): 9-19. doi: 10.11959/j.issn.2096-0271.2023055

摘要( 456 )

在线阅读 (187)

PDF下载 (1659KB)(781)

可视化

图表 | 参考文献 | 相关文章 | 多维度评价

2024年第10卷第3期刊出日期：2024-05-15

2024年第10卷第3期
刊出日期：2024-05-15

专题：政务数据处理

安小米

大数据. 2024, 10(3): 1-2. doi:10.11959/j.issn.2096-0271.2024004-1

摘要 ( 96 )

在线阅读 ( 142 )

PDF下载 (754KB) ( 180 )

可视化

参考文献 | 相关文章

政务数据标识技术研究进展及下一代政务数据标识体系

王昀, 郭毅峰, 苏晓亮, 周武爱, 张皖哲, 许大虎, 周强, 冯建华

大数据. 2024, 10(3): 3-15. doi:10.11959/j.issn.2096-0271.2024004

摘要 ( 126 )

在线阅读 ( 63 )

PDF下载 (2480KB) ( 151 )

可视化

数据和表 | 参考文献 | 相关文章

政务数据标识是建设全国一体化政务大数据体系的一项基础性工作。对数据标识技术的研究进展进行了总结，比较了不同数据标识技术编码规则的异同，并进一步总结了政务数据标识及应用进展。结合政务数据所具有的权责明确、安全性要求高、兼容性需求强等特点，提出了下一代政务数据标识体系Gcode。Gcode由外部码、内部码和安全码3个部分组成。其中，外部码兼容了统一社会信息用代码，内部码建立了“机构部门-系统-数据”的关联关系，安全码通过引入区块链技术实现防伪验真。Gcode具有权责明确、兼容性强、安全性高等特点，能够支持政务数据跨层级、跨地域、跨系统、跨部门、跨业务共享，可有力推动实现政务数据“一数一源”。

我国政务数据分类分级实施关键问题与实践研究

王跃, 苏娜

大数据. 2024, 10(3): 16-26. doi:10.11959/j.issn.2096-0271.2024035

摘要 ( 134 )

在线阅读 ( 38 )

PDF下载 (1592KB) ( 154 )

可视化

数据和表 | 参考文献 | 相关文章

数据分类分级是保障数据安全流通、推动数据价值释放的基础前提。聚焦政务数据分类分级这一政府数字化改革中的关键任务，采用基于理论的案例研究方法，基于各省级地方及部委公开发布的方案，对我国政务数据分类分级实施情况进行系统梳理与量化分析。总结了我国政务数据分类分级实施的四大关键过程与五大特点；从政务数据分类分级的特殊复杂性出发，提出我国政务数据分类分级实施存在整体目标定位不清、分类分级对象各异、分类分级关系割裂、安全分级标准不一4个问题，并提供应对方案；基于国家某部委政务数据分类分级实践，验证应对方案的科学性、有效性，为构建全国统一的政务数据分类分级体系提供参考。

省级政务大数据平台建设模式研究与启示

孟凡, 杨群力, 高阳, 李文斌

大数据. 2024, 10(3): 27-39. doi:10.11959/j.issn.2096-0271.2024022

摘要 ( 125 )

在线阅读 ( 78 )

PDF下载 (2152KB) ( 180 )

可视化

数据和表 | 参考文献 | 相关文章

建设高质量政务大数据资源平台是实现跨部门、跨区域、跨层级政务信息集成融合，加快建设数字政府、提升公共服务和社会治理等数字智能化水平的重要基础工程。首先，回顾我国电子政务发展历程，并总结出传统省级政务大数据平台的3种建设模式以及存在的问题，即数据鲜活性低、数据一致性差、业务协同管理难、基础支撑力弱和总体投入高。其次，对江苏信用一体化信息资源管控平台进行案例分析，阐述以江苏案例为例的原因，针对传统建设模式存在的问题，提出对应的解决思路和总体架构设计，并梳理出江苏案例的4个借鉴价值。最后，在总结江苏研究和实践经验的基础上，归纳出5点建议，为各省研究、制定省级政务大数据平台的建设指南等政策性文件提供参考。

基于联邦学习的政务大数据平台应用研究

吴坚平, 陈超超, 金加和, 吴春明

大数据. 2024, 10(3): 40-54. doi:10.11959/j.issn.2096-0271.2024032

摘要 ( 126 )

在线阅读 ( 32 )

PDF下载 (2642KB) ( 173 )

可视化

数据和表 | 参考文献 | 相关文章

当前数字政府建设已进入深水区，政务大数据平台作为数据底座支撑各类政务信息化应用，其隐私数据的安全性和合规性一直被业界广泛关注。联邦学习是一类解决数据孤岛的重要方法，基于联邦学习的政务一体化大数据平台应用具有较高的研究价值。首先，介绍政务大数据平台及联邦学习应用现状；然后，分析政务大数据平台面临的隐私数据的采集、分类分级、共享三大管理挑战；接着，阐述基于联邦学习的推荐算法和隐私集合求交技术的解决方法；最后，对政务大数据平台隐私数据的未来应用进行了总结和展望。

“数据赋能”驱动智能化政府建设的逻辑与路径

王蕤, 刘震

大数据. 2024, 10(3): 55-64. doi:10.11959/j.issn.2096-0271.2024036

摘要 ( 96 )

在线阅读 ( 55 )

PDF下载 (1389KB) ( 140 )

可视化

数据和表 | 参考文献 | 相关文章

在社会全面数字化的时代，政府的智能化趋势不可阻挡。在技术与数据的协同作用下，我国数字政府建设呈现电子化、网络化和智能化的发展趋势。数据是数字政府建设的核心资源，建设智能化数字政府必然要求充分发挥数据的价值。数据赋能推动数字政府建设的逻辑如下：数据赋能政府的开放性运行；数据赋能政府的整体性运行；数据赋能政府的协同性运行；数据赋能政府的科学性运行。通过数据赋能推动数字政府建设的具体路径要求：以数字政府的整体性运行为基础保障数据的开放共享；以数字政府的协同性运行为基础保障数据的统一与管理；以数字政府的开放性为基础保障数据的统筹协调与再分配；以数字政府的科学性为基础保障数据来源的多元性。

研究

面向非平行语料的语音转换技术综述

李鹏程, 张旭龙, 王健宗, 程宁, 肖京

大数据. 2024, 10(3): 65-81. doi:10.11959/j.issn.2096-0271.2024011

摘要 ( 54 )

在线阅读 ( 14 )

PDF下载 (2233KB) ( 96 )

可视化

数据和表 | 参考文献 | 相关文章

语音转换是语音及人工智能领域的一项研究课题，其目标是在保持源语音内容不变的情况下改变语音的音色，使其听上去像是由另一个目标说话人说出的，同时还需保证语音的质量和自然度。面向非平行语料的语音转换技术是当下的热门研究内容，其使用非平行的多说话人语音数据集进行模型训练，能完成多对多以及任意对任意的语音转换。对近年来面向非平行语料的语音转换进行了全面的总结和分析。首先概述了早期面向平行语料的语音转换及其缺陷，然后对当下面向非平行语料的语音转换的各类实现方法进行介绍和对比分析，最后对语音转换技术进行了总结和展望。

知识与句法融合的因果关系抽取网络

汪诗蕊, 解博涵, 丁玲, 陈建廷, 向阳

大数据. 2024, 10(3): 82-92. doi:10.11959/j.issn.2096-0271.2024008

摘要 ( 53 )

在线阅读 ( 23 )

PDF下载 (2261KB) ( 122 )

可视化

数据和表 | 参考文献 | 相关文章

因果关系抽取作为关系抽取的一个重要任务，近年来得到了广泛关注。现有的因果关系抽取方法大多将句法结构和背景知识割裂开进行研究，早期的因果关系抽取方法偏重于从句法结构层面进行分析，随着深度学习技术的发展，预训练模型结合背景知识的方法成为主流。然而上述两种方法均未完全融合句内信息和外部知识，带来了不同程度的信息缺失。为了解决这一问题，提出了结合句法结构和背景知识的因果关系抽取模型。该模型将句子解析为同时包含句法和知识的知识句法图结构，使用图卷积网络进行信息融合。模型同时考虑了句法和知识两部分信息，从而进一步丰富了实体嵌入，达到了良好的因果关系抽取效果。本模型在EventStoryLine数据集上取得了良好效果，F1值达到0.445，与现有方法相比提高了2.3%。

Bootstrap样本大数据模型和分布式集成学习方法

罗凯靖, 张育铭, 何玉林, 黄哲学

大数据. 2024, 10(3): 93-108. doi:10.11959/j.issn.2096-0271.2024002

摘要 ( 84 )

在线阅读 ( 39 )

PDF下载 (2691KB) ( 119 )

可视化

数据和表 | 参考文献 | 相关文章

传统Bootstrap抽样和Bagging集成学习通常以串行方式实现，计算效率低，且存在样本不可重用、扩展性差等问题，不适合高效的大规模Bagging集成学习。从大数据分布式计算的思维入手，提出新的Bootstrap样本划分（BSP）大数据模型和分布式集成学习方法。BSP数据模型通过分布式生成算法将训练数据表达成分布式Bootstrap样本集的集合，存储成HDFS分布式数据文件，为后续的分布式集成学习提供数据支持。分布式集成学习方法从BSP数据模型中随机选取多个BSP数据块，读入集群各个节点的虚拟机，用串行算法对选取的数据块并行计算统计量或训练建模，再将所有的计算子结果回传至主节点中，生成最终的集成学习结果，此过程中可加入对子结果的质量选择以进一步提高预测效果。BSP数据模型的生成和分布式集成学习采用非Map-Reduce计算范式进行，每个数据块的计算独立完成，减少了计算节点间的数据通信开销。提出的算法在Spark开源系统中以新的算子方式实现，供Spark应用程序调用。实验表明，新方法可以高效地生成训练数据的BSP数据模型，提高数据样本的可重用性，在基于有监督机器学习算法构建的大规模Bagging集成学习实验中，计算效率能提高50%以上，同时预测精度进一步提高约2%。

基于动态动作覆盖的深度强化学习新闻推荐

董相宏, 安俊秀

大数据. 2024, 10(3): 109-118. doi:10.11959/j.issn.2096-0271.2023069

摘要 ( 147 )

在线阅读 ( 10 )

PDF下载 (1843KB) ( 344 )

可视化

数据和表 | 参考文献 | 相关文章

新闻推荐系统对新媒体新闻传播有着重要作用。提出了一种以深度强化学习为基础的推荐系统，旨在结合神经网络的表征能力和强化学习的策略选择能力来提升新闻推荐效果。使用动态动作掩码加强对用户短期兴趣的判断能力，使用优化缓存机制提升经验缓存的使用效率，通过区域遮蔽性质的奖励设计加快模型训练，从而提高推荐系统在新闻推荐领域的表现。实验表明，所提模型在新闻数据集上的推荐准确率与主流的神经网络推荐方法相当，且在排序性能上优于当前先进的推荐算法。

面向自然语言理解的多教师BERT模型蒸馏研究

石佳来, 郭卫斌

大数据. 2024, 10(3): 119-132. doi:10.11959/j.issn.2096-0271.2023039

摘要 ( 47 )

在线阅读 ( 13 )

PDF下载 (1961KB) ( 73 )

可视化

数据和表 | 参考文献 | 相关文章

知识蒸馏是一种常用于解决BERT等深度预训练模型规模大、推断慢等问题的模型压缩方案。采用“多教师蒸馏”的方法，可以进一步提高学生模型的表现，而传统的对教师模型中间层采用的“一对一”强制指定的策略会导致大部分的中间特征被舍弃。提出了一种“单层对多层”的映射方式，解决了知识蒸馏时中间层无法对齐的问题，帮助学生模型掌握教师模型中间层中的语法、指代等知识。在GLUE中的若干数据集的实验表明，学生模型在保留了教师模型平均推断准确率的93.9%的同时，只占用了教师模型平均参数规模的41.5%。

基于三阶张量的大规模数据谱聚类集成算法

仵匀政, 杜韬, 周劲, 陈迪, 王心耕

大数据. 2024, 10(3): 133-148. doi:10.11959/j.issn.2096-0271.2024007

摘要 ( 44 )

在线阅读 ( 10 )

PDF下载 (20567KB) ( 86 )

可视化

数据和表 | 参考文献 | 相关文章

为了降低大规模数据谱聚类计算负担，进一步提高聚类的准确性和鲁棒性，提出了一种基于三阶张量的大规模数据谱聚类集成算法。首先，提出一种混合代表最近邻近似方法构造数据间的稀疏亲和子矩阵；然后将稀疏亲和子矩阵表示为二部图，通过图分割的方法得到初步聚类结果；最后，提出三阶张量集成方法，将多个聚类结果进行融合，得到最终的聚类结果。在大规模的真实数据集和合成数据集上验证，相较经典的谱聚类算法、聚类集成算法以及近年来对其改进的算法，该算法表现出更优异的性能。

论坛

国防网络安全与数据治理研究

齐鹏云

大数据. 2024, 10(3): 149-162. doi:10.11959/j.issn.2096-0271.2023038

摘要 ( 109 )

在线阅读 ( 40 )

PDF下载 (1718KB) ( 121 )

可视化

数据和表 | 参考文献 | 相关文章

健全和完善我国国防网络安全和数据治理架构，既是国家网络安全与数据治理的重要一环，也是在《数据安全法》框架下细分领域内的重要实践。运用比较分析和文献分析法，提炼美国2013—2022年《国防授权法》中国防网络安全与数据治理的逻辑特征，吸收美国国防网络安全与数据治理的成功经验，完善我国国防网络安全与数据治理的总体架构。总体国家安全观下的国防网络安全与数据治理需要兼顾传统安全与非传统安全建设的核心要素，完善国防网络与数据安全的专项立法、构建政民预警交互意识和政企合作交互布局的“双重交互”体系，完善我国国防网络安全与数据治理格局。

专家视点

依照数据用途界定公共数据

朱扬勇

大数据. 2024, 10(3): 163-167. doi:10.11959/j.issn.2096-0271.2024037

摘要 ( 47 )

在线阅读 ( 19 )

PDF下载 (1176KB) ( 105 )

可视化

参考文献 | 相关文章

专栏：地方政府大数据

山东省数据创新应用建设探索与实践

林庆, 刘心田

大数据. 2024, 10(3): 168-174. doi:10.11959/j.issn.2096-0271.2023023

摘要 ( 66 )

在线阅读 ( 45 )

PDF下载 (1940KB) ( 102 )

可视化

数据和表 | 参考文献 | 相关文章

基于城市知识体系的公共数据要素构建方法

郑宇, 易修文, 齐德康, 潘哲逸

10.11959/j.issn.2096-0271.2024042

预出版日期: 2024-06-04

面向自然语言理解的多教师BERT模型蒸馏研究

石佳来, 郭卫斌

10.11959/j.issn.2096-0271. 2023039

预出版日期: 2023-05-05

一种高效鲁棒的元宇宙环境下的多场景智能医疗模型研究

朱玖闻, 周玉冰, 斯洪标, 张旭龙, 徐亮

doi: 10.11959/j.issn.2096-0271.2023006

预出版日期: 2023-02-14

2024 Vol.10	No.3	No.2	No.1
2023 Vol.9	No.6	No.5	No.4	No.3	No.2	No.1
2022 Vol.8	No.6	No.5	No.4	No.3	No.2	No.1
2021 Vol.7	No.6	No.5	No.4	No.3	No.2	No.1
2020 Vol.6	No.6	No.5	No.4	No.3	No.2	No.1
2019 Vol.5	No.6	No.5	No.4	No.3	No.2	No.1
2018 Vol.4	No.6	No.5	No.4	No.3	No.2	No.1
2017 Vol.3	No.6	No.5	No.4	No.3	No.2	No.1
2016 Vol.2	No.6	No.5	No.4	No.3	No.2	No.1
2015 Vol.1	No.4	No.2	No.3	No.1

警惕诈骗邮件通知