推荐文章
  
    专题:数据要素市场建设
    专题:数据要素市场建设
    朱扬勇, 潘柱廷
    大数据. 2022, 8(3):  1-2.  doi:10.11959/j.issn.2096-0271.2022045-1
    摘要 ( 11 )   在线阅读 ( 3 )   PDF下载 (888KB) ( 6 )   可视化    收藏
    参考文献 | 相关文章
    数据流通市场中数据产品的特性及其交易模式
    黄丽华, 窦一凡, 郭梦珂, 汤奇峰, 李根
    大数据. 2022, 8(3):  3-14.  doi:10.11959/j.issn.2096-0271.2022045
    摘要 ( 9 )   在线阅读 ( 0 )   PDF下载 (1700KB) ( 4 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    数据的流通交易是数据要素市场化配置的关键环节。我国前期的数据市场探索过程中暴露出一系列问题,迫切需要从理论角度对数据市场基本逻辑进行重新梳理。从交易成本理论、电子市场框架和电子交易模式等不同视角分析了数据产品流通过程,并提出数据的可计算性给数据交易带来了两类影响:一方面,可计算性使得数据能够被不断分析从而更加符合垂直领域的需求;另一方面,可计算性也会推动数据交易过程离开市场,呈现去平台化的趋势。基于电子市场经典理论框架将数字产品分为4个象限并进行相应分析,提出了对数据供方和数据市场管理者的建议。

    盒装数据:一种基于数据盒的数据产品形态
    叶雅珍, 朱扬勇
    大数据. 2022, 8(3):  15-25.  doi:10.11959/j.issn.2096-0271.2022030
    摘要 ( 10 )   在线阅读 ( 1 )   PDF下载 (2257KB) ( 3 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    与通常的商品市场一样,数据市场中流通的数据商品也分为标准产品和非标准产品两大类。目前,市场中有效流通的数据产品是音乐、图片、电影等标准数据产品,而一般意义上的、大规模的大数据流通则遇到了诸多障碍,其中一个障碍就是数据产品的计量计价问题,需要设计一个可计量的标准数据产品形态。基于数据盒模型,设计了一种数据产品的基础标准形态,称之为盒装数据。一个盒装数据产品包括盒内数据、盒外包装两部分,其中,盒内数据是指“时间+空间+内容”三维度的数据立方体组织,一般包括图像、图形、视频、音频、文本、结构化数据等多种数据类型;盒外包装包括产品登记证书,以及产品说明书、质量证书、合规证书等内容。盒装数据旨在为数据要素市场提供一个可计量计价的标准数据产品形态。

    从数据质量到数据产品质量
    蔡莉, 朱扬勇
    大数据. 2022, 8(3):  26-39.  doi:10.11959/j.issn.2096-0271.2022040
    摘要 ( 3 )   在线阅读 ( 0 )   PDF下载 (1723KB) ( 0 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    长期以来,数据质量研究主要是为了满足组织自身信息系统正常运行的需求。随着数据要素市场的建设与发展,数据的质量需求从“自用需求”转变为“他用需求”“监管需求”。数据市场中的数据产品质量问题是数据使用者(购买者)和市场监管机构重点关注的内容。分析了数据产品质量的使用者需求和监管者需求,创新性地提出了一个数据产品质量体系框架;在此基础上,以盒装数据产品为例,从时间、空间和内容完整性3个方面构建了对应的质量维度、质量指标和质量评测模型。该质量体系可以对资源类数据产品进行检测和评定,能够为数据产品购买者和市场监管机构提供行之有效的检测依据和标准。

    数据交易中的权利确认和授予体系
    汤奇峰, 邵志清, 叶雅珍
    大数据. 2022, 8(3):  40-53.  doi:10.11959/j.issn.2096-0271.2022029
    摘要 ( 7 )   在线阅读 ( 0 )   PDF下载 (1417KB) ( 2 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    数据是数字经济的关键生产要素,建立数据要素市场势在必行。数据要素市场建设包括数据确权、交易标的、定价机制、交易平台和交易监管等多个方面的建设。对数据产品/服务在数据交易所进行交易时所需要的权利及其确权行为、确权机构等进行了系统性探索,将数据交易标的形态设计为“数据产品/服务+某种权利”,设计了针对数据产品形态和数据服务形态的各种授权,同时形成了数据交易的授权体系。

    数据交易相关法规比较研究
    文英姿, 曲杨, 张旭东, 徐珺, 李建平
    大数据. 2022, 8(3):  66-77.  doi:10.11959/j.issn.2096-0271.2022043
    摘要 ( 0 )   在线阅读 ( 0 )   PDF下载 (1653KB) ( 0 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    随着国家将数据确定为生产要素,各地加快了与数据交易相关的立法,探索构建数据要素市场,推动数字经济发展。对比分析了数据交易相关法规,认为各地在交易原则、禁止交易数据、数据安全等方面基本形成共识,条文相对清晰且具有一定的可操作性;而交易标的、数据权属等方面的规定仍不够清晰且难以落地,同时还存在数据安全监管难度大、数据交易生态不完善等问题。最后,对未来制定数据交易法规、建设数据交易市场提出了建议。

    数据相关国际税制评述
    谢波峰
    大数据. 2022, 8(3):  78-86.  doi:10.11959/j.issn.2096-0271.2022044
    摘要 ( 0 )   在线阅读 ( 0 )   PDF下载 (1388KB) ( 0 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    数据要素作为一种新的生产要素,与之对应的数据税目前并不存在,但存在与其相关的税制。分析了数字服务税、数字资产税以及无形资产税等相关税种与数据税之间的理论联系,阐述了各国在这些税制中的实践情况,从征税范围等税制要素中可以看出相关税种与数据税之间的紧密联系,并展开了相应的评述和分析。基于上述国际实践,认为现有相关税制对于数据税具有重要借鉴意义,数据税的设计应该激励与规范并重、政策与征管联动。

    研究
    区块链在个性化推荐系统中的应用研究综述
    许小颖, 陈熙, 陈源, 谢永靖
    大数据. 2022, 8(3):  87-102.  doi:10.11959/j.issn.2096-0271.2022031
    摘要 ( 10 )   在线阅读 ( 4 )   PDF下载 (1473KB) ( 4 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    区块链作为一种新兴技术,以其去中心化、难以篡改、匿名性和可追溯性等特点,为个性化推荐系统的改进提供了一种崭新的思路。为此,首先对近年来推荐系统面临的主要问题和区块链技术带来的机遇进行归纳总结,然后采用文献分析方法,从时间分布、文献类型、研究问题和评估指标4个层面,对推荐系统中区块链技术的应用研究进行分析和总结。分析结果表明:区块链对于解决推荐系统的数据安全和隐私保护、数据共享、数据可信和推荐透明度问题有重要意义;已有研究主要集中于解决推荐系统中用户的数据安全和隐私保护问题,而在跨平台数据共享、数据激励机制设计和系统可扩展性等方面的研究仍有待进一步突破。

    融合一致性正则与流形正则的半监督深度学习算法
    王杰, 张松岩, 梁吉业
    大数据. 2022, 8(3):  103-114.  doi:10.11959/j.issn.2096-0271.2022027
    摘要 ( 1 )   在线阅读 ( 0 )   PDF下载 (3010KB) ( 2 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    半监督学习已被广泛应用于大数据分析。目前,基于一致性正则的方法是半监督深度学习的研究热点之一。然而这类方法没有考虑数据的流形结构,可能会导致部分相近的样本得到差异很大的输出,进而导致分类器性能下降。针对这个问题,提出了一种融合一致性正则与流形正则的半监督深度学习算法。该算法在对模型施加一致性约束的同时,对样本构图并加入平滑性损失,实现了每个样本点局部邻域的平滑以及邻近(相连)样本点之间的平滑,从而提高半监督深度学习算法的泛化性能。在多个图像和文本数据集上的实验结果表明,与其他的半监督深度学习算法相比,所提算法更有效。

    结合语言知识和深度学习的中文文本情感分析方法
    徐康庭, 宋威
    大数据. 2022, 8(3):  115-127.  doi:10.11959/j.issn.2096-0271.2022026
    摘要 ( 1 )   在线阅读 ( 1 )   PDF下载 (1968KB) ( 1 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    在目前的中文文本情感分析研究中,基于语义规则和情感词典的方法通常需要人工设置情感阈值;而基于深度学习的方法由于未能运用语义规则和情感词典等语言知识,不能充分提取情感特征。针对这两种方法的缺点,提出了一种将语言知识和深度学习结合的文本情感分析方法。该方法首先根据语义规则提取文本中的关键情感片段,再根据情感词典从关键情感片段中抽取出情感更加明确的情感词来构建情感集合,然后利用深度学习模型分别从原始文本、关键情感片段、情感集合中抽取深层次特征,最后对提取的特征进行加权融合,并利用分类器实现情感极性的判断。实验结果表明,与未引入语言知识的深度学习模型相比,该方法的情感极性分类能力有明显提升。

    基于NLP的中医医案文本快速结构化方法
    肖晓霞, 刘明婷, 杨冯天赐, 刘鉴建县, 杨阳, 石月
    大数据. 2022, 8(3):  128-139.  doi:10.11959/j.issn.2096-0271.2022025
    摘要 ( 1 )   在线阅读 ( 1 )   PDF下载 (2564KB) ( 0 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    中医医案是中医医生学习临床经验的重要文献资料,对中医医案进行结构化处理有利于采用机器学习等方法总结临床经验,加速中医传承。为了实现中医医案快速结构化,提出了一种基于自然语言处理的中医医案文本快速结构化方法。将《中国现代名中医医案精粹》作为结构化对象,采用光学字符识别技术识别医案截图的文本,同时对文本做初步结构化。构建简单症状词典,采用结合词典的改进的N-gram模型获取医案文本中的症状、体征等词,并在结构化过程中更新词典,实现了对4 754份文本医案的结构化。随机选取666份医案文本对最终模型进行测试,其F1值达到82.99%。

    论坛
    元宇宙数字经济:现状、特征与发展建议
    王陈慧子, 蔡玮
    大数据. 2022, 8(3):  140-150.  doi:10.11959/j.issn.2096-0271.2022048
    摘要 ( 9 )   在线阅读 ( 4 )   PDF下载 (1379KB) ( 11 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    随着美国科技公司Facebook更名为Meta,元宇宙成为2021年年底非常火爆的科技名词。首先通过梳理元宇宙技术概念的发展过程,阐述了该行业在这一历史阶段发展的必然性和必要性。在此基础上,通过对国外元宇宙数字经济发展现状的剖析,揭示了去中心化数字经济的风险与挑战。最后,指出去中心化的关键精神内核在于全球普适的反垄断思潮,并由此展望国内元宇宙产业的前景。

    中国大数据产业产值测算方法研究
    杨玫, 李玮, 乔思渊, 刘巍
    大数据. 2022, 8(3):  151-160.  doi:10.11959/j.issn.2096-0271.2022024
    摘要 ( 4 )   在线阅读 ( 0 )   PDF下载 (1332KB) ( 3 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章

    大数据产业发展当前仍然面临产业边界不够清晰、企业界定不够明确、产值测算方法不够统一等产业发展问题和痛点,在遵循现阶段我国大数据产业发展客观实际的基础上,将大数据产业链划分为数据资源层、基础硬件层、通用软件层、行业应用层、安全保障层5个层级,并对大数据企业概念进行界定。通过获取相关层级各细分领域骨干企业市场营收占比、细分领域骨干企业大数据营收占主营业务收入比均值,折算细分领域大数据产业产值。最终运用加总法测算出2016—2021年我国大数据产业产值为44 908亿元,并预判“十四五”时期,我国大数据产业年均复合增长率约为25%,即到2025年我国大数据产业营收预计突破3万亿元。

    学术科普
    漫威电影中的深度学习
    王元卓, 江旭晖, 陆源
    大数据. 2022, 8(3):  161-163.  doi:10.11959/j.issn.2096-0271.2022057
    摘要 ( 3 )   在线阅读 ( 2 )   PDF下载 (2077KB) ( 8 )   可视化    收藏
    数据和表 | 参考文献 | 相关文章
数字人文视域下面向历史古籍的信息抽取方法研究
季紫荆, , 陈子睿, , 韩立帆, , 王 鑫, ,
10.11959/j.issn.2096-0271.2022058
预出版日期: 2022-05-20
纵向联邦线性模型在线推理过程成员推断攻击的隐私保护研究
尹虹舒, 周旭华, 周文君
10.11959/j.issn.2096-0271.2022056
预出版日期: 2022-05-20
数据治理价值链模型与数据基本制度分析
黄科满, 杜小勇,
10.11959/j.issn.2096-0271.2022062
预出版日期: 2022-05-20
围绕数字平台公司风险的治理制度改革分析
赵泽睿
10.11959/j.issn.2096-0271.2022063
预出版日期: 2022-05-20
混合型数据的邻域条件互信息熵属性约简算法
兰海波
10.11959/j.issn.2096-0271.2022066
预出版日期: 2022-05-19
基于观测数据的时间序列因果推断综述
曾泽凡, 陈思雅, 龙 洗, 金 光
10.11959/j.issn.2096-0271.2022059
预出版日期: 2022-05-19
基于区块链技术的旅游积分通兑系统设计
贵向泉, 郭志礼, 杨裔, 秦炳峰
10.11959/j.issn.2096-0271.2022055
预出版日期: 2022-04-25
基于社交网络大数据的民众情感监测研究
李爱黎, 张子帅, 林荫, 王秋菊, 杨建安, 孟炜程, 张岩峰
10.11959/j.issn.2096-0271.2022054
预出版日期: 2022-04-25
联邦元学习综述
张传尧, 司世景, 王健宗, 肖京
10.11959/j.issn.2096-0271.2022051
预出版日期: 2022-04-24
基于深度学习的警情记录关键信息自动抽取
崔雨萌, 王靖亚, 闫尚义, 陶知众
10.11959/j.issn.2096-0271.2022052
预出版日期: 2022-04-24
文本情感可视分析研究综述
张伶俐, 吴亚东, 褚琦凯, 王桂娟, 张巍瀚, 蒲慧, 宋振金
10.11959/j.issn.2096-0271.2022050
预出版日期: 2022-04-13
欧盟开放数据和公共部门信息再利用指令的启示
张群 尹卓 于浩 王为中 贾晓杰
10.11959/j.issn.2096-0271.2022047
预出版日期: 2022-04-01
数字人文视域中的古籍文本标注方法研究——以MARKUS为例
于亚秀 李欣
10.11959/j.issn.2096-0271.2022046
预出版日期: 2022-04-01
基于更新热点感知的LSM-Tree查询优化
林清音, 陈志广
10.11959/j.issn.2096-0271.2022049
预出版日期: 2022-04-01
税收优惠政策关键要素抽取与可视化分析
关海山, 郑玉龙, 魏笔凡, 张泽民, 岳浩, 师斌, 董博
10.11959/j.issn.2096-0271.2022035
预出版日期: 2022-03-11
知识增强策略引导的交互式强化推荐系统
张宇奇, 黄晓雯, 桑基韬
10.11959/j.issn.2096-0271.2022033
预出版日期: 2022-03-11
基于PSOFS和TSK模糊系统的不平衡心电数据分类算法
李鑫辉, 申情, 张雄涛,
10.11959/j.issn.2096-0271.2022039
预出版日期: 2022-03-11
区域大数据产业规划研究与实践——以山西省大数据发展应用规划为例
王洋, 高婴劢
10.11959/j.issn.2096-0271.2022037
预出版日期: 2022-03-11
基于双曲空间图嵌入的科研热点预测
戴筠
10.11959/j.issn.2096-0271.2022041
预出版日期: 2022-03-11
基于指数机制的轨迹差分隐私保护方法
焦荟聪, 刘文菊, 王赜
10.11959/j.issn.2096-0271.2022042
预出版日期: 2022-03-10
可信AI治理框架探索与实践
夏正勋, 唐剑飞, 罗圣美, 张燕
10.11959/j.issn.2096-0271.2022036
预出版日期: 2022-03-10
基于时间编码LSTM的高校舆情热点趋势预测研究
易杰, 曹腾飞, 黄肖翰, 张子震
10.11959/j.issn.2096-0271.2022034
预出版日期: 2022-03-10
联邦推荐系统综述
朱智韬, , 司世景 , 王健宗, , 肖京
10.11959/j.issn.2096-0271.2022032
预出版日期: 2022-03-10
联邦学习攻击与防御综述
吴建汉, 司世景, 王健宗, 肖京
10.11959/j.issn.2096-0271.2022038
预出版日期: 2022-03-10
2022 Vol.8 No.3 No.2 No.1
2021 Vol.7 No.6 No.5 No.4 No.3 No.2 No.1
2020 Vol.6 No.6 No.5 No.4 No.3 No.2 No.1
2019 Vol.5 No.6 No.5 No.4 No.3 No.2 No.1
2018 Vol.4 No.6 No.5 No.4 No.3 No.2 No.1
2017 Vol.3 No.6 No.5 No.4 No.3 No.2 No.1
2016 Vol.2 No.6 No.5 No.4 No.3 No.2 No.1
2015 Vol.1 No.4 No.2 No.3 No.1
下载排行
点击排行