大数据 ›› 2021, Vol. 7 ›› Issue (2): 61-77.doi: 10.11959/j.issn.2096-0271.2021014
陈谊, 孙梦, 武彩霞, 孙小然
出版日期:
2021-03-15
发布日期:
2021-03-01
作者简介:
陈谊(1963- ),女,博士,北京工商大学教授,食品安全大数据技术北京市重点实验室主任,中国图象图形学学会可视化与可视分析专业委员会副主任,中国计算机学会杰出会员。主要研究方向为可视化与可视分析、智能信息处理、食品安全大数据技术。2016年获得中国分析测试协会科学技术奖(CAIA奖)特等奖,2017年获得中国石油和化工科技进步奖二等奖。多次担任PacificVis、ChinaVis、ChinaVR等可视化学术会议程序委员会委员和审稿人。基金资助:
Yi CHEN, Meng SUN, Caixia WU, Xiaoran SUN
Online:
2021-03-15
Published:
2021-03-01
Supported by:
摘要:
随着检测技术的提高和互联网技术的广泛应用,食品安全数据的规模不断增大、类型不断增多,对数据分析技术提出了极大挑战。近年来出现的可视分析技术,通过提供图形交互界面,帮助领域人员深入理解数据并洞悉数据中的隐含规律,提高对食品安全风险的分析、发现、预警和溯源能力,为食品安全监测和管控提供了新手段。首先分析了食品安全数据的主要来源、特征和分析任务;然后提出了一种关联可视分析技术分类方法,从属性关联、实体关联、对比分析和时空分析4个方面阐述了近10年来的食品安全大数据可视化关联分析方法;最后提出了该领域存在的问题和挑战。
中图分类号:
陈谊, 孙梦, 武彩霞, 孙小然. 食品安全大数据可视化关联分析[J]. 大数据, 2021, 7(2): 61-77.
Yi CHEN, Meng SUN, Caixia WU, Xiaoran SUN. Visual associations analysis of big data in food safety[J]. Big Data Research, 2021, 7(2): 61-77.
表1
食品安全在线数据库"
数据库 | 数据性质 | 数据描述 | 国家/地区 | 组织 |
GEMS/Food | 全球环境监测/食品污染监测和评估系统 | 全球各地区食品中污染物(隔、铅、汞、毒素等)的监测结果 | 全球 | 世界卫生组织 |
RASFF | 欧盟食品和饲料类快速预警系统 | 针对欧盟各成员国内部,因食品不符合安全要求或标识不准确等引起的风险报告和潜在问题通报 | 欧盟 | 欧洲联盟委员会 |
EFSA-Data | 数据收集、标准化与分析 | 食品消费、食品成分、生物危害、化学危害、化学污染物、化学残留物等数据 | 欧盟 | 欧盟食品安全局 |
pesticide residue monitoring program reports and data | 农药残留监测计划报告和数据 | 美国各州食品药品监督管理局农药残留监测计划的结果总结以及按商品类别分类的食品监测数据 | 美国 | 美国食品药品监督管理局 |
FDA recent recalls, market withdrawals &safety alerts | FDA最新召回、市场撤销和安全警报 | FDA监管产品召回的信息,包括日期、品牌名称、产品描述、产品类别、召回原因说明、公司名等 | 美国 | 美国食品药品监督管理局 |
食品安全抽检结果 | 食品安全抽检公布结果查询系统 | 定期发布国内产品抽检结果,包括食品名称、抽检次数、检测项目、检出污染物及含量、是否合格等信息 | 中国 | 国家市场管理监督总局 |
食品安全国家标准数据检索平台 | 食品安全国家标准数据检索平台 | 中国食品安全国家标准公告,各类食品中的危害物及具体限量标准 | 中国 | 国家市场管理监督总局 |
中国海关未准入境食品信息 | 未准入境食品信息列表 | 中国海关每个月发布抽检不合格、未准入境的食品信息,包括产品名称、产地、生产企业、未准入境原因、进境口岸等 | 中国 | 中国海关总署 |
各国食品安全标准 | 各国食品安全相关标准 | 各国食品中营养成分、污染物等的限量标准 | 中国 | 中国海关总署 |
表2
食品安全数据关联可视分析方法汇总"
关联分类 | 分析任务描述 | 可视化方法 | 食品领域应用实例 |
属性关联 | 两属性相关性 | 散点图[ | 食品营养成分间两两成分的相关性分析 |
多属性相关性 | 散点图矩阵[ | 农药残留多个判定指标上值的差异和相关性分析 | |
实体关联 | 实体间网络关系 | 节点-链接法[ | 农产品实体与农药实体间的多对多网络关系分析 |
实体间层次关系 | 节点-链接树[ | 农产品各类别、农药类别、地域行政区划等的层次关系分析 | |
对比分析 | 数值对比 | 排序(如单属性和多属性排名)[ | 各种食品、各地区等受危害物污染程度的排名 |
结构对比 | 并置(树比较方法之一)[ | 两国家最大残留限量(maximum residues limit, MRL)标准的对比(被转化为两棵树的对比) | |
时空分析 | 时间关联 | 时间线[ | 农产品中农药残留超标率随时间的变化情况分析 |
空间关联 | 统计地图[ | 食品中危害物检出率和超标率在地域上分布情况分析 |
[1] | 旭日干, 庞国芳 . 中国食品安全现状、问题及对策战略研究[M]. 北京: 科学出版社, 2015. |
XU R G , PANG G F . A strategic study on the current situation,problems and countermeasures of food safety in China[M]. Beijing: Beijing Science Press, 2015. | |
[2] | 陈谊, 刘莹, 田帅 ,等. 食品安全大数据可视分析方法研究[J]. 计算机辅助设计与图形学学报, 2017,29(1): 8-16. |
CHEN Y , LIU Y , TIAN S ,et al. A survey of visual analytical techniques for big data in food safety field[J]. Journal of Computer-Aided Design & Computer Graphics, 2017,29(1): 8-16. | |
[3] | MARVIN H J P , JANSSEN E M , BOUZEMBRAK Y ,et al. Big data in food safety:an overview[J]. Critical Reviews in Food Science and Nutrition, 2016,57(11): 2286-2295. |
[4] | JIN C Y , BOUZEMBRAK Y , ZHOU J H ,et al. Big data in food safety-a review[J]. Current Opinion in Food Science, 2020,36: 24-32. |
[5] | MAURO A , GRECO M , GRIMALDI M . What is big data? A consensual definition and a review of key research topics[C]// The 4 th International Conference of Integrated Information.[S.l.:s.n.], 2015: 97-104. |
[6] | WU Y N , CHEN J S . Food safety monitoring and surveillance in China:past,present and future[J]. Food Control, 2018,90: 429-439. |
[7] | HU K , LIU J , LI B ,et al. Global research trends in food safety in agriculture and industry from 1991 to 2018:a data-driven analysis[J]. Trends in Food Science &Technology, 2019,85: 262-276. |
[8] | 许世卫 . 农业大数据与农产品监测预警[J]. 中国农业科技导报, 2014,16(5): 14-20. |
XU S W . Agricultural big data and monitoring and early warning of agricultural products[J]. Journal of Agricultural Science and Technology, 2014,16(5): 14-20. | |
[9] | 张平文, 鄂维南, 袁晓如 ,等. 大数据分析与应用技术创新平台[J]. 大数据, 2018,4(4): 85-95. |
ZHANG P W , E W N , YUAN X R ,et al. Big data analysis and application technology innovation platform[J]. Big Data Research, 2018,4(4): 85-95. | |
[10] | MUNZNER T . Visualization analysis and design[M]. Boca Raton: CRC Press, 2014. |
[11] | BIAN R Z , XUE Y M , ZHOU L ,et al. Implicit multidimensional projection of local subspaces[J]. IEEE Transactions on Visualization and Computer Graphics, 2020,27(2): 1558-1568. |
[12] | YUAN X R , REN D H , WANG Z C ,et al. Dimension projection matrix/tree:interactive subspace visual exploration and analysis of high dimensional data[J]. IEEE Transactions on Visualization and Computer Graphics, 2013,19(12): 2625-2633. |
[13] | CHEN Y , DONG Y , SUN Y H ,et al. A multi-comparable visual analytic approach for complex hierarchical data[J]. Journal of Visual Languages and Computing, 2018,47: 19-30. |
[14] | 陈谊, 李潇潇, 蔡进峰 ,等. 基于类区间的多维数据可视化方法[J]. 系统仿真学报, 2013(10): 2418-2423. |
CHEN Y , LI X X , CAI J F ,et al. Visualization of multi-dimensional data based on cluster region[J]. Journal of System Simulation, 2013(10): 2418-2423. | |
[15] | 陈谊, 张聪 . 一种基于维度投影的多维数据相关性可视分析方法[J]. 计算机辅助设计与图形学学报, 2018,30(4): 592-601. |
CHEN Y , ZHANG C . Visual analysis of correlation in multidimensional data based on dimension projection technique[J]. Journal of Computer-Aided Design &Computer Graphics, 2018,30(4): 592-601. | |
[16] | 杨璐, 张馨月, 郑丽敏 . 挖掘数据关系的食品抽检数据可视化分析图研究[J]. 农业机械学报, 2019,50(6): 272-279. |
YANG L , ZHANG X Y , ZHENG L M . Visual analysis graph research of food sampling data based on mining data relationship[J]. Transactions of the Chinese Society of Agricultural Machinery, 2019,50(6): 272-279. | |
[17] | NARCISA P A , SERGIU C S , MIRELA A A ,et al. Analysis of RASFF notifications on contaminated dairy products from the last two decades:2000-2020[J]. Romanian Biotechnological Letters, 2020,25(2): 1396-1406. |
[18] | CHEN Y , LYV C , LI Y ,et al. Ordered matrix representation supporting the visual analysis of associated data[J]. Science China Information Sciences, 2020,63. |
[19] | 齐红革, 谭亚军, 黄琳琳 ,等. 食品安全数据分析可视化模型研究[J]. 食品安全质量检测学报, 2019,10(17): 5968-5973. |
QI H G , TAN Y J , HUANG L L ,et al. Research on visualization model of food safety data analysis[J]. Journal of Food Safety and Quality, 2019,10(17): 5968-5973. | |
[20] | JIA Y J , CHEN Y , LI Z G . Treemapbased visualization methods for pesticide residues detection data[C]// Advances in Image and Graphics Technologies. Heidelberg:Springer, 2013: 154-162. |
[21] | CHEN Y , DU X M , YUAN X R . Ordered small multiple treemaps for visualizing time-varying hierarchical pesticide residue data[J]. Science China Information Sciences, 2017,33(6-8): 1073-1084. |
[22] | CHEN Y , ZHANG X Y , FENG Y C ,et al. Sunburst with ordered nodes based on hierarchical clustering:a visual analyzing method for associated hierarchical pesticide residue data[J]. Journal of Visualization, 2015,18(2): 237-254. |
[23] | 杜晓敏, 陈谊, 李玥 . TransGraph:一种基于变换的可视分析关联图[J]. 计算机辅助设计与图形学学报, 2018(1): 79-89. |
DU X M , CHEN Y , LI Y . TransGraph:a transformation-based graph for analyzing relations in data set[J]. Journal of Computer-Aided Design & Computer Graphics, 2018(1): 79-89. | |
[24] | 陈谊, 刘莹, 陈星如 ,等. 基于可视分析的农药残留污染仿真评估方法[J]. 计算机仿真, 2017,34(10): 347-351. |
CHEN Y , LIU Y , CHEN X R ,et al. Simulation and evaluation method for pesticide residue pollution based on visual analysis techniques[J]. Computer Simulation, 2017,34(10): 347-351. | |
[25] | CHEN Y , ZHAO Y F , CHEN X R ,et al. Visualizing geospatial distribution of pesticide residue pollution using cartogram and heat map[M]// Transactions on Edutainment XIII. Heidelberg: Springer, 2017: 231-244. |
[26] | 甄远刚, 陈谊, 刘莹 ,等. 一种基于ThemeRiver模型的非连续层次数据可视化方法[J]. 系统仿真学报, 2015,27(10): 2460-2466,2474. |
ZHEN Y G , CHEN Y , LIU Y ,et al. Discontinuous hierarchical data visualization method based on ThemeRiver model[J]. Journal of System Simulation, 2015,27(10): 2460-2466,2474. | |
[27] | 庞国芳 ,等. 食用农产品农药残留监测与风险评估溯源技术研究[M]. 北京: 科学出版社, 2018. |
PANG G F ,et al. Research on monitoring,risk assessment and traceability technology of pesticide residues in edible agricultural products[M]. Beijing: Science Press, 2018. | |
[28] | VANASSE A , DEMERS M , HEMIARI A ,et al. Obesity in Canada:where and how many?[J]. International Journal of Obesity, 2006,30(4): 677-683. |
[29] | PLAZA-RODRíGUEZ C , APPEL B , KAESBOHRER A ,et al. Discussing state-of-the-art spatial visualization techniques applicable for the epidemiological surveillance data on the example of campylobacter spp.in raw chicken meat[J]. Zoonoses and Public Health, 2016,63(5): 358-369. |
[30] | CLEVELAND W S . Visualizing data[J]. Infection Control and Hospital Epidemiology, 1994,15(12): 763-763. |
[31] | CARR D B , LITTLEFIELD R J , NICHOLSON W L . Scatterplot matrix techniques for large N[J]. Journal of the American Statistical Association, 1987. |
[32] | ZHOU L , WEISKOPF D . Indexedpoints parallel coordinates visualization of multivariate correlations[J]. IEEE Transactions on Visualization and Computer Graphics, 2018,24(6): 1997-2010. |
[33] | FERDOSI B , ROERDINK J . Visualizing high-dimensional structures by dimension ordering and filtering using subspace analysis[J]. Computer Graphics Forum, 2011,30(3): 1121-1130. |
[34] | 陈为, 赵烨, 张嵩 ,等. 可视化导论[M]. 北京: 高等教育出版社, 2020. |
CHEN W , ZHAO Y , ZHANG S ,et al. Introduction to visualization[M]. Beijing: Higher Education Press, 2020. | |
[35] | CHEN Y , GUAN Z L , ZHANG R ,et al. A survey on visualization approaches for exploring association relationships in graph data[J]. Journal of Visualization, 2019,22(3): 625-639. |
[36] | 程致远, 鲍玉斌, 冷芳玲 . 面向大规模图数据的并行图布局算法[J]. 大数据, 2016,2(5): 12-21. |
CHENG Z Y , BAO Y B , LENG F L . Parallel graph layout algorithm for large-scale graph data[J]. Big Data Research, 2016,2(5): 12-21. | |
[37] | 张昕, 袁晓如 . 树图可视化[J]. 计算机辅助设计与图形学学报, 2012,24(9): 1113-1124. |
ZHANG X , YUAN X R . Treemap visualization[J]. Journal of ComputerAided Design & Computer Graphics, 2012,24(9): 1113-1124. | |
[38] | 李彦龙, 李国强, 董笑菊 . 树比较可视化方法综述[J]. 软件学报, 2016,27(5): 1074-1090. |
LI Y L , LI G Q , DONG X J . Survey on visualization of tree comparison[J]. Journal of Software, 2016,27(5): 1074-1090. | |
[39] | HAVRE S , HETZLER E G , WHITNEY P . ThemeRiver:visualizing thematic changes in large document collections[J]. IEEE Transactions on Visualization & Computer Graphics, 2002,8(1): 9-20. |
[40] | GASTNER M T , NEWMAN M E J . Diffusion-based method for producing density-equalizing maps[J]. Proceedings of the National Academy of Sciences of the United States of America, 2004,101(20): 7499-7504. |
[41] | 范举, 陈跃国, 杜小勇 . 人在回路的数据准备技术研究进展[J]. 大数据, 2019,5(6): 3-18. |
FAN J , CHEN Y G , DU X Y . Progress on human-in-the-loop data preparation[J]. Big Data Research, 2019,5(6): 3-18. | |
[42] | WANG Y H , HAN F B , ZHU L F ,et al. Line graph or scatter plot? Automatic selection of methods for visualizing trends in time series[J]. IEEE Transactions on Visualization and Computer Graphics, 2018,24(2): 1141-1154. |
[1] | 钱海红, 王茂异, 熊贇. 高等教育数字化转型的现状与发展研究[J]. 大数据, 2023, 9(3): 56-70. |
[2] | 梅宏, 杜小勇, 金海, 程学旗, 柴云鹏, 石宣化, 靳小龙, 王亚沙, 刘驰. 大数据技术前瞻[J]. 大数据, 2023, 9(1): 1-20. |
[3] | 沈阳, 余梦珑. 元宇宙与大数据:时空智能中的数据洞察与价值连接[J]. 大数据, 2023, 9(1): 103-110. |
[4] | 郑童哲恒, 李斌, 冯敏萱, 常博林, 王东波. 历史典籍的结构化探索——《史记·列传》数字人文知识库的构建与可视化研究[J]. 大数据, 2022, 8(6): 40-55. |
[5] | 陈静. 人文大数据及其在数字人文领域中的应用[J]. 大数据, 2022, 8(6): 3-14. |
[6] | 罗煜楚, 吴昊, 郭宇涵, 谭绍聪, 刘灿, 蒋瑞珂, 袁晓如. 数字人文中的可视化[J]. 大数据, 2022, 8(6): 74-93. |
[7] | 张伶俐, 褚琦凯, 王桂娟, 张巍瀚, 蒲慧, 宋振金, 吴亚东. 文本情感可视分析技术及其在人文领域的应用[J]. 大数据, 2022, 8(6): 56-73. |
[8] | 李汶龙, 袁媛, 安筱鹏. 刍议大数据治理的三大基础思维[J]. 大数据, 2022, 8(4): 34-45. |
[9] | 汤奇峰, 邵志清, 叶雅珍. 数据交易中的权利确认和授予体系[J]. 大数据, 2022, 8(3): 40-53. |
[10] | 王陈慧子, 蔡玮. 元宇宙数字经济:现状、特征与发展建议[J]. 大数据, 2022, 8(3): 140-150. |
[11] | 杨玫, 李玮, 乔思渊, 刘巍. 中国大数据产业产值测算方法研究[J]. 大数据, 2022, 8(3): 151-160. |
[12] | 李德仁, 张过, 蒋永华, 沈欣, 刘伟玲. 论大数据视角下的地球空间信息学的机遇与挑战[J]. 大数据, 2022, 8(2): 3-14. |
[13] | 仇晓兰, 胡玉新, 上官松涛, 付琨. 遥感卫星大数据高精度一体化处理技术[J]. 大数据, 2022, 8(2): 15-27. |
[14] | 刘伟权, 王程, 臧彧, 胡倩, 于尚书, 赖柏锜. 基于遥感大数据的信息提取技术综述[J]. 大数据, 2022, 8(2): 28-57. |
[15] | 刘建强, 叶小敏, 兰友国. 我国海洋卫星遥感大数据及其应用服务[J]. 大数据, 2022, 8(2): 75-88. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||
|