网络与信息安全学报 ›› 2021, Vol. 7 ›› Issue (3): 1-28.doi: 10.11959/j.issn.2096-109x.2021051
陈晋音1,2, 张敦杰2, 黄国瀚2, 林翔2, 鲍亮3
陈晋音(1982- ),女,浙江象山人,博士,浙江工业大学副教授,主要研究方向为人工智能安全、图数据挖掘和进化计算基金资助:
Jinyin CHEN1,2, Dunjie ZHANG2, Guohan HUANG2, Xiang LIN2, Liang BAO3
Supported by:
陈晋音, 张敦杰, 黄国瀚, 林翔, 鲍亮. 面向图神经网络的对抗攻击与防御综述[J]. 网络与信息安全学报, 2021, 7(3): 1-28.
Jinyin CHEN, Dunjie ZHANG, Guohan HUANG, Xiang LIN, Liang BAO. Adversarial attack and defense on graph neural networks: a survey[J]. Chinese Journal of Network and Information Security, 2021, 7(3): 1-28.
常用符号及定义Table 1 Definition of common symbols"
符号 | 定义 | 符号 | 定义 | 符号 | 定义 |
原始图集合 | G | 原始图 | V | 节点集合 | |
E | 连边集合 | 节点特征矩阵 | 邻接矩阵 | ||
M | 图数量 | N | 节点数量 | D | 节点特征维度 |
标记图集合 | VL | 标记节点集合 | EL | 标记连边集合 | |
ei ,j | 节点vi与vj间的连边 | Yn | n的类标 | yn | 节点n的类标 |
Ii ,j | 连边ei,j 的类标 | C | 社团集合 | 目标实例集合 | |
τi | 目标实例 | ci | 目标实例类标 | 特征集合 | |
共同出现的特征矩阵 | f | 神经网络模型 | 防御模型 | ||
损失函数 | 训练损失函数 | 目标攻击损失函数 | |||
受扰动后的图 | 受扰动后的节点特征 | 受扰动后的邻接矩阵 | |||
连边梯度矩阵 | K | 修改连边数 | H | 隐藏层中的特征映射数 | |
Δ | 扰动代价 | Z | 节点嵌入表示 | 0范数 |
对抗攻击算法分类Table 2 The classification of adversarial attack algorithm"
任务分类 | 攻击方法 | 攻击背景 | 扰动类型 | 原理 | 攻击目标 |
NETTACK | 灰盒 | 修改连边/修改特征 | 基于数据特征修改连边/特征 | GCN/CLN/DeepWalk | |
RL-S2V | 黑盒 | 修改连边 | 基于强化学习修改连边 | GNN | |
FGA | 白盒 | 修改连边 | 根据模型梯度信息修改连边 | GCN/Deepwalk/Node2vec/LINE | |
Greedy-GAN | 白盒 | 添加节点 | 利用GAN[ | GCN | |
ADW | 黑盒 | 修改连边 | 利用矩阵摄动理论进行连边翻转 | GCN/Node2vec/DeepWalk | |
Metattack | 灰盒 | 修改连边 | 通过元梯度来构造攻击 | GNN/CLN/DeepWalk | |
Manipulating | 白盒 | 修改连边 | 基于图的优化问题修改连边 | DeepWalk/GCN/LINE/LBP/JW/LinBP | |
节点分类 | DAGAER | 白盒 | 修改特征 | 基于编码器-解码器框架修改特征 | GCN |
IG-FGSM/JSMA | 白盒 | 修改连边/修改特征 | 根据模型梯度信息修改连边与特征 | GCN | |
梯度投影攻击 | 白盒 | 修改连边 | 根据模型梯度信息修改连边 | GCN | |
GF-Attack | 黑盒 | 修改连边 | 基于近似的图滤波器和属性构造攻击 | Network Emebdding | |
ReWatt | 黑盒 | 重布线 | 基于强化学习,重新布线 | GCN | |
NIPA | 灰盒 | 添加节点 | 基于强化学习向网络中添加虚假节点 | GCN | |
GUA | 白盒 | 修改连边 | 利用梯度迭代寻找攻击向量翻转连边 | GCN/DeepWalk/Node2vec/GAT | |
POISONPROBE | 白盒 | 修改特征 | 基于梯度,攻击中毒效率分数最高的非直接邻居的节点特征 | GCN | |
MGA | 白盒 | 重布线 | 在基于梯度的迭代过程中加入动量项 | GCN/DeepWalk/Node2vec | |
Triads Attack | 白盒 | 修改连边 | 基于图结构的邻居评分与启发式算法增加或删除连边,降低连边相似性 | similarity metrics | |
IGA | 白盒 | 修改连边 | 根据模型梯度信息修改连边 | GAE | |
链路预测 | Opt-attack | 白盒 | 修改连边 | 基于一阶KKT条件和投影梯度下降构造攻击 | Network Emebdding |
Approx-Local | 白盒 | 修改连边 | 删除有限子集的连边,以最小化一组目标链路的总加权相似度得分 | Local/Global similarity metrics | |
TGA | 白盒 | 重布线 | 根据模型梯度信息重布线 | Deep dynamic network embedding model | |
RL-S2V | 黑盒 | 修改连边 | 基于强化学习修改连边 | GNN | |
图分类 | 多层次图池化神经网络攻击 | 白盒 | 修改特征/修改连边 | 基于梯度攻击图池化层保留的节点 | SAG/ HGP-SL |
PA后门攻击 | 黑盒 | 修改连边 | 生成随机子图进行后门攻击 | GIN | |
GTA | 黑盒 | 修改特征/修改连边 | 为每个图生成自适应的子图进行后门攻击 | GCN/GraphSAGE/GAT | |
FGA | 白盒 | 修改连边 | 根据模型梯度信息修改连边 | GCN/Deepwalk/Node2vec/LINE | |
Q-Attack | 白盒 | 重布线 | 基于遗传算法,重新布线 | Community Detectior | |
EPA | 白盒 | 修改连边 | 基于遗传算法修改连边 | Community Metrics | |
社区检测 | EDA | 白盒 | 修改连边 | 基于遗传算法(GA)的欧几里得距离攻击策略(EDA)修改连边 | HOPE/LPA/EM/DeepWalk |
MGA | 白盒 | 重布线 | 在基于梯度的迭代过程中加入动量项 | Community Detectior | |
CD-ATTACK | 黑盒 | 修改连边 | 利用图自编码作为生成器生成不明显的扰动,代理算法对扰动加以限制 | Surrogate community detection model | |
DICE | 白盒 | 重布线 | 利用启发式算法,删除部分连边,随后通过添加连边恢复其影响力 | Community Detectior |
防御方法分类Table 3 The classification of defense methods"
防御策略 | 防御方法 | 任务 | 原理 | 方式 | 目标模型 |
随机防御 | 节点分类 | 在训练期间随机丢弃一些连边 | 修改图结构 | GNN | |
BVAT | 节点分类 | 通过对远离彼此的节点子集或所有节点产生虚拟的对抗性扰动来提高GCN分类器的平滑性 | 修改模型 | GCN | |
GCN-GATV | 节点分类 | 通过最大化图虚拟对抗正则化器生成对抗样本 | 修改图结构 | GCN | |
对抗训练 | Global/TargetAT/平滑防御 | 节点分类 | 针对全局/目标的对抗攻击进行对抗训练,用平滑蒸馏和平滑交叉熵损失函数实现梯度平滑 | 修改模型 | GNN |
S/DVAT | 节点分类 | 将基于标记和未标记数据的虚拟对抗训练应用在GCN的损失函数上,进行虚拟对抗训练 | 修改模型 | GCN | |
GraphDefense | 节点分类 | 利用原始分类器为未类标数据做出预测类标,使用所有节点进行对抗训练 | 修改模型 | GCN | |
对抗性扰动检测 | KL散度检测 | 节点分类 | 通过计算节点及其邻域的 softmax 概率之间的 KL 散度的平均值来衡量差异 | 修改图结构 | GCN, GAT |
GraphSAC | 异常检测 | 随机绘制节点子集,并依赖于图形感知标准,过滤掉被异常节点污染的集 | 修改图结构 | 异常模型 | |
启发式防御 | IDOpt/Rank | 链路预测 | 将防御者和攻击者之间的交互建模为一个非零和的贝叶斯Stackelberg博弈 | 修改模型 | 基于相似度的链路预测模型 |
图纯化防御 | Low-Rank Defense | 节点分类 | 对图进行低秩逼近(用顶部奇异分量进行重构) | 修改图结构 | GCN |
注意力机制 | PA-GNN | 节点分类 | 限制通过扰动连边的消息传递,使聚合函数更加专注于真实邻居节点 | 修改模型 | GNN |
RGCN | 节点分类 | 使用高斯分布作为图卷积层中节点的隐藏表示,并根据它们的方差为邻居节点分配注意力权重 | 修改模型 | GCN | |
VPN | 节点分类 | 使用可变功率算子代替Laplacian算子 | — | GCN | |
CRIAGE | 链路预测 | 识别要在知识图中添加或删除的事实,模型经过重新训练后改变对目标事实的预测 | 知识图嵌入 | ||
AGCN | 节点分类 | 通过抖动(增加或删除)连边并选择概率来增强GCN的鲁棒性 | — | GCN | |
鲁棒性分析 | 具有径向基函数核的SVM | 节点分类 | 将节点的属性附加到表示节点的欧几里得向量上而获得增强节点特征向量 | — | GCN |
可训练邻接矩阵 | 节点分类 | 通过在训练过程中学习到选定的连边的权重来充分修改图结构 | 修改图结构 | GCN | |
Pro-GNN | 节点分类 | 通过保持图的低秩性、稀疏性和特征光滑性,迭代地重构干净图并优化GNN参数 | 修改图结构/修改模型 | GNN |
数据集内容Table 4 The details of datasets"
类别 | 任务 | 数据集 | 来源 | 图数量 | 节点数 | 连边数 | 特征数 | 类标数 |
NC/LP | Cora | 文献[ | 1 | 2 708 | 5 429 | 1,433 | 7 | |
NC | Cora-ML | 文献[ | 1 | 2 995 | 8 416 | 2,879 | 3 | |
引文网络数据集 | NC/LP | Citeseer | 文献[ | 1 | 3 327 | 4 732 | 3,703 | 6 |
NC | Pubmed | 文献[ | 1 | 19 717 | 44 338 | 500 | 3 | |
NC/CD | DBLP | 文献[ | 1 | 4 107 340 | 36 624 464 | — | — | |
NC/LP | PolBlogs | 文献[ | 1 | 1 490 | 19 025 | — | 2 | |
NC | 文献[ | 1 | 232 965 | 11 606 919 | 602 | 41 | ||
NC/LP | 文献[ | 1 | — | — | — | — | ||
社交网络数据集 | NC/CD | Google+ | 文献[ | 1 | 107614 | 13 673 453 | — | — |
CD | 文献[ | 1 | 1 005 | 25 571 | — | — | ||
CD | Dolphin | 文献[ | 1 | 62 | 159 | — | — | |
CD | Karate | 文献[ | 1 | 34 | 78 | — | — | |
CD | Football | 文献[ | 1 | 115 | 613 | — | — | |
GC | ENZYMES | 文献[ | 600 | 32.63 | 62.14 | 18 | 6 | |
GC | NCI-1 | 文献[ | 4 110 | 29.87 | 32.30 | 37 | 2 | |
生物-化学数据集 | GC | MUTAG | 文献[ | 188 | 17.93 | 19.79 | 7 | 2 |
GC | D&D | 文献[ | 1 178 | 284.31 | 715.65 | 82 | 2 | |
GC | PROTEIN | 文献[ | 1 113 | 39.06 | 72.81 | 4 | 2 | |
GC | PTC | 文献[ | 344 | 25.5 | — | 19 | 2 | |
注:NC(node classification);LP(link prediction);CD(community detection);GC(graph classification) |
