GACL 谣言检测《Rumor Detection on Social Media with Graph Adversarial Contrastive Learning》( 二 ) _生活百科

2 Method2.1 Definition本文将谣言检测定义为一种分类任务，其目的是从一组带标签的训练事件中学习一个分类器，然后用它来预测测试事件的标签。使用 $C=\left\{c_{1}, c_{2}, \cdots, c_{n}\right\}$ ，$c_{i}$ 是第 $i$ 个事件， $n$ 是事件的数量。每个事件 $c=(y, G)$ 包含 ground-truth 标签 $y \in\{R, N\}$ (也就是 Rumor 和 Non-rumor) 和其传播结构树 $G=(V, E)$ ，$V$ 和 $E$ 分别是节点和边的集合。有时谣言检测被定义为一个四类的分类任务，相应的 $y \in\{N, F, T, U\}$ ( Non-rumor、False Rumor、True Rumor、Unverified Rumor) 。在模型训练阶段，$\hat{G}$ 由数据增强生成，目的是与原图 $G$ 一起学习一个分类器 $f(\cdot)$ 。在测试阶段，只有原图 $G$ 会被用来预测给定事件 $c_{i}$ 的标签。
2.2 Framework

文章插图
2.3 Graph Data AugmentationGACL采用 Edge perturbation 策略进行数据增强。对于一个图 $G=(V, E) $ ，其邻接矩阵为 $A$ ，特征矩阵为 $X$ ，Edge perturbation 在训练时将会根据一定的概率 $r$ 来随机丢弃、添加或者误置一些边，以此来干扰 $G$ 的连接。假设新生成的增强图为 $\hat{G}^{\prime}$，$A_{\text {perturbation }}$ 为一个从原来的边集合中随机采样的矩阵，则 $\hat{G}$ 的邻接矩阵 $A^{\prime}$ 可以计算为对谣言制造者设计的伪装结构。
此外，对于谣言检测任务，上图中由 $post$ 组成的图节点的文本信息也是正确分类谣言的关键线索之一，还需要对其进行增强以提供一些噪声。本文采用 Dropout mask 来对这些文本进行增强，也就是随机 mask 每个 post 中的一些词，如上图所示。
2.4 Graph Representation本文使用 BERT 来获取事件的原文和评论的句子表示，以构建新的 $X$。为了强调 source post 的重要性，以 [CLS] Source [SEP] Comment [SEP] 的形式来将原文和评论连接起来，以 [CLS] 这个 token 的最终表示作为节点的表示。
本文使用一个两层$\mathrm{GCN}$作为encoder。当前图记为$G_{k} $ ，其增强图为$\hat{G}_{k}$，经过两层$\mathrm{GCN}$后学习到的节点表示矩阵为$H_{k}^{(2)}$，最后使用一个 mean-pooling 来获得图的表示：
$h_{k}=M E A N\left(H_{k}^{(2)}\right)$
2.5 AFT Component即使 AFT module 不存在，由 GCN 生成的图表示 $h$ 也可以直接输入最终的 $softmax$ 层进行谣言分类。然而，由于该模型在训练阶段只暴露于包含随机噪声的数据增强生成的输入样本中，因此它缺乏对对抗性样本（特别是一些被人类仔细干扰的数据）的鲁棒性，如 Figure1(c). 所示为了逃避模型检测，谣言产生者可能会使用图伪装策略，使会话线程更接近非谣言实例，从而混淆了图检测模型。他们也可以利用谣言机器人来发布大量的评论，其中包含许多高频和指示性的词，以掩盖事实。这些案例的最终目标是使谣言特征向量更接近于潜在空间中的非谣言特征向量。提出的基于对抗学习的 AFTmodule 试图在高维空间中模拟这些行为，并生成对抗向量，用于挖掘训练阶段的事件不变特征。如 Figure 3 所示，AFT 由 $L = 2$ fully connected layers、Dropout 和 Normalization (DN) 组成。经过 AFT module 后，$h_k$ 转换为 $z_k$，公式为
$z_{k}=D N\left(\max \left(0, h_{k} W_{1}^{A F T}+b_{1}\right) W_{2}^{A F T}+b_{2}\right)$
将得到的 $z_k$ 向量作为对比学习中的硬负样本。
现在，对于 batch 中的每一个 post，我们得到了 GCN 编码的相应图表示 $h_{k}$，以及 AFT 生成的对抗表示 $z_{k}$ 。然后，我们将它们连接起来，以将信息合并为

GACL 谣言检测《Rumor Detection on Social Media with Graph Adversarial Contrastive Learning》( 二 )

经验总结扩展阅读

肉放冰箱冷冻一年还可以吃吗肉放冰箱冷冻一年还能不能吃

想对爸爸妈妈说的话对爸爸妈妈想说的话

你是我最深的疼惜，你是我最想陪伴的人

iPhone怎么删除软件?

ppsu和pp的区别?

如何正确引导自负好动的孩子

元旦如何对女孩子送祝福有哪些表达元旦祝福的句子呢

火锅的碗怎么能清洗干净吃火锅怎么快速洗碗又快又干净

国庆假期刚结束，中小学生就有望迎来6天小长假，个别地区已落实

河南两女子做34年闺蜜后，突发奇想做DNA，才知道是双胞胎姐妹

2023年10月8日适合装修屋顶吗 2023年农历八月廿四宜装修屋顶吗

蚕丝棉被和蚕丝被的区别

|请你好好生活，用好脾气换福气！学会不生气，才是最大的赢家！

适合女生发的朋友圈有什么女生发朋友圈的句子

美味白灼虾的做法美味白灼虾的做法是什么

怎么画书书简笔画教程

写在开始：有一句歌词...|男人若认定了你，他就会沉得住气，不想要“轰轰烈烈”

跟牛尔DIY左旋C美白精华液

|陈美玲终于爆发！控诉艾威酒瘾大控制欲强，性格比张婉婷还强势

2022年11月27日嫁娶好吗