RDCL 谣言检测——《Towards Robust False Information Detection on Social Networks with Contrastive Learning》
论文信息
论文标题:Towards Robust False Information Detection on Social Networks with Contrastive Learning论文作者:Chunyuan Yuan, Qianwen Ma, Wei Zhou, Jizhong Han, Songlin Hu论文来源:2019,CIKM论文地址:download 论文代码:download1 Introduction问题:会话图中轻微的扰动讲导致现有模型的预测崩溃 。
文章插图
研究了两大类数据增强策略(破坏会话图结构):
文章插图
贡献:
(1) 提出了RDCL框架,为虚假信息检测提供了鲁棒的检测结果,该框架利用对比学习从多个角度提高了模型对扰动信号的感知 。
(2) 证明了硬正样本对可以提高对比学习的效果 。
(3) 提出了一种有效的硬样本对生成方法 HPG,它可以增加对比学习的效果,使模型学习更鲁棒的表示 。
(4) 通过比较实验、在不同的 GNN 和两个数据集上进行的消融实验,证明了该模型的有效性 。
2 Methodlogy问题定义:预测无向会话图的标签 。
整体框架如下:
文章插图
2.1 Data Perturbationsnode-based data perturbationComments contain noise (CN) 在除根节点以外的节点中,以 $\rho $ 的采样率采样节点,对于采样的节点用高斯分布初始化,没有被采样到的节点采用 0 填充:
$X_{C N}^{-r}=X^{-r}+X_{G a u s s i o n}^{-r}$
Comments are deleted (CD)
在除根节点以外的节点中,以 $\rho $ 的采样率采样节点,然后将其节点特征向量置 0 :
$X_{C D}^{-r}=X^{-r} \odot D^{-r}$
Comments are exchangeable (CE)
在除根节点以外的节点中,以 $\rho $ 的采样率采样节点,交换节点特征向量 。
topology-based data perturbationPropagation sub-structure is removed (PR)
在除根节点以外的节点中,随机选择一部分节点,并删除其形成的子图 。
Propagation structure is uncertain (PU)以 $\rho $ 的采样率采样边,并删除边:
$A_{P U}=A-A_{\text {drop }}$
Propagation structure is incorrect (PI)随机选择两个节点 $C_i$ 和 $C_j$,对于 节点 $C_i$,选择删除它和它父节点之间的边,并添加 $C_j$ 和 $C_i$ 之间的边 。
2.2 Contrastive Perturbation Learning对于一张图,采用不同的数据增强策略,得到两个增强图,并获得其对应的图级表示,使用 NT-XENT 损失作为自监督损失:${\large \mathcal{L}_{\mathrm{SSL}}=-\log \frac{\exp \left(z_{m}^{i} \cdot z_{m}^{j} / \tau\right)}{\exp \left(z_{m}^{i} \cdot z_{m}^{j} / \tau\right)+\sum\limits _{N e g} \exp \left(z_{m}^{i} \cdot z_{n e g} / \tau\right)}} $Note:需要对 每个特征向量 $z_{m}^{i}, z_{m}^{j},z_{\text {neg }}$ 使用 $l_2$ normalization 。假设:对于含有相同标签的图,将他们认为是正样本对,每个 batch 中有 $P$ 张图,加上数据增强后生成的 $2P$ 张图,总共有 $3P$ 张图,自监督对比损失如下:
${\large \mathcal{L}_{S C L}=-\frac{1}{3 P} \log \frac{\sum\limits _{Y_{s}=Y_{m}} \exp \left(z_{m} \cdot z_{s} / \tau\right)}{\sum\limits_{Y_{s}=Y_{m}} \exp \left(z_{m} \cdot z_{s} / \tau\right)+\sum\limits_{Y_{d} \neq Y_{m}} \exp \left(z_{m} \cdot z_{d} / \tau\right)}} $
[ Anchor 和 数据增强图之间的对比损失]
2.3 Perturbation Sample Pairs Generation自监督损失:
$\begin{aligned}\mathcal{L}_{\mathrm{SSL}}=&-z_{m}^{i} \cdot z_{m}^{j} / \tau +\log \left(\exp \left(z_{m}^{i} \cdot z_{m}^{j} / \tau\right)+\sum\limits_{\mathrm{Neg}} \exp \left(z_{m}^{i} \cdot z_{n e g} / \tau\right)\right)\end{aligned}$
[数据增强图之间的对比损失]
上述 $\mathcal{L}_{\text {SSL }}$ 关于 $z_{m}^{i}$ 的梯度为:
经验总结扩展阅读
- 家里频繁跳闸如何解决
- 水质检测多少可以直饮
- 11月起核酸检测要收费了!各地最新通知
- 二 Three光线检测-实现摄像机向鼠标点击位置滑动动画
- 水质检测多少点为正常饮用水
- 水质硬度的检测标准
- 一支核酸检测病毒采样管多少钱 怎样看待自费核酸检测
- 卵泡检测是阴超还是b超
- 精子质量检测标准是什么
- 盘它!基于CANN的辅助驾驶AI实战案例,轻松搞定车辆检测和车距计算!