谣言检测——《Debunking Rumors on Twitter with Tree Transformer》( 二 ) _生活百科

(2) posts in the same subtree direct at the individual opinion expressed in the root of the subtree.
(3) Coherent opinions can be captured by comparing ALL responsive posts in the same subtree, that lower weight the incorrect information. Bottom-Up TransformerFigure 2(c) 说明了本文的 tree transformer 结构，它 cross-check 从底部子树到上部子树的 post 。具体来说，给定一个有根于 $x_j$ 的子树，假设 $\mathcal{V}(j)=\left\{x_{j}, \ldots, x_{k}\right\}$ 表示子树中的节点集合，即 $x_j$ 及其直接响应节点。然后，我们在 $\mathcal{V}(j)$ 上应用一个 post-level subtree attention（a transformer-based block as shown in Figure 2(b)），以得到 $\mathcal{V}(j)$ 中每个节点的细化表示：
$\left[s_{j}^{\prime} ; \ldots ; s_{k}^{\prime}\right]=\operatorname{TRANS}\left(\left[s_{j} ; \ldots ; s_{k}\right], \Theta_{T}\right) \quad\quad\quad(5)$
其中， $TRANS (\cdot)$ 是具有如 Eq. 2-4 中所示的相似形式的 transform function ， $\Theta_{T}$ 包含了 transformer 的参数。因此， $s_{*}^{\prime}$ 是基于子树的上下文得到的 $s_{*}$ 的细化表示。请注意，每个节点都可以被视为不同子树中的父节点或子节点，例如，在 Figure 2(a) 中， $x_{2}$ 可以是 $T\left(x_{2}\right)$ 的父节点，也可以是 $T(r)$ 的子节点。因此，一部分的节点在我们的 from bottom subtree to upper subtree 模型中结果两次层次细化：(1)通过与父节点相比来捕获立场 stance ， (2) 通过关注邻居节点来获得较低权重的不准确信息，例如，一个父母支持一个错误的声明可能会细化如果大多数响应驳斥父节点。
Top-Down TransformerTop-down transformer 的方向与 bottom-up transformer 相反，沿着信息传播的方向，其架构如 Figure 2 (d) 所示。同样的，其学习到的表示也通过捕获立场和自我纠正上下文信息得到增强。
2.3 The overall Model为了共同捕获整个树中表达的观点，我们利用一个注意力层来选择具有准确信息的重要帖子，这是基于细化的节点表示而获得的。这将产生：
$\begin{array}{l}\alpha_{i}=\frac{\exp \left(s_{i}^{\prime} \cdot \mu^{\top}\right)}{\sum\limits_{j} \exp \left(s_{j}^{\prime} \cdot \mu^{\top}\right)} \\\tilde{s}=\sum\limits_{i} \alpha_{i} \cdot s_{i}^{\prime}\end{array}\quad\quad\quad(6)$
其中， $s_{i}^{\prime}$ 由 Bottom-Up Transformer 或 Top-Down Transformer 得到， $\mu \in \mathbb{R}^{1 \times d}$ 是注意力机制的参数。这里的 $\alpha_{i}$ 是节点 $x_i$ 的注意权值，用于生成整个树的表示 $\tilde{s}$ 。最后，我们使用一个全连接的输出层来预测谣言类上的概率分布。
$\hat{y}=\operatorname{softmax}\left(V_{o} \cdot \tilde{s}+b_{o}\right) \quad\quad\quad(7)$
其中， $V_{o}$ 和 $b_{o}$ 是输出层中的权值和偏差。
此外，还有一种直接的方法可以将 Bottom-Up transformer 与 Top-Down transformer 的树表示连接起来，以获得更丰富的树表示，然后将其输入上述的 $softmax (\cdot)$ 函数进行谣言预测。
我们所有的模型都经过训练，以最小化预测的概率分布和地面真实值的概率分布之间的平方误差：
$L(y, \hat{y})=\sum_{n=1}^{N} \sum_{c=1}^{C}\left(y_{c}-\hat{y}_{c}\right)^{2}+\lambda\|\Theta\|_{2}^{2} \quad\quad\quad(8)$
其中 $y_{c}$ 是 ground-truth label ， $\hat{y}_{c}$ 是类C的预测概率， $N$ 是训练的树数， C 是类的数量， $\|.\|_{2}$ 是所有模型参数 $\Theta$ 上的 $L_{2}$ 正则化项， $\lambda$ 是权衡系数。

谣言检测——《Debunking Rumors on Twitter with Tree Transformer》( 二 )

经验总结扩展阅读

我在他乡挺好的|夜读｜心安即归处，我在他乡挺好的

什么是空调扇空调扇怎么使用

38岁“大龄剩女”的醒悟：直到初恋为人父|38岁“大龄剩女”的醒悟：直到初恋为人父，我才明白自己有多傻

送给老师的贺卡图片教你如何表达感恩的心意

萌听小c姐|奥运会倒数第三天：日本金牌数进前三，中美差距逐渐缩小！

新娘出门为什么要撑红伞新娘出嫁打伞的意义是什么

2023年辽宁春节联欢晚会什么时候开始

装修设计精选|花了五个月终于完工，全屋定制柜子真漂亮，不做吊顶，太机智了！

韩国“不卸妆姐”不爱水自爆三年不洗脸不卸妆

国内最适合旅游的地方中国最适合旅游的地方介绍

奔驰nfc功能是什么？

电脑太卡了怎么解决解决方法推荐

本文转自：北青网据芒果帮女郎消息 92岁妈妈包饺子，让72岁女儿休息，真相让人泪奔！

良哲的寓意是什么？

苹果a2400 a2399区别?

2023年宝宝的名字吉利兴旺500个男孩取名字大全免费查询2023

恋恋健身|为啥不建议女性天天喝牛奶呢？需要注意什么呢？

立冬和过冬是一个意思吗,立冬来历和风俗

2022最新给喜欢的人表白句子 2022最新给喜欢的人表白唯美句子

新手一字马怎么练正确姿势