完成预训练后,如何用 ERNIE 来解决具体的 NLP 问题呢?下面以单句分类任务(如情感分析)为例,介绍下游 NLP 任务的解决过程:
- 基于tokenization.py脚本中的Tokenizer对输入的句子进行token化,即按字粒度对句子进行切分;
- 分类标志符号[CLS]与token化后的句子拼接在一起作为ERNIE模型的输入,经过 ERNIE 前向计算后得到每个token对应的embedding向量表示;
- 在单句分类任务中,[CLS]位置对应的嵌入式向量会用来作为分类特征 。只需将[CLS]对应的embedding抽取出来,再经过一个全连接层得到分类的 logits 值,最后经过softmax归一化后与训练数据中的label一起计算交叉熵,就得到了优化的损失函数;
- 经过几轮的fine-tuning,就可以训练出解决具体任务的ERNIE模型 。

文章插图
关于ERNIE更详细的介绍,可以参考这两篇学术论文:
- ERNIE: Enhanced Representation through Knowledge Integration
- ERNIE 2.0: A Continual Pre-training Framework for Language Understanding
?
【【一】ERNIE:飞桨开源开发套件,入门学习,看看行业顶尖持续学习语义理解框架,如何取得世界多个实战的SOTA效果?】
经验总结扩展阅读
- 酸奶冷冻会变成冰淇淋吗
- 一寸照片的尺寸是多少像素
- 滇红茶属于什么茶
- 2024年五月十九出生余姓女孩名字叫什么生辰八字五行查询
- 金骏眉是红茶吗
- 送大学生什么礼物好实用
- 男生一般喜欢什么礼物
- 坐地铁需要身份证吗
- 土豆刚冒出一点小芽的能吃吗
- 一斤面粉放多少酵母