深度学习-18-深入理解BERT实战使用预训练的DistilBERT模型

🕗 发布于 2024-09-23 21:49 深度学习

文章目录

1 预训练的BERT模型
3 为下游任务微调BERT
4 问题及解决
5 参考附录

1 预训练的BERT模型

从开始预训练BERT模型是很耗资源的，所以我们可以下载预训练好的BERT模型。
在BERT-uncased中，所有的标记都是小写的。
在BERT-cased中的标记没有转换为小写，而是直接用来训练。

其中BERT-uncased模型是最常用的。

我们可以以下面两个方式使用预训练模型：
(1)作为抽取嵌入表示的特征抽取器。
(2)通过在下游任务像文本分类、问答等任务的微调预训练的BERT模型。

实战文本分类中的情绪识别任务和自然语言推理中的问答任务。# 2 作为抽取嵌入表示的特征抽取器
学习具体如何从预训练的BERT模型中抽取单词级和句子级的嵌入表示。

2.1 单词级的嵌入表示

考虑一个句子 I love Paris，假设我们要抽取该句子中的每个标记的上下文嵌入。
首先，我们对句子分词然后喂给预训练的BERT模型，它会返回每个标记的嵌入表示。
除了可以获取标记级(单词级)的嵌入表示，我们还可以获取句子级的表示。

假设我们想要完成一个情感分析任务，然后我们有下面的数据集：
在这里插入图片描述

原文地址：https://blog.csdn.net/qq_20466211/article/details/142331116

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Perfetto-Android开发分析神器（性能、内存、线程调度）
下一篇：链表练习包括（创建遍历插入删除逆置排序）

趣味运动会随机分组指南
本文介绍了如何使用云分组小程序进行趣味运动会的随机分组，确保男女比例平均。首先，通过小程序创建分组并设置男女平均分配。成员可以通过扫码、点击链接或输入口令三种方式加入。加入后，成员可以看到自己的组别和
阅读更多2024-09-23
Python异步编程-asyncio详解
')"""输出:Hello ...... World!"""这个例子展示了如何使用asyncio库来编写并发代码。通过async和await
阅读更多2024-09-23
java项目开发1
配置环境变量在path里面新建，复制地址后确定关闭。在所用的盘里建文件夹MavenJar仓库。用记事本打开settings配置本地仓库。修改localRepository。manven安装,解压。点击
阅读更多2024-09-23
QT| “无法粘贴窗口部件”错误以及customplot
“无法粘贴窗口部件”错误的处理方案，以及customplot的安装和使用。
阅读更多2024-09-23
chapter3-基于jwt的分布式认证流程
接下来，因为是新开发一个功能模块，那么我们可以在新的分支下进行开发，将来方便对这部分代码进行单独管理，等开发完成了以后再合并分支到develop也是可以的。前端显示登陆页面登录页组件component
阅读更多2024-09-23
P4630 [APIO2018] 铁人两项（圆方树模版）
在此贴出适合我体质的模版，至于讲解，咱肯定讲的没小粉兔好o(╥﹏╥)o。圆方树相关的东西小粉兔讲的太详细了！
阅读更多2024-09-23
Unity 使用协程非阻塞执行程序
Unity协程是一种允许在不阻塞主线程的情况下暂停和恢复代码执行的功能，它通常用于处理延时操作、复杂逻辑处理、异步加载等场景。Unity的协程支持多种类型的等待操作，包括等待一段时间（`WaitFor
阅读更多2024-09-23
ERNIESpeed-128K在线智能聊天机器人项目（附源码）
基于百度千帆的智能聊天机器人项目，附源码
阅读更多2024-09-23
Algo-Lab 2 Stack & Queue ADT
因此，我们设置一个最小值的栈，他和存储的栈同步Push和Pop，只是，它每次push 的是栈目前存储的元素中的最小的值，这样就解决了 Pop 后的最小值问题了。是一个经典的T形火车问题，主要思路就
阅读更多2024-09-23
Vue 2&3进阶面试题：（第五天）
params一旦设置路由，params就是路由的一部分，如果这个路由有params传参，但是在跳转的时候没有传这个参数，会导致跳转失败或者页面会没有内容。例如有一个商品页面和一个详情页面，这样在两个页
阅读更多2024-09-23

深度学习-18-深入理解BERT实战使用预训练的DistilBERT模型

文章目录

1 预训练的BERT模型

2.1 单词级的嵌入表示

相关文章