BERT的基本理念

🕗 发布于 2024-11-25 10:39 bert 人工智能 深度学习

BERT的基本理念

BERT的基本理念：

word2vec是一类生成词向量的模型的总称。这类模型多为浅层或者双层的神经网络，通过训练建立词在语言空间中的向量关系。

BERT是Bidirectional Encoder Representations from Transformers的缩写，意为多Transformer的双向编码器表示法，它是由谷歌发布的先进的嵌入模型。BERT是自然语言处理领域的一个重大突破，它在许多自然语言处理任务中取得了突出的成果，比如问答任务、文本生成、句子分类等。BERT成功的一个主要原因是，它是基于上下文的嵌入模型，这是它与其他流行的嵌入模型的最大不同，比如无上下文的word2vec 。

首先，让我们了解有上下文的嵌入模型和无上下文的嵌入模型之间的区别。请看以下两个句子。

句子A：He got bit by Python（他被蟒蛇咬了）

句子B：Python is my favorite programming language（Python是我最喜欢的编程语言）

阅读了上面两个句子后，我们知道单词Python在这两个句子中的含义是不同的。在句子A中，Python是指蟒蛇，而在句子B中，Python是指编程语言。

如果我们用word2vec这样的嵌入模型计算单词Python在前面两个句子中的嵌入值，那么该词的嵌入值在两个句子中都是一样的，这会导致单词Python在两个句子中的含义没有区别。因为word2vec是无上下文模型，所以它会忽略语境。也就是说，无论语境如何，它都会为单词Python计算出相同的嵌入值。

与word2vec不同，BERT是一个基于上下文的模型。它先理解语境，然后根据上下文生成该词的嵌入值。对于前面的两个句子，它将根据语境对单词Python给出不同的嵌入结果。这背后的原理是什么？BERT是如何理解语境的？下面让我们详细解答这些疑问。

首先来看句子A：He got bit by Python。BERT将该句中的每个单词与句子中的所有单词相关联，以了解每个单词的上下文含义。

具体地说，为了理解单词Python的上下文含义，BERT将Python与句子中的所有单词联系起来。

BERT可以通过bit这一单词理解句子A中的Python是用来表示蟒蛇的，如下图所示。

在这里插入图片描述

下面来看句子B：Python is my favorite programming language。同理，BERT将这句话中的每个单词与句子中的所有单词联系起来，以了解每个单词的上下文含义。所以，通过programming一词，BERT理解了句子B中的单词Python与编程语言有关，如下图所示。

在这里插入图片描述

由此可见，与word2vec等无上下文模型生成静态嵌入不同，BERT能够根据语境生成动态嵌入。

原文地址：https://blog.csdn.net/weixin_44144773/article/details/144004482

免责声明：本站文章内容转载自网络资源，如侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：论文笔记：Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
下一篇：AWS云安全

Java 的初认识（一）
一 . Java 语言的概念1 . 1 什么是 Java?Java 是一门面向对象的编程语言，是一门极其优秀的程序设计语言Java语言具有简单易用、功能强大两个特征，具体功能性体现在面向对象、分布式、
阅读更多2025-01-24
C22.【C++ Cont】位运算总结(1)(例题五种解法!含汇编解法)
如8位的x,想保留x的第0,2,和4位(最低位为第0位),则让8位的m的指定位(第0,2,和4位)为1,即m==0001 0101b,使x&m,结果即为所求,结果其他位为0。注意:不能写ret
阅读更多2025-01-24
ubuntu 22.04 配置用户密码输错N次锁定用户策略
Ubuntu 20.04 及之后的版本默认情况下并不包含登录失败三次后自动锁定账户的功能。如果你想手动设置在Ubuntu 22.04上实现类似的机制，可以使用faillock或pam_t
阅读更多2025-01-24
【C语言】_自定义类型：联合体
若采用纯结构体作为商品的自定义类型，则由于特殊属性的存在须在结构体内包含所有商品所需的所有属性，造成一定空间浪费；假设当前有图书、杯子、衬衫三种商品，对于每种商品都有库存量、价格、商品类型属性；对于每
阅读更多2025-01-24
Glary Utilities Pro 多语便携版系统优化工具 v6.21.0.25
Glary Utilities是一款功能强大的系统优化工具软件，旨在帮助用户清理计算机垃圾文件、修复系统错误、优化系统性能等。
阅读更多2025-01-24
Nginx学习笔记
配置文件在conf目录下的nginx.config文件中。做反向代理映射地址的=：精确匹配，请求地址必须和uri相同才会进入这个location~：模糊匹配，只要符合uri规则就会进入了这个locat
阅读更多2025-01-24
Harmony Next 跨平台开发入门
ArkUI跨平台框架(ArkUI-X)进一步将ArkUI开发框架扩展到了多个OS平台：目前支持OpenHarmony、Android、 iOS，后续会逐步增加更多平台支持。开发者基于一套主代码，就可以
阅读更多2025-01-24
【业务案例】F.13——SAP系统标准的清帐程序有BUG?
问题来源于，用户气势汹汹地跑来质问，为什么测试运行F.13的时候也没有报错全部都能成功，但是正式运行清帐功能的时候就少了好多数据，一点规律都没有！SAP系统有BUG！！嗯，那就让我们来看看“BUG”~
阅读更多2025-01-24
数据结构——实验六·散列表
本实验基于C实现散列表的创建、插入、查找
阅读更多2025-01-24
实战演示：利用ChatGPT高效撰写论文
在当今学术界，撰写论文是一项必不可少的技能。然而，许多研究人员和学生在写作过程中常常感到困惑和压力。幸运的是，人工智能的快速发展为我们提供了新的工具，其中ChatGPT便是一个优秀的选择。本文将通过易
阅读更多2025-01-24

BERT的基本理念

BERT的基本理念

BERT的基本理念：

相关文章