【python深度学习】通俗易懂的理解一下transformer、RNN、CNN的主要区别

🕗 发布于 2024-07-11 19:10 transformer rnn cnn

在“Transformer model”诞生之前，计算机是如何进行语言翻译的。在那个时代，计算机主要使用循环神经网络（RNNs）和卷积神经网络（CNNs）这两种技术来处理语言翻译任务。

1. 通俗的解释

循环神经网络（RNNs）

想象一下你在玩耳语传话游戏，将一条消息传给旁边的人，再由他们继续传递。RNNs的工作方式与此类似：它们逐个接收单词或句子的部分，处理后用于理解下一个单词，直到整个句子被处理完。然而，RNNs存在一个问题：它们容易“健忘”。就像耳语传话游戏中最初的信息在传到最后一个人时可能已经变样，RNNs在处理长句子时，可能会忘记开头的内容，这对准确翻译长句子是个挑战。

卷积神经网络（CNNs）

想象你有一堆图片卡片，通过一个小窗口逐一查看。CNNs处理句子的方式类似，它们在单词或短语间滑动，试图发现其中的模式，识别语言的结构和形式。CNNs比RNNs处理速度更快，因为它们能同时观察多个单词，但在处理特别长的句子时仍有难度，就像通过小窗口看连环画，无法一眼看完整个故事。

Transformer模型

Transformer模型带来了革命性的变化。它采用自注意力机制，能够同时处理整个句子，理解单词之间的关系，不需要逐个传递信息或透过窗口观察。Transformer就像一个超级智能的图书馆管理员，可以一次性扫描并理解所有的书籍，捕捉句子的上下文、细微差别和幽默之处。

当你给Transformer模型一份

原文地址：https://blog.csdn.net/PoGeN1/article/details/140323135

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：云视频监控中的高效视频转码策略：视频汇聚EasyCVR平台H.265自动转码H.264能力解析
下一篇：Socks5代理为什么比HTTP代理快？

眼儿媚·秋雨绵绵窗暗暗
回忆彼时，恰是此时的仲秋季节，笔者的身体状况、精神面貌和心态都很糟糕，加上环境的十分冷清寂寞，就难免影响到老病之身，度日如年。
阅读更多2024-10-07
分享国产32位单片机的电机控制方案
由于其运算速度快，支持硬件压栈和硬件除法器，集成多个高级和通用定时器，内置多路高速双ADC和模拟运放，使其在电机控制应用领域有着较好的性能优势。•支持永磁同步电机(PMSM)、无刷直流电机(BLDC)
阅读更多2024-10-07
Linux 线程同步
介绍线程同步的概念和相关的接口操作
阅读更多2024-10-07
windows C++-创建基于代理的应用程序（上）
本文介绍了如何创建基本的基于代理的应用程序。在这个案例中，你可以创建一个代理，从文本文件中异步读取数据。应用程序使用 Adler-32 校验和算法来计算该文件内容的校验和。
阅读更多2024-10-07
归并排序：递归、非递归实现、文件排序(归并排序实现)
归并排序：递归、非递归实现、文件排序(归并排序实现)
阅读更多2024-10-07
第二章：处理机管理：第三节：同步与互斥
【总结】
阅读更多2024-10-07
Java8 到 Java23 的新特性，都在这里了！
其实每个 Java 版本发布的新特性并不多，而且好多特性要进行多个版本的孵化和预览。虽然公司的 Java 版本肯定跟不上 Java 版本发布的节奏，但作为程序员的我们，可以关注下 Java 的新增特性
阅读更多2024-10-07
如何实现两个标签页之间的通信
【代码】如何实现两个标签页之间的通信。
阅读更多2024-10-07
如何用3个月零基础入门网络安全？_网络安全零基础怎么学习
我们知道计算机最早是在西方发明出来的，很多名词或者代码都是英文的，甚至现有的一些教程最初也是英文原版翻译过来的，而且一个漏洞被发现到翻译成中文一般需要一个星期的时间，在这个时间差上漏洞可能都修补了。”
阅读更多2024-10-07
k8s集群搭建（保姆级教程以及遇到的各种问题解决）
注意上面指定的网段不要跟自己真实的内网网段产生冲突，否则会造成机器之间无法ping通的问题。之后修改kube-flannel.yml中"Network": "10.244
阅读更多2024-10-07

【python深度学习】通俗易懂的理解一下transformer、RNN、CNN的主要区别

1. 通俗的解释

循环神经网络（RNNs）

卷积神经网络（CNNs）

Transformer模型

相关文章