LLM基础概念：Token

🕗 发布于 2024-09-30 02:46 机器学习 人工智能 langchain

什么是token？为什么要限制token的输入？平时说的消耗token数指的是什么？

token是用于自然语言处理的词的片段。

在自然语言处理模型中，限制token数量主要是出于计算效率和资源限制的考虑。每一个token都对应一个向量，当输入模型的token数量增加时，模型需要处理的数据量也会相应增加，这对计算资源(如内存和计算能力)的需求也会增大。因此，在现实应用中，为了保证模型能在可接受的时间内完成任务，通常会对输入的token数量设置一个上限。

当我们说模型消耗的token数时，通常是指在一次计算（比如一次训练步骤中或是一次推理过程中）模型处理的token总量（包括input和output）。不同模型的tokenizer不同，所以不同模型计算同一个句子的token数不同。

token的组成可以参考下图，不同模型可能定义了不同字部分的独立限制：

为什么训练成本的消耗要用token消耗来衡量？

直观：模型训练时的基本单位就是token，每个token都需要模型进行处理和计算。因此，token数可以直接反映训练过程中的计数量。这使得token消耗成为一种直观易懂的衡量标准。
通用性：不同的模型、不同的任务，其训练过程中的具体操作可能会不同，但token作为基本处理单元，其存在是共通的。因此，使用token消耗作为衡量标准，具有良好的通用性和一致性。
与模型复杂性关联：模型处理的token数和模型的复杂性直接相关，处理的token越多，模型的复杂性通常越高，进而对计算资源的需求也越大。因此，使用token消耗可以有效的反映模型训练的复杂度和成本。

备注：

tokenizer（token计数器）：词元分析器是一种计算机处理文本的技术。它将文本分解成一个个单独的词元，也就是文本中的单词、数字、符号等基本单位。词元分析器常用于自然语言处理、搜索引擎、文本挖掘等应用中，能够帮助进行文本的预处理和数据的清洗。在机器学习和深度学习领域中，词元分析器也是必不可少的一步，它能够将文本数据转化为数学模型所需要的向量或矩阵形式，更方便进行后续的算法和模型训练。https://platform.openai.com/tokenizer

原文地址：https://blog.csdn.net/weixin_40307696/article/details/142547861

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：无人机避障—— 激光雷达定高北醒TF03-UART（二）
下一篇：E34.【C语言】位段练习题

用友U8+CRM leadconversion.php SQL注入复现
CRM客户关系管理系统 /leadconversion.php 文件存在SQL注入漏洞，未经身份验证的攻击者通过漏洞执行任意SQL语句，调用xpcmdshell写入后门文件，执行任意代码，从而获取到服
阅读更多2024-09-30
【漏洞复现】VEXUS多语言货币交易所存在未授权访问漏洞
技术文章仅供参考，任何个人和组织使用网络应当遵守宪法法律，遵守公共秩序，尊重社会公德，不得利用网络从事危害国家安全、荣誉和利益，未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。java后
阅读更多2024-09-30
react-问卷星项目（2）
一个git hook 工具，即在git commit之前执行自定义的命令，将规范流程化，如执行代码风格的检查，避免提交非规范的代码，在github搜索即可。这两条是接着执行的，表示创建husky，在文
阅读更多2024-09-30
PersistentVolume与PersistentVolumeClaim的使用
制作nginx执行。
阅读更多2024-09-30
go结构体默认值和校验器（go-defaults、go-validator）
在Java中我们可以比较容易地借助Spring框架等提供的注解来实现成员字段的值验证，另外Java也原生支持对成员字段赋默认值。然而在go语言中这些都不会原生支持，尤其是在前后端通过json数据交互时
阅读更多2024-09-30
用 Go 和 Redis 构建一个简单的任务管理系统
这个简单的任务管理系统使用 Go 和 Redis 实现了基本的 CRUD 操作。你可以根据需要扩展功能，比如添加用户认证、任务列表等。希望这个项目能帮助你入门！如果有任何问题，随时问我。
阅读更多2024-09-30
ARM64 Linux 找出dts的3种方法
ARM64 Linux 找出dts的3种方法
阅读更多2024-09-30
十六、变量、流程控制与游标
定义条件是事先定义程序执行过程中可能遇到的问题，处理程序定义了在遇到问题时应当采取的处理方式，并且保证存储过程或函数在遇到警告或错误时能继续执行。这样可以增强存储程序处理问题的能力，避免程序异常停止运
阅读更多2024-09-30
【软设】项目管理
经验之谈，在此分享。祝大家国庆快乐。内容包含：Gantt图，Gantt图，风险管理，成本管理，沟通管理的相关内容。
阅读更多2024-09-30
Android问题笔记五十：构建错误-AAPT2 aapt2-7.0.2-7396180-windows Daemon
Execution failed for task ':admin:processDebugResources'.A failure occurred while executing `com.and
阅读更多2024-09-30

LLM基础概念：Token

相关文章