大模型中常见的微调方法有哪些？

🕗 发布于 2024-11-27 13:43 深度学习 机器学习 人工智能

我整理了1000道算法面试题：

获取

这里说的微调主要是指参数微调，参数微调的方法主要有以下几种：
- Adapter
在预训练模型每一层(或某些层)中添加Adapter模块(如上图左侧结构所示)，微调时冻结预训练模型主体，由Adapter模块学习特定下游任务的知识。每个Adapter模块由两个前馈子层组成。具体使用了Adapter的模型结构如下所示：
<img src="https://pic2.zhimg.com/v2-653ed26ec39836bfaaae12ea00c619ed_1440w.jpg" align="center" width="60%"/>
给每个任务定义了自己的Prompt，拼接到输入数据一起作为输入，同时freeze预训练模型进行训练
- Prefix-tunning
前缀微调将一个连续的特定于任务的向量序列添加到输入，称之为前缀，如下图中的红色块所示。与提示（prompt）不同的是，前缀完全由自由参数组成，与真正的token不对应。相比于传统的微调，前缀微调只优化了前缀。因此，我们只需要存储一个大型Transformer和已知任务特定前缀的副本，对每个额外任务产生非常小的开销。
<img src="https://pic2.zhimg.com/v2-b59ea75db687e0cb63c8d8c4aab2889d_1440w.jpg" align="center" width="60%"/>
- P-tuning/P-tuning V2
P-tuning V1直接对embedding层进行优化存在两个挑战：embedding层已经经过预训练，如果直接对输入的prompt embedding进行随机初始化训练，容易陷入局部最优；没法捕捉到prompt embedding之间的相关性。
P-Tuning V2是升级版本，主要解决P-Tuning V1在小参数量模型上表现差的问题。V2在每一层上都加了一个残差连接，每一层都加上prompts，使特征更充分。
P-tuning模型加入embedding位置不固定，可以加在整个输入的前面或者后面，用法比较灵活，且其通过MLP+LSTM的方式对加入的embedding进行了学习，以提高收敛性。整体框架如下图所示：
![image](https://picx.zhimg.com/v2-186237ec6160a0e6502db788018ff03b_1440w.jpg)
- LORA
采用低秩矩阵近似的思想，冻结一个预训练模型的矩阵参数，并选择用A和B矩阵来替代，在下游任务时只更新A和B。流程如下：
<img src="https://pica.zhimg.com/v2-27acf53fcfe3c3c594a4e5cbf4f8959c_1440w.jpg" align="center" width="40%"/>

参考：
[1] https://zhuanlan.zhihu.com/p/636481171
[2] https://zhuanlan.zhihu.com/p/709376189

原文地址：https://blog.csdn.net/hguo11/article/details/144070850

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【es6】原生js在页面上画矩形层级等问题的优化(二)
下一篇：传奇996_36——背包图标，物品位置问题

Webpack之后，Rollup如何引领前端打包新潮流？（1）
快速开始使用 Rollup 进行 JavaScript 模块的打包和优化。Rollup 的摇树优化和多种输出格式使其成为构建现代 JavaScript 应用和库的强大工具。
阅读更多2024-11-27
使用Python实现智能食品安全追溯系统的深度学习模型
本项目旨在利用深度学习技术，通过分析食品的供应链数据，实现智能食品安全追溯。具体步骤包括：数据准备数据预处理模型构建模型训练模型评估与优化实际应用通过本文的介绍，我们展示了如何使用Python构建一个
阅读更多2024-11-27
pytest之收集用例规则与运行指定用例
收集用例规则：搜索所有以test_开头的测试文件，以Test开头的测试类，以test_开头的测试函数执行用例规则：从-v 参数输出的执行信息我们就应该能发现，运行指定的目录下用例使用命令 pytes
阅读更多2024-11-27
C语言实例之9斐波那契数列实现
斐波那契数列（Fibonacci sequence），又称黄金分割数列，因数学家莱昂纳多・斐波那契（Leonardo Fibonacci）以兔子繁殖为例子而引入，故又称为 “兔子数列”。它的特点是从第
阅读更多2024-11-27
热门金融大模型整理
FinRobot，一个支持多种金融专用 AI 代理的开源平台，每个代理均由 LLM 驱动。平台架构包括：金融 AI 代理层，将复杂问题逻辑分解以形成金融思维链；金融 LLM 算法层，为任务定制模型策略
阅读更多2024-11-27
电烙铁焊接STM32芯片、贴片元器件、手册指南！！！
对于常见的贴片元器件，常见方法是使用风枪进行处理，如果没有疯抢，使用电烙铁焊接贴片元器件的过程中，首先需要再焊盘上溶一点锡，然后使用镊子夹住贴片元器件，在焊盘上这个时候烙铁融化焊盘上的锡，镊子夹着元器
阅读更多2024-11-27
2024数学建模亚太赛【C题】赛题详细解析
研究应从多个维度（如宠物类型、市场需求等）对行业数据进行全面分析，同时结合全球产业特点与中国市场现状，制定切实可行的商业发展策略。使用散点图、箱线图、热力图等方法分析变量间的关系，例如市场需求与宠物类
阅读更多2024-11-27
学习HTML第三十三天
学习HTML第三十三天
阅读更多2024-11-27
用 C++ 写一个 AWS Lambda Hello World
如果使用 Python, Java 写 Lambda 时觉得还不得快，不想要明显的预热过程，也许 1000 毫秒的任务只想要 600 毫秒就能完成，内存还希望再压缩一些，那着实能在每月千百万次 Lam
阅读更多2024-11-27
SpringBoot 项目中使用 spring-boot-starter-amqp 依赖实现 RabbitMQ
SpringBoot 项目中使用 spring-boot-starter-amqp 依赖实现 RabbitMQ
阅读更多2024-11-27

大模型中常见的微调方法有哪些？

相关文章