LLM大语言模型的分类

🕗 发布于 2025-01-18 14:35 经验分享 课程设计学习方法算法 人工智能

从架构和功能的角度来看，LLM（Large Language Model，大语言模型）主要可以分为以下几种类型：

1. 基础语言模型：

* **定义:** 通过在大规模文本数据上进行预训练，学习语言的规律和模式，获得通用语言理解能力和生成能力的模型。
* **特点:** 参数量大，计算资源需求高，具有强大的语言理解能力和生成能力。
* **典型代表:** GPT-3、BERT、T5等。

2. 指令微调模型：

* **定义:** 在基础语言模型的基础上，通过在指令数据集上进行微调，使其能够更好地理解和执行用户指令的模型。
* **特点:** 具有更强的指令跟随能力和对话能力，能够根据用户指令生成更符合需求的回复。
* **典型代表:** GPT-3.5、GPT-4等。

3. 多模态模型：

* **定义:** 可以处理和理解多种模态（如文本、图像、音频等）输入，并生成相应输出的模型。
* **特点:** 具有跨模态理解能力，能够进行模态间的交互和生成。
* **典型代表:** CLIP、DALL-E、GPT-4（支持图像输入）等。

4. 领域专用模型：

* **定义:** 针对特定领域（如医疗、法律、金融等）进行优化，具备该领域专业知识和理解能力的模型。
* **特点:** 在特定领域内具有更高的准确性和专业性。
* **典型代表:** 医疗领域的BioGPT，法律领域的LegalGPT等。

5. 小型语言模型：

* **定义:** 参数量较小，计算资源需求较低，适用于资源受限场景的模型。
* **特点:** 计算效率高，部署灵活，适合移动端、嵌入式设备等场景。
* **典型代表:** GPT-2、DistilGPT等。

**其他分类方式:**

* **按训练方式分类:** 自监督学习模型、强化学习模型等。
* **按应用场景分类:** 对话模型、翻译模型、摘要模型等。
* **按参数规模分类:** 小型模型、中型模型、大型模型、巨型模型等。

总结:

以上是对LLM大语言模型的常见分类方式，不同的分类角度可以让我们更全面地了解这些模型的特点和应用场景。随着AI技术的不断发展，未来还会有更多新型的LLM出现。

原文地址：https://blog.csdn.net/qq_42161009/article/details/145215759

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：WildFly与tomcat的异同
下一篇：Docker部署MySQL 5.7：持久化数据的实战技巧

RabbitMQ基础篇
这篇博客深入探讨了 RabbitMQ 的核心概念和技术实现，从消息生产、消费到消息确认机制，详细解析了如何确保消息的可靠性和高效性。通过实际案例展示了如何配置和优化 RabbitMQ，解决常见的消息丢
阅读更多2025-01-18
【Python系列】Python 连接 PostgreSQL 数据库并查询数据
PostgreSQL 是一个高度可扩展的开源数据库管理系统，它支持 SQL（结构化查询语言）并提供许多现代数据库特性，如部分 ACID（原子性、一致性、隔离性、持久性）事务、触发器、视图、事务完整性、
阅读更多2025-01-18
Java（面向对象进阶——抽象类）
【代码】Java（面向对象进阶——抽象类）
阅读更多2025-01-18
SurgiTrack：外科手术视频中的细粒度多类别多工具跟踪|文献速递-视觉大模型医疗图像应用|文献速递-视觉大模型医疗图像应用
Title题目SurgiTrack: Fine-grained multi-class multi-tool tracking in surgical videosSurgiTrack：外科手术视频中
阅读更多2025-01-18
国产编辑器EverEdit - 列编辑模式
在编辑CSV格式，或者比较规整的配置文件时，可能会用到一列的内容都要进行修改的情况，在不支持列模式领导说你写的不对，参数DLARFCN值写错了，应该全部写成65535。赶紧评估下操作负载：10次鼠标双
阅读更多2025-01-18
解决conda create速度过慢的问题
解决conda create速度过慢的问题
阅读更多2025-01-18
GaussDB创建不同兼容模式的数据库
使用UGO迁移工具时要考虑GaussDB数据库兼容性。
阅读更多2025-01-18
海思3519dv500目标识别之yolov5环境搭建
海思3519dv500目标识别之yolov5环境搭建
阅读更多2025-01-18
递归练习三（决策树）
用决策树解决问题时一般结果在根到叶子的路径上，叶子节点或就是递归的每一次。所以有很多时候都是要用到全局变量 tmp 来记录每一层递归的路径，当然只要在本层修改路径，回溯时就一定要把路径还原，这样才能让
阅读更多2025-01-18
23- TIME-LLM: TIME SERIES FORECASTING BY REPRO- GRAMMING LARGE LANGUAGE MODELS
用LLM来解决时序预测问题，并且能够将时序数据映射（reprogramming）为NLP token，并且保持backbone的大模型是不变的。作为attention中的V和K，path embedd
阅读更多2025-01-18

LLM大语言模型的分类

**1. 基础语言模型：**

**2. 指令微调模型：**

**3. 多模态模型：**

**4. 领域专用模型：**

**5. 小型语言模型：**

**总结:**

相关文章

1. 基础语言模型：

2. 指令微调模型：

3. 多模态模型：

4. 领域专用模型：

5. 小型语言模型：

总结: