人工智能_大模型060_多模态大语言模型08_LLaVA多模态大模型训练_第二阶段语言模型微调_模型部署_LLaVA模型评测---人工智能工作笔记0195

🕗 发布于 2024-05-15 19:21 人工智能 LLaVA多模态模型训练多模态第二阶段训练多模态语言模型训练 LLaVA多模态模型评测

上一节我们第一阶段,训练特征映射层,对应的训练脚本,已经提供,指定训练数据集以后,

直接用一张或者8张A100 一张80G显存去跑就可以了.

然后第二阶段就是对大语言模型进行微调,这里需要两类数据,对话数据的两类,一类是:

常规对话数据:

之前我们生成的,第二类是:

第二类是复杂推理类对话数据,可以看到,包含了图片中物体的位置信息数据.

LLaVA是一种结合了文本和图像数据的多模态预训练模型。它基于大型语言模型和视觉模型，通过多模态融合技术将这两种模型的信息进行整合，从而能够处理和理解多种不同类型的数据。
LLaVA模型的主要特点包括：
1. 多模态输入：LLaVA模型可以同时接收文本和图像输入，这使得它能够更好地理解和处理多模态数据。
2. 预训练任务：LLaVA模型在预训练阶段使用了大量的文本和图像数据进行训练，以学习如何将这两种不同类型的数据进行有效融合。
3. 多模态融合：LLaVA模型采用了多模态融合技术，如注意力机制和多层感知器，将文本和图像的特征进行整合，从而能够生成更加丰富和全面的理解。
4. 应用广泛：由于LLaVA模型能够处理和理解多模态数据，它在许多领域都有广泛的应用，如图像描述生成、视觉问答、多模态对话等。
总的来说，LLaVA模型是一种强大的多模态

原文地址：https://blog.csdn.net/lidew521/article/details/138713969

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：智能BI（后端）-- 系统优化（安全性，数据存储，限流）
下一篇：010.理解异步性

【JavaScript】JavaScript开篇基础（2）
在 JavaScript 中，函数是头等公民，这意味着函数可以像其他数据类型一样被处理。函数可以作为其他函数的返回值、参数，甚至可以在函数内部定义。
阅读更多2024-10-12
论文 | Context-faithful Prompting for Large Language Models
这篇文章通过实验证明了基于意见的提示和反事实演示可以有效提高 LLM 在特定语境下的忠诚度。这些方法可以帮助 LLM 更准确地理解上下文信息，并提供更可靠和更可信的答案。这篇文章主要探讨了如何提高大型
阅读更多2024-10-12
c++ emplace
emplace系列函数通过在容器内原地构造对象来提高性能，特别是当对象的构造和复制代价较高时。相比于push_back和insertemplace更加高效，因为它避免了临时对象的构造、复制或移动。常见
阅读更多2024-10-12
Python列表操作详解
《Python 列表操作详解》文档深入全面地介绍了 Python 中列表这一重要数据结构的各种操作方法。内容涵盖了列表的创建、访问元素、添加和删除元素、列表切片、排序、反转等核心操作。通过详细的代码示
阅读更多2024-10-12
HarmonyOS NEXT应用元服务开发标注屏幕朗读内容的场景
控件包含显示文本（text）、无障碍文本（accessibilityText）2个属性，其中，显示文本为用户界面上呈现的信息，无障碍文本为无障碍专有的朗读信息，不在界面上显示。屏幕朗读提取信息进行朗读
阅读更多2024-10-12
Nginx常见问题
什么是Nginx？Nginx是一个轻量级/高性能的反向代理Web服务器，他实现非常高效的反向代理、负载平衡，他可以处理2-3万并发连接数，官方监测能支持5万并发，现在中国使用nginx网站用户有很多
阅读更多2024-10-12
git pull
git pll
阅读更多2024-10-12
第十一章 RabbitMQ之消费者确认机制
消费者确认机制（Consumer Acknowledgement）是为了确认消费者是否成功处理消息。当消费者处理消息结束后，应该向RabbitMQ发送一个回执，告知RabbitMQ自己消息处理状态：a
阅读更多2024-10-12
echarts多折线按组分类控制显示隐藏
需求：目前有俩个组数组分别为sss和aaa，sss和aaa有4个属性，分别为温度、湿度、气压和ppm，根据不同的属性每组画出4条折现，结果应该为8条折现，每条折现颜色不一致，名称也不一致，时间也不一致
阅读更多2024-10-12
vue项目子组件在打开时调用父组件传过来的props里的数据
vue项目子组件在打开时调用父组件传过来的props里的数据
阅读更多2024-10-12

人工智能_大模型060_多模态大语言模型08_LLaVA多模态大模型训练_第二阶段语言模型微调_模型部署_LLaVA模型评测---人工智能工作笔记0195

相关文章