Mistral 发布开源多模态模型 Pixtral Large，聊天助手 Le Chat 全面对标 ChatGPT

🕗 发布于 2024-11-21 03:34 chatgpt 人工智能 语言模型自然语言处理科技

在这里插入图片描述

今日凌晨，Mistral AI 发布了最新开源多模态模型 Pixtral Large，该模型基于 Mistral Large 2 构建，展示出强大的图像理解能力，能够理解文档、图表和自然图像，同时还保持了 Mistral Large 2 优秀的纯文本理解能力。

据介绍，该模型具有强大的多模态性能，在 MathVista、DocVQA、VQAv2 上达到了 SORA，能够在不影响文本性能的前提下对 Mistral Large 2 进行扩展并具有 123B 多模态解码器、1B 参数视觉编码器以及 128K 的上下文窗口。

同时，他们的 AI 聊天助手 le Chat 也新增了网页搜索、画布、文件理解和图像生成等功能。

进一步对标 ChatGPT

Mistral AI 已开始着力于人工智能交互界面的投入，首先他们对 le Chat 进行了一些重大更新。Le Chat 是 Mistral AI 推出的免费生成式人工智能办公助手。

以下是 le Chat（测试版）新能力的简要概述：

带引文的网页搜索
用于构思、在线编辑和导出的 Canvas
SOTA 文档和图像理解技术，由 Pixtral Large 提供支持
由 Black Forest Labs 的 Flux Pro 提供支持的图像生成功能
从模型到输出的全集成式服务
通过推测性编辑实现更快的响应

以下是 le Chat 与当今市场上领先的聊天和搜索助手的比较：

具体而言：

网页搜索

le Chat 的大部分用户来自学生和专业人士，他们将其用于学习、研究和工作。为了更好地促进这些用例，Mistral AI 通过互联网搜索增强了 le Chat 的训练知识。

Canvas 画布

Canvas 是一个新的界面，当用户需要超越对话并进行构思时，它会弹出到用户的 le Chat 窗口中。它使用户能够与 Mistral LLM 合作完成共享输出，从而实现知识工作的 0-1 创作和构思。

Canvas 不再局限于双向对话，借助 LLM 强大的推理能力，可以直接修改、编辑或转换内容。

用户可以使用 Canvas 创建文档、演示文稿、代码、模型……等等。可以就地修改其内容而无需重新生成响应、版本控制草稿并预览设计。Canvas 可以让任何团队发挥无限的创意。

快速准确的文档理解

Le Chat 现在可以处理大型、复杂的 PDF 文档和图像，进行分析和总结。只需将文档附加到聊天栏，即可了解所有内容——图形、表格、图表、文本、公式、方程式……基本上是整个文档。

这些功能是由新的 Pixtral Large 实现的，与实验模型结合使用比之前的视觉模型 Pixtral 12B 强大得多。

图像生成

Mistral AI 与 Black Forest Labs 合作，将后者领先的图像生成模型引入 le Chat。现在，用户可以直接在 le Chat 中生成高质量的图像。

智能体

如果用户会重复使用某些提示内容，或者已经确定了某些希望能实现自动化的创意工作模式，那么用户可以将这些工作流程编写成智能体（agents）。常见的应用场景包括为费用报销进行收据扫描、为冗长的会议纪要生成摘要，以及发票处理等。

这些智能体可以发布并分享给团队成员。用户可以反复进行构思，构建功能愈发强大的智能体，以帮助自己更高效地完成工作。

原文地址：https://blog.csdn.net/AMiner2006/article/details/143885079

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：SpringCloud详解
下一篇：[服务器] 腾讯云服务器免费体验，成功部署网站

论文阅读——Intrusion detection systems using longshort‑term memory (LSTM)
作者提出的 LSTM 模型能够有效区分正常网络流量和攻击流量。除此之外，模型结合主成分分析（PCA）和互信息作为降维方法。实验结果表明，基于 PCA 的模型（特别是使用2个主成分）在二分类和多分类任务
阅读更多2024-11-21
用源码编译虚幻引擎，并打包到安卓平台
本文详细介绍了如何用源码编译虚幻引擎，并将其打包到安卓平台。
阅读更多2024-11-21
Vue项目开发 element-UI 前端实现 1到10排列选择的按钮
在 Element UI 中，你可以通过来实现按钮的排列选择，例如让用户选择 1 到 10 之间的数字。为了实现这一功能，我们可以使用来动态生成 1 到 10 的按钮，并通过按钮点击事件来更新
阅读更多2024-11-21
Java EE 【知识改变命运】01计算机的一些知识点
计算机一些基础知识
阅读更多2024-11-21
04 —— Webpack打包CSS代码
加载器style-loader：把解析后的css代码插入到DOM。加载器css-loader ：解析css代码。直接引用，不用变量接收。
阅读更多2024-11-21
万能程序补丁工具 C# 源代码详解
万能程序补丁工具程序目的：搜索二进制可执行 EXE 或 DLL 文件分析的特征代码，替换特征代码，达到调试修正目标程序的功能。
阅读更多2024-11-21
【MySQL数据库】C#实现MySQL数据库最简单的查询和执行函数
C#和MySQL数据库是常见的数据交互，标准的查询和执行方法如下，做个记录。
阅读更多2024-11-21
单条推理转批量推理prompt
在每个线程中设置环境变量 CUDA_VISIBLE_DEVICES，以确保每个线程只使用指定的GPU。使用 concurrent.futures.ThreadPoolExecutor 来管理多线程任务
阅读更多2024-11-21
【AIGC】ChatGPT提示词Prompt解析：情感分析，分手后还可以做朋友吗？
【AIGC】在情感博弈中，最重要的是保持清醒的认知和优雅的态度。识别控制话术不是为了对抗，而是为了更好地保护自己的情感自由，实现真正的成长。
阅读更多2024-11-21
pycharm中配置pyqt5
PyQt和wxPython则提供了更多的控件和更强大的功能，适合于需要复杂用户界面的应用程序。pyQt生成的应用程序，引用图片通常是将资源文件装换为 python 文件，然后引用资源文件，而不能直接加
阅读更多2024-11-21

Mistral 发布开源多模态模型 Pixtral Large，聊天助手 Le Chat 全面对标 ChatGPT

最新基础模型 Pixtral Large

进一步对标 ChatGPT

相关文章