【AI资讯】7.19日凌晨OpenAI发布迷你AI模型GPT-4o mini

🕗 发布于 2024-07-19 13:02 人工智能

性价比最高的小模型

北京时间7月19日凌晨，美国OpenAI公司推出一款新的 AI 模型“GPT-4o mini”，即GPT-4o的更小参数量、简化版本。OpenAI表示，GPT-4o mini是目前功能最强大、性价比最高的小参数模型，性能逼近原版GPT-4，成本相比GPT-3.5 Turbo便宜60%以上，支持50种不同语言，替代GPT-3.5版本的ChatGPT。
在这里插入图片描述
GPT-4o mini 以其低成本和低延迟实现了广泛的任务，例如链式或并行化多个模型的调用（例如，调用多个 API）、将大量上下文传递给模型（例如，完整的代码库或对话历史记录）的应用程序，或通过快速、实时的文本响应与客户互动（例如，客户支持聊天机器人）。

目前，GPT-4o mini 在 API 中支持文本和视觉，未来还将支持文本、图像、视频和音频的输入和输出。该模型具有 128K 个 token 的上下文窗口，每个请求最多支持 16K 个输出 token，并且拥有截至 2023 年 10 月的知识。得益于与 GPT-4o 共享的改进的 tokenizer，处理非英语文本现在更具成本效益。

本文翻译自官网文章：https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

具有卓越文本智能和多模态推理能力的小模型

GPT-4o mini 在文本智能和多模态推理方面的学术基准测试中超越了 GPT-3.5 Turbo 和其他小型模型，并且支持的语言范围与 GPT-4o 相同。它还在函数调用方面表现出色，这可以使开发人员构建获取数据或使用外部系统采取行动的应用程序，并且与 GPT-3.5 Turbo 相比，它的长上下文性能有所提高。

GPT-4o mini 已经在几个关键基准上进行了评估。

推理任务： GPT-4o mini 在涉及文本和视觉的推理任务上优于其他小型模型，在文本智能和推理基准 MMLU 上的得分为 82.0%，而 Gemini Flash 为 77.9%，Claude Haiku 为 73.8%。

数学和编码能力： GPT-4o mini 在数学推理和编码任务中表现出色，优于市场上之前的小型模型。在测量数学推理的 MGSM 上，GPT-4o mini 得分为 87.0%，而 Gemini Flash 得分为 75.5%，Claude Haiku 得分为 71.7%。在测量编码性能的 HumanEval 上，GPT-4o mini 得分为 87.2%，而 Gemini Flash 得分为 71.5%，Claude Haiku 得分为 75.9%。

多模态推理： GPT-4o mini 在多模态推理评估 MMMU 上也表现出色，得分为 59.4%，而 Gemini Flash 为 56.1%，Claude Haiku 为 50.2%。
在这里插入图片描述

内置安全措施

安全性从一开始就融入到我们的模型中，并在开发过程的每一步中得到强化。在预训练中，我们会过滤掉我们不希望模型学习或输出的信息，例如仇恨言论、成人内容、主要汇总个人信息的网站和垃圾邮件。在训练后，我们使用强化学习和人工反馈 (RLHF)等技术将模型的行为与我们的策略保持一致，以提高模型响应的准确性和可靠性。

GPT-4o mini 内置了与GPT-4o相同的安全缓解措施，我们根据我们的准备框架并按照我们的自愿承诺，使用自动和人工评估对其进行了仔细评估。超过 70 位来自社会心理学和错误信息等领域的外部专家对 GPT-4o 进行了测试，以识别潜在风险，我们已经解决了这些风险，并计划在即将发布的 GPT-4o 系统卡和准备记分卡中分享详细信息。这些专家评估的见解有助于提高 GPT-4o 和 GPT-4o mini 的安全性。

基于这些经验，我们的团队还致力于利用我们研究得出的新技术来提高 GPT-4o mini 的安全性。API 中的 GPT-4o mini 是第一个应用我们的指令层次结构的模型（在新窗口中打开）方法，有助于提高模型抵抗越狱、即时注入和系统即时提取的能力。这使得模型的响应更加可靠，并有助于使其在大规模应用中更安全地使用。

我们将继续监控 GPT-4o mini 的使用情况，并在发现新的风险时提高模型的安全性。

可用性和价格

GPT-4o mini 现已作为文本和视觉模型在 Assistants API、Chat Completions API 和 Batch API 中提供。开发人员每 100 万个输入token支付 15 美分，每 100 万个输出token支付 60 美分（大约相当于标准书籍的 2500 页）。我们计划在未来几天推出 GPT-4o mini 的微调。

在 ChatGPT 中，免费版、Plus 版和团队版用户从今天开始将能够使用 GPT-4o mini，以替代 GPT-3.5。企业用户也将从下周开始使用，这符合我们让所有人都能享受 AI 好处的使命。

下一步是什么

过去几年，我们见证了人工智能的显著进步和成本的大幅降低。例如，自 2022 年推出功能较弱的模型 text-davinci-003 以来，GPT-4o mini 的每代币成本已下降 99%。我们致力于继续沿着这条降低成本、同时增强模型能力的轨迹前进。

我们设想的未来是模型可以无缝集成到每个应用程序和每个网站上。GPT-4o mini 为开发人员铺平了道路，使他们能够更高效、更经济地构建和扩展强大的 AI 应用程序。AI 的未来将变得更加易于访问、可靠，并嵌入到我们的日常数字体验中，我们很高兴能够继续引领潮流。

原文地址：https://blog.csdn.net/Kingsea442/article/details/140542028

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：职升网：环评工程师考试的难度有多高？
下一篇：【Linux】线程控制

[产品管理-85]：《产品经理从入门到精通》- 创业公司的产品经理
目录一、概述1、创业公司产品经理的角色与定位2、创业公司产品经理的核心能力3、创业公司产品经理的实战技巧4、创业公司产品经理的挑战与应对策略二、创业公司的产品经理与大公司产品经理的比较1、工作环境与资
阅读更多2024-11-18
《TCP/IP网络编程》学习笔记 | Chapter 13：多种 I/O 函数
《TCP/IP网络编程》学习笔记 | Chapter 13：多种 I/O 函数
阅读更多2024-11-18
解决IntelliJ IDEA的Plugins无法访问Marketplace去下载插件
勾选并填入代理URL，可以先做检查连接：
阅读更多2024-11-18
STM32读写内部FLASH
本文是学习野火的指南针开发板过程的学习笔记，可能有误，详细请看B站野火官方配套视频教程（这个教程真的讲的很详细，请给官方三连吧）在STM32芯片内部有一个FLASH存储器，它主要用于存储代码，我们在电
阅读更多2024-11-18
【STM32】基于SPI协议读写SD，详解！
因为项目需要，使用stm32读写sd卡，这一块网上的资料很多，但是比较杂乱。有些是不能跑，有些是代码可以跑，但是相关的注释或者配置方法、流程不够清晰明确，于是花了几天时间，研究了几个成功案例之后，总结
阅读更多2024-11-18
Java基础（9）本地API
哈喽大家好啊，Java基础的学习马上就要告一段落了，今儿分享的是一些Java常用的本地API，让我们开始吧。
阅读更多2024-11-18
Spring gateway 路由配置在数据库
#spring gateway ServerRoute实体类。##spring gateway 查询动态路由mapper。##Spring gateway 动态路由Service。##spring g
阅读更多2024-11-18
i春秋-FUZZ（python模板注入、base64编码命令执行）
i春秋-FUZZ（python模板注入、base64编码命令执行）
阅读更多2024-11-18
Spring 4.3 源码导读
Spring 4 是一个功能强大的 Java 应用程序框架，广泛用于企业级应用开发。理解其核心代码有助于开发者更好地使用和优化 Spring 框架。
阅读更多2024-11-18
【Rabbitmq篇】RabbitMQ⾼级特性----消息确认
介绍RabbitMQ⾼级特性----消息确认
阅读更多2024-11-18