开源模型也能强过闭源？Llama 3.1-405B数值对标GPT4！

🕗 发布于 2024-07-25 04:39 开源 llama 人工智能 云计算

Llama 3.1-405B引起AI浪潮：开源模型也能强过闭源？

QQ截图20240724135832.png

Llama 3.1

就这几天，只要你有在关注AI相关的事，你就会看见一群人在讨论 Meta 新出的 Llama 3.1。外网无数的业内大佬都在为之疯狂，因为 Llama3.1-405B 成为了目前开源模型中性能最强的模型，甚至直逼闭源大模型。

了解Llama 3.1

Llama 3.1 405B 是第一个公开可用的模型，在通用知识、可操纵性、数学、工具使用和多语言翻译方面的最新能力方面可以与顶级 AI 模型相媲美。

8B 和 70B 模型的升级版本是多语言的，上下文长度明显更长，为 128K，使用最先进的工具，整体推理能力更强。这使 Meta 的最新模型能够支持高级用例，例如长格式文本摘要、多语言对话代理和编码助手。

Meta 还对其许可证进行了更改，允许开发人员使用 Llama 模型（包括 405B 模型）的输出来改进其他模型。

开源与闭源的战争

开源与闭源的战争也不是一两天了。闭源模型通常由大型科技公司或研究机构开发，这些数据的质量和数量可能比开源模型更高，从而使闭源模型在性能上更具优势。但这次 Llama3.1 也不惯着你，直接“重拳出击”，怒砸了15 万亿个 token 用来训练，表示开源的数据也不比闭源差。

QQ截图20240724141623.png

Llama官网数据对比图

QQ截图20240724141632.png

Llama官网数据对比图

从提供的基准测试数据来看的话，Llama 3.1 405B 基本所有的参数都超过了 GPT-4，与 GPT-4mini 也能打的又来有回。性能可以说是非常的恐怖。而8B的版本也是超过了其他同阶水平的模型，70B的版本更是甩开了GPT 3.5 Turbo 一截。

QQ截图20240724143138.png

Llama3.1 405B的对比情况

而Llama官方也说他们在150多个多语言基准数据集上进行了性能评测和人工测试。而测试的结果也表明了他们的模型是可以和 GPT-4、GPT-4o 和 Claude 3.5 Sonnet 去相比较的。

NVIDIA × Llaama 3.1

QQ截图20240724112732.png

NVIDIA × Llama 3.1

NVIDIA 今天宣布推出了 NVIDIA AI Foundry 服务和 NVIDIA NIM™ 推理微服务，通过 Llama 3.1 公开可用模型集合为全球企业增强生成式 AI 技术。

借助 NVIDIA AI Foundry，企业和国家现在可以使用 Llama 3.1 和 NVIDIA 软件、计算和专业知识为其特定领域的行业用例创建自定义“超级模型”。企业可以使用专有数据以及从 Llama 3.1 405B 和 NVIDIA Nemotron™ Reward 模型生成的合成数据来训练这些超级模型。

NVIDIA 创始人兼首席执行官黄仁勋表示：“Meta 公开提供的 Llama 3.1 模型标志着全球企业采用生成式 AI 的关键时刻。“Llama 3.1 为每个企业和行业打开了构建最先进的生成式 AI 应用程序的闸门。NVIDIA AI Foundry 已在整个过程中集成了 Llama 3.1，并已准备好帮助企业构建和部署定制的 Llama 超级模型。

圈内大佬的看法

QQ截图20240724102411.png

Llama 3.1 相关消息

QQ截图20240724102348.png

Llama 3.1 相关消息

现在 Llama 3.1 在外网可以说火的是一塌糊涂。今早打开 twitter 全是它的内容。如你所见，不少的大佬在自己的账号上都对 Llama 3.1 称赞不已。

QQ截图20240724143958.png

马克·扎克伯格探讨 Llama 3.1

而Meta的创始人兼CEO马克·扎克伯格更是亲笔撰写了一篇题为《Open Source AI Is the Path Forward》的文章。如果你对文章不感兴趣也可以直接搜到他所录制的视频，视频中也聊到了 Llama 3.1 的方方面面，很有意思。

就目前来看，Llama 3.1 的出现无疑给 AI 领域带来了新的冲击和思考。它证明了开源模型具备挑战闭源模型的实力，也让人们看到了开源模式在推动 AI 发展方面的巨大潜力。

有关厚德云

厚德云致力于为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用，就在厚德云。

原文地址：https://blog.csdn.net/holdcloud/article/details/140665375

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：学懂C语言（十六）：对C语言作用域规则局部变量、全局变量的认识
下一篇：vue3如何实现分面漏斗图

第9章综合案例————众成远程教育
制作“众成远程教育”网页，本章项目页面布局要求如下:页面要求有最外层的 div-al，第二层嵌套上中下3行区域，分别为div-top.div-main和 div-footer。而 div-main 又
阅读更多2024-11-17
Python3语法基础（全，带示例）
信息技术类，对口高考，Python，教师：施恒锋
阅读更多2024-11-17
【鸿蒙开发】第十四章 Web组件的使用、基本属性与事件
Web组件用于在应用程序中显示Web页面内容，为开发者提供页面加载、页面交互、页面调试等能力。页面加载：Web组件提供基础的前端页面加载的能力，包括：加载网络页面、本地页面、html格式文本数据。页面
阅读更多2024-11-17
python基础知识（五）——文件上传
python基础知识（五）——文件上传
阅读更多2024-11-17
如何在uniapp中获取和修改Web项目的Cookie
在uniapp开发Web项目时，操作Cookie是常见的需求。本文将介绍如何在uniapp中获取和修改Web项目的Cookie，且不设置过期时间。
阅读更多2024-11-17
时钟之Canvas+JS版
上一篇介绍使用CSS+JS方式实现，但元素泰国单一。此篇将以HTML5的canvas标签结合JS来实现。HTML代码JS代码//计时器//钟表半径//时针刻度宽度//分针刻度宽度//时针宽度//分针宽
阅读更多2024-11-17
AI测试的主要研究方向介绍
这个框架将支持对不同主题的基础测试数据集进行文本分词、图像标注、特征筛选等加工处理，为不同AI医疗产品提供定制化的测试数据，解决医学数据模块的通用性与特定测试数据集需求之间的冲突，确保测试数据集既具有
阅读更多2024-11-17
CSS盒子的定位＞（下篇）#固定定位#笔记
固定定位其实是绝对定位的子类别，一个设置了的元素是相对于视窗固定的，就算页面文档发生了滚动，它也会一直待在相同的地方。
阅读更多2024-11-17
doris udf -- 避免使用递归CTE
在部门表里有部门id (dept_id) 和父部门id (parent_id) ，父部门id同时也是部门id。现在要查部门id下所有的子部门id，但是不知道部门层级，部门关系可能也会调整。
阅读更多2024-11-17
前端知识点---this的用法 , this动态绑定(Javascript)
在JavaScript中，this 是一个非常重要但是呢也让人难搞明白的关键字。**它的值不是在编写代码时静态确定的，而是在代码运行时动态绑定的。**这非常重要下面讲一下它 .在全局作用域中（即不在
阅读更多2024-11-17