阿里通义千问开源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

🕗 发布于 2024-09-20 05:40 人工智能

通义千问团队近日重磅宣布，继其Qwen2模型发布仅三个月后，再次推出Qwen家族的全新成员——Qwen2.5系列语言模型，并已全面开源。这次开源行动堪称史上规模之最，涵盖了通用型Qwen2.5，以及专为编程和数学领域打造的Qwen2.5-Coder与Qwen2.5-Math两大细分模型。

人工智能 - Ai工具集 - 未来办公人的智能办公生活导航网站!

AI-321工具集 | 专注全球AI工具推荐

据悉，Qwen2.5系列模型基于最新的大规模数据集进行了深度预训练，该数据集规模高达惊人的18T tokens。与上一代Qwen2相比，新模型在知识吸收、编程技巧以及数学解题能力上均实现了质的飞跃。值得一提的是，该模型能够处理超长文本，生成长度可达8K tokens的内容，同时依然兼容29种以上的语言。

值得一提的是，Qwen2.5系列模型的开源采用了宽松的Apache2.0许可证，并且提供了多个不同规模的版本，以满足各种实际应用场景的需求。更令人振奋的是，通义千问团队还同步开源了性能可与GPT-4相媲美的Qwen2-VL-72B模型。

在各项性能上，新模型取得了显著的进步。无论是指令执行、长文本生成，还是结构化数据的理解与输出方面，Qwen2.5都表现得更为出色。特别是在编程和数学这两个专业领域，经过专业数据集针对性训练的Qwen2.5-Coder和Qwen2.5-Math模型展现出了卓越的专业能力。

想要亲身体验Qwen2.5系列模型的强大实力吗？请点击：Qwen2.5合集！

原文地址：https://blog.csdn.net/AiBoxss/article/details/142369046

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Flutter局域网广播(UDP通信)与TCP通信
下一篇：SalescustomerController

阿里通义千问开源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

相关文章