论文翻译：QWEN2 TECHNICAL REPORT

🕗 发布于 2024-10-10 21:32 人工智能

QWEN2 技术报告

文章目录

QWEN2 技术报告
摘要
目录
1 引言
2 分词器与模型
3 预训练
- 3.1 预训练数据
- 3.2 长上下文训练
4 后训练
5 评估
6 结论

摘要

本报告介绍了Qwen2系列，这是我们大型语言模型和大型多模态模型的最新成员。我们发布了一套全面的
基础和指令调优语言模型，涵盖了从0.5亿到720亿的参数范围，包括密集模型和专家混合模型。Qwen2超越了大多数以前的开放权重模型，包括其前身
Qwen1.5，并在语言理解、生成、多语种熟练度、编程、数学和推理等多样化基准上展现出与专有模型相竞争的性能。
旗舰模型，Qwen2-72B，展示了卓越的性能：在MMLU上得分84.2，在GPQA上得分37.9，在HumanEval上得分64.6，在GSM8K上得分89.5，在BBH上得分82.4，作为基础语言模型。指令调优变体，Qwen2-72B-Instruct，在MT-Bench上获得9.1，在Arena-Hard上获得48.1，在LiveCodeBench上获得35.7。此外，
Qwen2展示了强大的多语言能力，精通大约30种语言，涵盖英语、中文、西班牙语、法语、德语、阿拉伯语、俄语、韩语、日语、

原文地址：https://blog.csdn.net/WhiffeYF/article/details/142782539

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Linux操作系统——软件包的管理（实验报告）
下一篇：【大学学习-大学之路-回顾-电子&计算机相关专业-学习方案-自我学习-大二学生（2）】

ESNP静态路由进阶
前一篇文章说了一个简单的ESNP静态路由实验，那么后面给了一个进阶拓扑，规划了一个新的网段，我们来了解一下。
阅读更多2024-10-11
接口自动化测试实战
接口自动化测试是指通过编写程序来模拟用户的行为，对接口进行自动化测试。Python是一种流行的编程语言，它在接口自动化测试中得到了广泛应用。下面详细介绍Python接口自动化测试实战。
阅读更多2024-10-11
Java中二维数组-杨辉三角
2）每一行的第一个元素和最后一个元素都是1。1）第一行有1个元素，第n行有n个元素。使用二维数组打印一个10行杨辉三角。
阅读更多2024-10-11
【作业题】
⬆️round() 函数是 C 语言中的一个数学函数，属于 <math.h> 头文件round() 函数接受一个浮点数作为参数，返回最接近的整数值。如果这个浮点数的 decimal 部分等
阅读更多2024-10-11
10.9文件操作
1.逐行读取: getline();可以通过如上三种方式来写入文件。多个模式之间用" | "联合。4.二进制读取: read()3.按字符读取: get()2.按单词读取: >
阅读更多2024-10-11
解决UOS操作系统vim内容鼠标选中后进入可视模式，无法复制问题
解决UOS系统下 vim 单击右链不能粘贴问题
阅读更多2024-10-11
【华为】配置RIP协议
RIP（Routing Information Protocol）是一种内部网关协议（IGP），主要用于小型网络中的动态路由。RIP有两个主要版本：‌。通过这些区别，RIPv2在功能上比RIPv1更加
阅读更多2024-10-11
网络流量预测的学习——持续更新ing
另有一个使用R语言来处理网络流量的项目：https://github.com/rankinjl/internet-traffic-stats-project/blob/master/DataSetPr
阅读更多2024-10-11
poi通过在word中写入了表格，通过libreoffice转换成PDF后，word中刚才画的表格宽度无限拉伸问题的解决。
1、生成word：②失败的四、解决方案：设置一下样式，自己画的table放入如下方法五、效果：表格拉宽了。（居中代码就从其他地方抄一下吧，文章很多的）
阅读更多2024-10-11
多模态智能
深度学习从1.0的端到端走向2.0的预训练，通过大规模预训练来记忆多模态数据中共性知识，增强对下游任务的学习能力。深度学习1.0：特定任务有标注训练数据->随机初始化训练->最终模型深度学
阅读更多2024-10-11

论文翻译：QWEN2 TECHNICAL REPORT

QWEN2 技术报告

文章目录

摘要

相关文章