大语言模型通用能力排行榜（2024年10月8日更新)

🕗 发布于 2024-11-17 09:21 语言模型 人工智能 自然语言处理

榜单数据为通用能力排行榜

排名	模型名称	机构	总分	理科	文科	Hard	使用方式	发布日期
-	o1-preview	OpenAI	75.85	86.07	76.6	64.89	API	2024年11月8日
-	Claude 3.5 Sonnet（20241022）	Anthropic	70.88	82.48	76.56	53.6	POE	2024年11月8日
-	ChatGPT-4o-latest	OpenAI	70.85	84.65	77.1	50.8	API	2024年11月8日
🏅	GLM-4-Plus	智谱AI	69.64	81.41	76.44	51.08	API	2024年11月8日
🏅	SenseChat 5.5	商汤	69	81.17	76.67	49.16	API	2024年11月8日
🏅	AndesGPT-2.0	OPPO	68.91	81.46	76.61	48.64	API	2024年11月8日
🏅	Qwen2.5-72B-Instruct	阿里巴巴	68.9	83.12	76.96	46.64	API	2024年11月8日
-	Claude 3.5 Sonnet（20240620）	Anthropic	68.23	81.68	76.54	46.48	poe	2024年11月8日
-	Gemini-1.5-Pro-002	Google	68.19	80.42	76.32	47.82	API	2024年11月8日
-	Qwen-max-0919	阿里巴巴	68	83.03	76.5	44.48	API	2024年11月8日
-	GPT-4-Turbo-2024-04-09	OpenAI	67.48	80.78	74.85	46.82	API	2024年11月8日
🥈	Hunyuan-Turbo	腾讯	67.35	81.47	76.84	43.74	API	2024年11月8日
🥈	360gpt2-pro	360	67.19	82.95	74.94	43.68	API	2024年11月8日
🥈	Step-2-16k	阶跃星辰	67.02	80.52	76.65	43.91	API	2024年11月8日
🥈	DeepSeek-V2.5	深度求索	66.87	81.69	75.42	43.5	API	2024年11月8日
🥈	Doubao-pro-0828	字节跳动	66.43	79.98	75.1	44.22	API	2024年11月8日
🥉	Baichuan4	百川智能	66.28	81.81	75.94	41.1	API	2024年11月8日
🥉	山海大模型4.0	云知声	66.26	80.05	75.38	43.34	API	2024年11月8日
🥉	TeleChat2-Large	TeleAI	66.23	78.85	75.54	44.28	API	2024年11月8日
-	Llama-3.1-405B-Instruct	Meta	65.84	80.54	71.53	45.46	API	2024年11月8日
4	Ernie-4.0-turbo-8k-preview	百度	64.93	78.69	74.4	41.7	API	2024年11月8日
-	GPT-4o-mini	OpenAI	64.85	79.84	73.24	41.46	API	2024年11月8日
4	Moonshot(kimi)	月之暗面	63.93	74.37	75.08	42.34	网页	2024年11月8日
5	Sky-Chat-3.0	昆仑万维	62.64	74.32	75.46	38.12	API	2024年11月8日
5	TeleChat2-35B	TeleAI	62.46	74.07	74.05	39.26	模型	2024年11月8日
-	Llama-3.1-70B-Instruct	Meta	61.62	77.52	69.64	37.7	API	2024年11月8日
6	Qwen2.5-7B-Instruct	阿里巴巴	60.61	74.62	73.28	33.92	API	2024年11月8日
-	Llama-3.2-90B-Instruct	Meta	60.58	75.89	69	36.84	API	2024年11月8日
7	讯飞星火V4.0	科大讯飞	59.4	72.49	71.55	34.16	API	2024年11月8日
8	GLM-4-9B-Chat	智谱AI	56.83	69.22	71.94	29.32	模型	2024年11月8日
-	Gemma-2-9b-it	Google	55.48	67.78	69.62	29.02	模型	2024年11月8日
9	MiniCPM3-4B	面壁智能	53.16	63.04	69.87	26.56	模型	2024年11月8日
-	Llama-3.1-8B-Instruct	Meta	51.42	63.27	65.3	25.69	API	2024年11月8日
10	Yi-1.5-9B-Chat-16K	零一万物	51.37	59.2	67.86	27.06	模型	2024年11月8日
-	Llama-3.2-11B-Instruct	Meta	50.61	63.1	64.02	24.72	API	2024年11月8日
11	Yi-1.5-6B-Chat	零一万物	48.69	57.03	63.89	25.16	模型	2024年11月8日
12	Qwen2.5-1.5B-Instruct	阿里巴巴	43.92	46.14	64.54	21.1	API	2024年11月8日
-	Gemma-2-2b-it	Google	42.25	43.36	63.72	19.67	模型	2024年11月8日
-	Phi-3-Mini-4K-Instruct	微软	39.98	52.28	44.75	22.9	模型	2024年11月8日
-	Mistral-7B-Instruct-v0.3	Mistral AI	37.11	41.06	51.21	19.05	模型	2024年11月8日
13	Baichuan2-7B-Chat	百川智能	33.59	28.46	58.09	14.22	模型	2024年11月8日
13	Qwen2.5-0.5B-Instruct	阿里巴巴	32.85	30.53	54.13	13.9	API	2024年11月8日
13	RWKV-6-World-7B	RWKV	32.76	27.46	58.05	12.76	模型	2024年11月8日

原文地址：https://blog.csdn.net/i826056899/article/details/143814186

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

Windows电脑本地部署llamafile并接入Qwen大语言模型远程AI对话实战
Windows电脑本地部署llamafile并接入Qwen大语言模型远程AI对话实战
阅读更多2024-11-23
解决vm虚拟机中ctrl键粘滞问题（一直处于按下状态）
虚拟机中点击鼠标左键没有问题，单独按下键盘也没有问题，但是如果按下键盘的同时在按下鼠标左键就会卡住。而且100%稳定复现。发现问题原因：vm版本的问题，我的版本是17.5.0，升级成17.5.2 bu
阅读更多2024-11-23
第十章 JavaScript的应用
10.1.1 JavaScript简介1 简单性JavaScript 设计之初就考虑到了非专业程序员的使用，因此它的语法相对简单，容易上手。2 动态性JavaScript 是一种解释型语言，代码可以在
阅读更多2024-11-23
非root用户安装CUDA
4.下载完成后执行.run文件，需要添加两个参数，一个是--override，用于跳过某些检查或限制；另一个是--toolkitpath，它表示安装路径，必须是自己目录下面的路径，如果是根目录就会安装
阅读更多2024-11-23
Python操作neo4j库py2neo使用之py2neo 删除及事务相关操作（三）
【代码】## Python操作neo4j库py2neo使用之py2neo 删除及事务相关操作（三）
阅读更多2024-11-23
【通俗理解】Jensen不等式与变分分布q(z)在积分计算中的应用
Jensen不等式 #变分分布 #积分计算 #期望 #凸函数 #优化问题 #下界估计 #机器学习。
阅读更多2024-11-23
「Mac玩转仓颉内测版27」基础篇7 - 字符串类型详解
本篇将介绍 Cangjie 中的字符串类型，包括字符串的定义、字面量形式、插值表达、常用操作及应用场景，帮助开发者熟练掌握字符串的使用。
阅读更多2024-11-23
数据科学与SQL：组距分组分析 | 区间分布问题
绝对值分布分析也可以理解为组距分组分析。对于某个指标而言，一个记录对应的指标值的绝对值，肯定落在所有指标值的绝对值的最小值和最大值构成的区间内，根据一定的算法，在把这个区间划分为等距离的几个小区间，，
阅读更多2024-11-23
c++编译报C1004错误的原因及解决办法
可能是你的代码文件最后没有正确的结束符，或者是缺少了一些必要的头文件或语句。默认磁盘驱动器没有足够的空间用于临时文件，需要大约两倍于源文件的空间。编译器到达了源文件尾但未解析构造。计算结果为假的 #i
阅读更多2024-11-23
mysql 去重补全取出重复变量函数和存储过程
mysql 去重补全取出重复变量函数和存储过程
阅读更多2024-11-23

大语言模型通用能力排行榜（2024年10月8日更新)

相关文章