不看后悔！国内AI大比拼的精彩看点全汇总

🕗 发布于 2024-07-04 18:29 人工智能 文心一言通义千问豆包 deepseek

至2022年AI爆发后，在中国已催生了上千个AI产品。

这些产品涵盖了从头部大厂到高等院校，再到初创企业的广泛阵容。

如：

大厂：百度文心、阿里通义、腾讯元宝、字节豆包、讯飞星火等
高校：清华大学、北京大学等
初创：月之暗面KIMI、深度求索DeepSeek也已崭露头角，推出了独具特色的AI产品。

到这里有个问题就浮现了，应该选择哪个AI，哪个AI适合自己？

这里是清华SuperBench的测评数据

类似这样的测评报告互联网上已经很多，真正哪个合适自己还是自己尝试一下

以下是个人的一些经验分享让大家少走些路，仅供参考一下：

目前在国际上顶端的还是gpt4与claude 3，国内主要就是文心4与清华GLM-4。

在国内选择的话：

如果花钱的话，可以选择文心一言4.0
免费AI

- 考虑到综合能力的话可以选择字节的豆包
- 只考虑文本类的话deepseek也是不错的选择
- 偏搜索引擎类的话秘塔AI、KIMI

前期文心一言3.5的表现的确是很差，可以对比自己之前问的问题，差别是非常大的。之前胡说八道的回答还是比较多的，现在比如增加了联网搜索等功能，可以说文心一言已经迭代级了很多。

这里我选择其中的5个AI产品进行对比

一、信息更新程度

在信息更新程度来说通义千问与豆包的表现非常好，当然这个测试还是比较片面的，大家可以在遇到其它时效性问题时也进行对比一下。

以下是具体的对比情况：

问题一

2024年福建高考录取分数线?

此问题是在2024年06月24日16时26分公布的，问题是在公布后5分钟左右内问的

目前国内关注性最高的应该就是高考分数线公布与填写高考志愿了。目前已经有几个省公布了高考分数线，刚才看了一下最近2024年06月24日16时26分福建省也公布了分数线，这是福建省教育考试院官方网截图。

我们来看看几款国内的AI产品的信息更新情况：

1）文心一言3.5&4.0

文心一言3.5

物理类431分，是不对的。

历史类453分，也是不对的，可以看到括号里的说明，它已经找到了正确的文章2分数是正确的，还找到文章3是错误的分数，然而最后AI判断后选择了错误的文章3的结果。

文心一言4.0

文心一言4.0能给出正确的答案，实时度非常的高。

2）通义千问

通义千问输出的结果是对的，不但输出的2024年正确的结果，同时还给出了历年的分数线数据。

3）KIMI

KIMI没有查询到福建省的高考录取分数线。

4）豆包

豆包也能正确的输出答案，同时也给出了近几年的录取分数线。

5）DeepSeek

显然deepseek的知识库和以上的几款AI是不同的，它不是实时的它是截至2023年的知识库。

问题二

2024年上海高考录取分数线?

此问题是在2024年06月23日13时42分公布的，问题是在公布后1天后问的

看看上海的分数线，公布的比较早是2024年06月23日13时42分公布的，这是上海市教育考试院官方网截图。

只要是知识库是实时的，基本是对的

二、图片解析能力

通过一张网络上流传的比较广的一张图

这张“不干了”的图片，看看AI们是如何解析它的
1）文心一言3.5
文心一言3.5支持上传word、pdf及图片格式的文件，上传图片后它可以解析出图片中木板上刻着“不幹了”字样，但无法给不出图片中描述的是哪些历史人物。

2）文心一言4.0
文心一言4.0也可以识别出木板上的文字，同时进了一步就是把繁体“不幹了”翻译成简体“不干了”。同样也无法给不出图片中描述的是哪些历史人物。

3）通义千问

识别出来的是“不辩了”，识别能力还是不行

4）KIMI

KIMI支持上传pdf、doc、xlsx、ppt、txt、图片等文件，没有识别出木板上的文字

5）豆包

豆包支持的文件类型：PDF、Docx、xlsx、txt、pptx、csv。所以我把图片放到docx里再上传给豆包。它可以识别出木板上的文字

6）Copilot
看完这些后或许得到的结论就是AI只能识别出木板上的文字，推理不出描述的是哪位历史人物，我们来看看微软的Copilot的回答。鲁迅终于出现了。。。。

三、图像生成功能

生成以下要求的图片：
中国古代女子，女子有几缕青丝垂于耳畔，头上插着一支玉簪，簪头镶嵌着一颗小巧的珍珠，闪烁着温润的光泽。
1）文心一言3.5

2）文心一言4.0

3）通义千问

4）豆包

生成图片方面个人感觉还是豆包比较符合审美风格

小结

以上都是一些非专业的对比，只是基于个人的使用体验。当然也有一些机构输出也专业的测试报告。

比如：这份《中文大模型能力评测榜单》综合能力得分为分类能力、信息抽取能力、阅读理解能力、数据分析能力四者得分的平均值。

其实可以看到不同机构输出的报告都有所不同，最终怎么样我们可以自己试试。

https://www.zhihu.com/question/658607807/answer/3549831881

原文地址：https://blog.csdn.net/citywu123/article/details/140180741

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：判断是否为平衡二叉树-二叉树题型
下一篇：Android中使用Viewbind的activity基类

利用AI制作《职业生涯规划PPT》，10分钟完成
职业生涯规划是大学生活中非常重要的一环。通过制定职业规划，你能够明确未来的职业目标、认清自身的优劣势，进而制定切实可行的计划，以便顺利踏上职业发展的道路。而制作一份精美的职业生涯规划PPT，能有效帮助
阅读更多2024-11-12
MySQL 常见时间字段设置
MySQL 提供了多种时间字段类型，以适应不同的业务需求。了解并掌握这些字段的特性和适用场景，对于设计稳健的数据库结构至关重要。
阅读更多2024-11-12
android studio 配置过程
Android studio版本：Android Studio Ladybug | 2024.2.1。
阅读更多2024-11-12
【划分型DP-最优划分】力扣2767. 将字符串分割为最少的美丽子字符串
最重要的是回溯的思路，我们定义dfs(i)的含义是从第i个字符后的字符串被分割成最少的美丽子字符串的个数，所以我们可以思考，我们从第0个字符开始，举个例子，如果找到了一个5的二进制表示101，那么也就
阅读更多2024-11-12
Apache ECharts
Apache ECharts（简称ECharts）是一款功能强大的基于JS的数据可视化图表库，它是由百度前端团队开发和维护的开源可视化库。兼容性强，底层依赖矢量图形库ZRender，提供直观，交互丰富
阅读更多2024-11-12
工位管理优化：Spring Boot企业级系统
目前，界面设计已经成为对软件质量进行评价的一条关键指标，一个好的用户界面可以使用户使用系统的信心和兴趣增加，从而使工作效率提高，Spring Boot 框架是将JAVA语言作为脚本语言的，JSP网页给
阅读更多2024-11-12
Python学习从0到1 day27 Python 高阶技巧 ③ 设计模式 — 单例模式
设计模式是一种编程套路，可以极大的方便程序的开发最常见、最经典的设计模式，就是我们所学习的面向对象了。除了面向对象外,在编程中也有很多既定的套路可以方便开发,我们称之为设计模式：单例、工厂模式建造者、
阅读更多2024-11-12
Java将Boolean转为Json对象的方法
在Java中，将`boolean`值转换为JSON对象通常涉及使用JSON库，例如`org.json`或`Gson`。本文将使用`org.json`库来进行详细演示。这个库提供了简单且直观的方法来创建
阅读更多2024-11-12
STM32获取SHT3X温湿度芯片数据
SHT3X是Sensirion公司推出的一款高精度、完全校准的温湿度传感器，基于CMOSens技术。它提供了线性化、温度补偿的数字输出，具有宽电源电压范围、高速I2C接口以及可选的地址设置等特点。高精
阅读更多2024-11-12
Kafka高频面试题详解
topic是一种逻辑概念，partition是一种物理概念，每个partition对应一个log文件，存储的是producer生产的数据， producer产生的数据会不断追加到文件末端，为了防止文件
阅读更多2024-11-12