[240515] 谷歌发布多款大模型，支持200万 Token | 英伟达开发新 AI GPU | 苹果将 AI 转录引入多款应用

🕗 发布于 2024-05-15 15:38 人工智能 Google 大模型英伟达 GPU

谷歌发布多模态 LLM - Gemini 1.5 Pro/Flash 支持200万 Token 上下文

谷歌 I/O 2024 大会上发布了 Gemini 1.5 Pro 和 Gemini 1.5 Flash，两款模型皆可支持 200万 Token上下文，都能处理视频，图片，音频，区别在于Flash更快，而 Pro 则生成质量更高，价格更高。

分类/型号	Price $/MT	RPM	TPM	RPD
GPT-4o	5/15
1.5-pro	3.5/10.5 超128K 7/21	360	10M	10K
1.5-flash	0.35/0.53 超128K 0.7/1.05	360	10M	10K
1.0-Pro	0.5/1.5	360	0.12M	30K
1.5-pro/free	Free	2	32K	50
1.5-flash/free	Free	15	1M	1.5K
1.0-Pro/free	Free	15	32K	1.5K

上述参数	详细介绍
Price	单位为美元/每百万 Token，5/15 则表示输入Token 价格为5美元/百万 Token，输出 Token 价格为 15美元/百万 Token 。
RPM	每分钟请求限制
TPM	每分钟 Token 限制
RPD	每天请求限制

在上次日报当中，我们就发现谷歌的 7折定价规律 – 同等产品是 OpenAI 的 7折。例如当 GPT-4 是 10/30 时，1.5 就是 7/21；而这次 1.5 Pro 的价格也刚好是 GPT-4o 的 7 折。

从开发者角度，谷歌的服务确实价格更低，参数更好 – 不过实际效果，只能说是见仁见智了。

同时发布的还有 Gemma 27B 模型，这是一款给开发者提供的开源模型，采用与 Gemini 相同的架构。

值得注意是，Google Photos 将推出全新 Ask Photos功能，借助 Gemini 模型对照片和视频进行模糊搜索。

详情:

题外话:

从本周开始，多模态模型渐渐变成主流了；而 x-cmd 会在本周发布新版，以跟上最近的模型更新 – Gemini 1.5 Pro 和 Gemini 1.5 Flash，以及昨天 GPT-4o。值得强调的是，免费版本的 API 调用数据将被谷歌用来于训练，切勿使用隐私数据测试。

英伟达正在开发新的 AI GPU

英伟达正在开发一系列以 AI 为重点的新款 GPU，代号为“Rubin”，它以天文学先驱维拉·鲁宾（Vera Rubin）的名字命名。

R100 GPU 将于 2025 年第四季度投产, Rubin 是一款专注于 AI 的高端 GPU，而不是游戏 GPU。
据报道，它将使用台积电的 N3 节点构建并采用 HBM4 存储器，4 倍光罩设计和 Chip-On-Wafer-On-Substrate-L （CoWoS-L）技术。
预计售价为 50,000 美元。

来源：Move over Blackwell: Nvidia’s next-next gen GPU is reportedly codenamed Rubin, with a debut scheduled for late 2025

Apple 正在将 AI 转录引入语音备忘录

苹果公司希望今年在其设备上提供全系统范围内的实时音频转录和摘要

相关功能尚在测试，计划于 2024 年晚些时候在 iOS 18 的常用应用程序中发布。
语音备忘录是首批获得升级的应用程序之一
在 iOS 平台发布之后，也将很快在 macOS 15 和 iPadOS 18 上发布。

来源：Apple Is Bringing AI Transcription to Voice Memos, and I Can’t Wait

关注微信官方公众号 : oh my x

获取开源软件和 x-cmd 最新用法

原文地址：https://blog.csdn.net/edwinjhlee/article/details/138899125

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：学习Nginx（五）：虚拟主机配置
下一篇：炫富神器，简单无脑粘贴复制，闷声发财，当天见收益，无上限封顶

设计模式-工厂设计模式
4.无法解决多维度问题,比如同一个产品但是不同厂商,像是华为的手机和小米的手机,都是手机,但是要用工厂设计模式要写两个工厂类,目前还没问题,但是一旦产品多了起来,华为的有手机,笔记本,小米的有吹风机,
阅读更多2024-11-07
入门网络安全工程师要学习哪些内容
大家都知道网络安全行业很火，这个行业因为国家政策趋势正在大力发展，大有可为!但很多人对还是不了解，不知道需要学什么?知了堂小编总结出以下要点。是一个概称，学习的东西很多，具体学什么看自己以后的职业定位
阅读更多2024-11-07
WebSocket
找个网站测试下 websocket通信地址以ws://开头，我的springboot启动在8070端口，所以我的地址是。项目需要，要用到WebSocketConfig，网上找资料研究了下。最重要的注册
阅读更多2024-11-07
【学习笔记】SAP ABAP——OPEN SQL（一）【SELECT语句】
其中代表查询的件数，代表查询的字段名。
阅读更多2024-11-07
开源项目OpenVoice的本地部署
本文介绍开源项目OpenVoice的本地部署，基于VsCode和Anaconda(提供python虚拟环境)，来进行部署的。下述不介绍Anaconda的安装流程，要自行安装。且只截图演示关键部分图文演
阅读更多2024-11-07
下载安装COPT+如何在jupyter中使用（安装心得，windows，最新7.2版本）
自己快速下载、安装COPT的过程，从下载到安装到Anaconda自定义的环境中。
阅读更多2024-11-07
闪耀CeMAT亚洲物流展，驭势科技发布第五代U-Drive®智驾系统
11月5日，驭势科技于CeMAT首日，举行主题为 “驱动物流创新引擎，重塑产业新质生态”的新品发布会，正式发布第五代U-Drive®智能驾驶系统。来自各行业的生态伙伴及业内专家莅临现场，共同见证驭势科
阅读更多2024-11-07
后端SpringBoot及vue proxyTable解决跨域
昨天上线项目遇到了一个奇怪的问题，本来服务实在腾讯云的轻量应用服务器的，但是迁移到一个香港的服务器之后就出现了各种各样的问题。Nginx 开启Https Springboot开启Https，先后出现了
阅读更多2024-11-07
springboot 基于google 缓存，实现防重复提交
通过以上步骤，已经成功实现了一个基于Guava缓存的防重复提交功能。利用Guava缓存的高效性和简洁性，能够有效地防止短时间内的重复请求。你可以根据实际需求调整缓存的过期时间和生成唯一键的逻辑。推荐阅
阅读更多2024-11-07
好奇时刻 1.4.4 | 高颜值冷知识学习软件，小清新风格。
迅雷网盘：https://pan.xunlei.com/s/VOB3bPXFZ0np_O-KuWwYBJCdA1?百度网盘：https://pan.baidu.com/s/1WBbV40TizG0Ar
阅读更多2024-11-07

[240515] 谷歌发布多款大模型，支持200万 Token | 英伟达开发新 AI GPU | 苹果将 AI 转录引入多款应用

目录

谷歌发布多模态 LLM - Gemini 1.5 Pro/Flash 支持200万 Token 上下文

英伟达正在开发新的 AI GPU

Apple 正在将 AI 转录引入语音备忘录

相关文章