[240515] 谷歌发布多款大模型,支持200万 Token | 英伟达开发新 AI GPU | 苹果将 AI 转录引入多款应用
谷歌发布多模态 LLM - Gemini 1.5 Pro/Flash 支持200万 Token 上下文
谷歌 I/O 2024 大会上发布了 Gemini 1.5 Pro 和 Gemini 1.5 Flash,两款模型皆可支持 200万 Token上下文,都能处理视频,图片,音频,区别在于Flash更快,而 Pro 则生成质量更高,价格更高。
分类/型号 | Price $/MT | RPM | TPM | RPD |
---|---|---|---|---|
GPT-4o | 5/15 | |||
1.5-pro | 3.5/10.5 超128K 7/21 | 360 | 10M | 10K |
1.5-flash | 0.35/0.53 超128K 0.7/1.05 | 360 | 10M | 10K |
1.0-Pro | 0.5/1.5 | 360 | 0.12M | 30K |
1.5-pro/free | Free | 2 | 32K | 50 |
1.5-flash/free | Free | 15 | 1M | 1.5K |
1.0-Pro/free | Free | 15 | 32K | 1.5K |
上述参数 | 详细介绍 |
---|---|
Price | 单位为 美元/每百万 Token,5/15 则表示输入Token 价格为5美元/百万 Token,输出 Token 价格为 15美元/百万 Token 。 |
RPM | 每分钟请求限制 |
TPM | 每分钟 Token 限制 |
RPD | 每天请求限制 |
在上次日报当中,我们就发现谷歌的 7折 定价规律 – 同等产品是 OpenAI 的 7折。例如当 GPT-4 是 10/30 时,1.5 就是 7/21;而这次 1.5 Pro 的价格也刚好 是 GPT-4o 的 7 折。
从开发者角度,谷歌的服务确实价格更低,参数更好 – 不过实际效果,只能说是见仁见智了。
同时发布的还有 Gemma 27B 模型,这是一款给开发者提供的开源模型,采用与 Gemini 相同的架构。
值得注意是,Google Photos 将推出全新 Ask Photos功能,借助 Gemini 模型对照片和视频 进行模糊搜索。
详情:
题外话:
从本周开始,多模态模型渐渐变成主流了;而 x-cmd 会在本周发布新版,以跟上最近的模型更新 – Gemini 1.5 Pro 和 Gemini 1.5 Flash,以及昨天 GPT-4o。值得强调的是,免费版本的 API 调用数据将被谷歌用来于训练,切勿使用隐私数据测试。
英伟达正在开发新的 AI GPU
英伟达正在开发一系列以 AI 为重点的新款 GPU,代号为“Rubin”,它以天文学先驱维拉·鲁宾(Vera Rubin)的名字命名。
- R100 GPU 将于 2025 年第四季度投产, Rubin 是一款专注于 AI 的高端 GPU,而不是游戏 GPU。
- 据报道,它将使用台积电的 N3 节点构建并采用 HBM4 存储器,4 倍光罩设计和 Chip-On-Wafer-On-Substrate-L (CoWoS-L) 技术。
- 预计售价为 50,000 美元。
Apple 正在将 AI 转录引入语音备忘录
苹果公司希望今年在其设备上提供全系统范围内的实时音频转录和摘要
- 相关功能尚在测试,计划于 2024 年晚些时候在 iOS 18 的常用应用程序中发布。
- 语音备忘录是首批获得升级的应用程序之一
- 在 iOS 平台发布之后,也将很快在 macOS 15 和 iPadOS 18 上发布。
来源:Apple Is Bringing AI Transcription to Voice Memos, and I Can’t Wait
关注微信官方公众号 : oh my x
获取开源软件和 x-cmd 最新用法
原文地址:https://blog.csdn.net/edwinjhlee/article/details/138899125
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!