当前位置：币须知道 > 精选主题 > 时事热门话题 > 正文

推理成本仅GPT-5.5二十分之一，Gemini 3.2实时模型现身谷歌云

2026-05-17 分类：时事热门话题阅读(38) 评论(0)

据动察 Beating 监测，谷歌云控制台的模型筛选列表中出现名为 gemini-3.2-flash-lite-live-preview 的基础模型选项。这是继本月初在 iOS 应用构建包和 AI Studio 暴露痕迹后，该系列模型在官方平台的再次曝光。

新选项带有 lite 与 live 后缀，表明谷歌正切分出针对极低延迟实时交互的特化版本。Abacus.AI 首席执行官 Bindu Reddy 此前透露，Gemini 3.2 Flash 的编码与推理能力达到 GPT-5.5 的 92%，但得益于蒸馏加稀疏化技术，推理成本仅为后者的二十分之一，多数查询延迟低于 200 毫秒。

随着云端接口提前抢跑，业内预计这一定位极致性价比的轻量模型将在 5 月 20 日的谷歌 I/O 大会上正式发布。

赞(0)

未经允许不得转载：币须知道 » 推理成本仅GPT-5.5二十分之一，Gemini 3.2实时模型现身谷歌云

相关推荐

评论抢沙发

回顶部