5 月 20 日,Google DeepMind 今日正式发布新一代模型系列 Gemini 3.5,并率先推出 Gemini 3.5 Flash。官方称,该模型将「前沿智能」与「行动力」结合,重点面向 AI 智能体(Agent)与编程场景,可处理复杂、长周期任务。
Gemini 3.5 Flash 已向全球用户开放,可通过 Gemini App、Google 搜索 AI Mode、Google AI Studio、Android Studio 以及企业平台 Gemini Enterprise 使用。Google 同时透露,Gemini 3.5 Pro 已在内部部署,预计下月正式推出。
根据 Google 公布的数据,Gemini 3.5 Flash 在 Terminal-Bench 2.1、GDPval-AA、MCP Atlas 等智能体与编程基准测试中,表现超过 Gemini 3.1 Pro,并在多模态理解测试 CharXiv Reasoning 中达到 84.2%。Google 表示,其输出速度相比其他前沿模型快 4 倍。
Google 强调,3.5 Flash 的核心能力在于「长周期智能体任务」,包括自动规划、多步骤执行、调用工具以及部署多个协作子智能体。官方称,过去需要数天甚至数周完成的开发、审计或财务流程,如今可在更短时间内完成,且成本通常不到其他前沿模型的一半。
在商业落地方面,Shopify、Salesforce、麦格理银行、Ramp、Databricks、Xero 等企业已开始测试或部署 Gemini 3.5 Flash。
Google 还公布了基于 Gemini 3.5 Flash 构建的全新个人 AI 智能体「Gemini Spark」。官方称,该产品可全天候协助用户处理数字事务,并在用户授权下主动执行任务。目前 Gemini Spark 已向部分测试用户开放,并计划下周面向美国 Google AI Ultra 订阅用户推出 Beta 版本。
此外,Gemini 3.5 Flash 现已成为 Gemini App 与 Google 搜索 AI Mode 的默认模型,并支持生成更加动态、交互式的 Web UI 界面。
币须知道