Google 发布 Gemini 3.5 Flash：面向智能体工作流与代码生成的前沿推理模型

Google 于 5 月 19 日发布 Gemini 3.5 Flash，定位前沿大模型与智能体工作流的双引擎。据 Google AI 官方博客披露，该模型在编码与长周期智能体任务上表现突出，输出速度约为其他前沿模型的 4 倍，并作为个人 AI 智能体 Gemini Spark 的默认底层架构。

3.5 Flash 基准测试与架构定位

据谷歌官测，Gemini 3.5 Flash 在 Terminal-Bench 2.1 上达到 76.2%，MCP Atlas 达到 83.6%，字符推理任务 CharXiv Reasoning 达到 84.2%。在代理类基准测试 GDPval-AA 中，其得分高达 1656 Elo。在输出速度维度上，其每秒生成 token 数约为其他主流前沿模型的 4 倍。该模型在 Artificial Analysis 指数中落入性能与速度的双高象限，证明延迟与质量不再需要妥协。

作为 Flash 系列的最新迭代，3.5 Flash 采用稠密架构设计，兼顾多模态理解与代码生成能力。与上一代 3.1 Pro 相比，其在复杂智能体编排与代码库维护等场景中实现了代际跨越。官方表示该模型已作为 Gemini App 和 Search AI Mode 的默认底层架构覆盖全球数十亿用户。

长周期工作流与自动化落地场景

长周期多步工作流是 3.5 Flash 的核心发力点。以往需要开发者数日或审计员数周完成的任务，该模型可在极短时间内迭代解决，且推理成本通常低于其他前沿模型的一半。结合新版 Antigravity harness，3.5 Flash 能够调度并协作多个子智能体，处理如非结构化资产动态归类、代码库长期维护等高频场景。

在可视化生成方面，3.5 Flash 继承了 Gemini 3 的多模态底层能力，支持生成更丰富的交互式 Web UI 与动态图表。开发者在 API Studio 中可直接调用该模型生成研究论文的交互式动画，大幅降低前端动效的制作门槛。企业合作方如 Shopify 已将其并行子智能体应用于商户增长预测，通过长周期数据处理提升分析精度。

Gemini Spark 个人智能体与生态部署

Gemini 3.5 Flash 将全面支撑个人 AI 智能体矩阵。新推出的 Gemini Spark 作为 24/7 在线的个人数字助手，依托该模型在后台持续运行，支持按计划自动执行文件处理、日程管理与跨应用指令。目前 Google 已启动受信任测试员的内测，并计划于 6 月初向美国地区的 Google AI Ultra 订阅用户开放 Beta 版。

在搜索体验层面，3.5 Flash 的代码生成能力直接赋能 Search 动态交互界面。模型可为查询生成即时交互式数据可视化面板与 24/7 信息跟踪代理，搜索逻辑从静态返回摘要转向实时交互式执行。该模型同时通过 Google Antigravity 平台、Gemini API、Android Studio 以及企业级 Agent Platform 面向开发者和商业客户开放部署。