Google 正在测试 Omni 视频模型或将于 I/O 大会公布

Google 正在 Gemini 平台中测试代号 Omni 的视频生成模型。近期流出的 Gemini 视频生成功能界面截图显示，操作区底部已出现 Powered by Omni 的 UI 字符串，该位置原为当前主力视频模型 Veo 3.1 的展示位。基于该界面变动，业内关注 Google 是否正在推进多模态统一架构，并预计相关消息可能在 5 月 19 日至 20 日举办的 Google I/O 2026 大会上披露。

Omni 界面字符串暴露的产品过渡信号

根据外部社区截取的 Gemini 界面原图，Google 用户在前端交互中已可见 Omni 的命名。当前 Gemini 的视频生成流程仍由 Veo 3.1 驱动，图像生成则绑定 Nano Banana 2 与 Nano Banana Pro（后者基于 Gemini 3）。Omni 字符串直接出现在操作引导语 Start with an idea or try a template. Powered by Omni 中，而非隐藏的开发者配置项，表明其可能已具备公开命名属性，或正处于灰度测试阶段。

技术路线推测：独立视频模型还是多模态统一底层？

业内对 Omni 的定位存在三种主要判断。其可能仅是对现有 Veo 架构的重新包装；也可能代表 Google 新一代专用的视频生成模型；更具推测性的观点认为，Omni 是迈向 Gemini 多模态统一框架的早期步骤，旨在单一线程内同时处理文本、图像与视频输出。若第二种或第三种路径成立，Omni 将打破 Google 目前视频与图像生成赛道分离的现状。该判断属于基于界面布局的逻辑推演，具体技术实现仍需以官方白皮书或发布说明为准。

I/O 2026 发布窗口与市场竞争格局

Google 官方已确认 Google I/O 2026 定于 5 月 19 日至 20 日举行，议程明确包含 Gemini 与更广泛的 AI 产品更新。参照过往多模态模型的上路线索，Omni 或在该大会作为重要展示环节亮相。在时间窗口与竞品动态方面，字节跳动的 Seedance 2.0 近期已在多项视频生成评测中取得领先，Google 加速 Omni 相关测试的外部压力显著。若 Omni 正式推向市场，其性能基线将直接对标当前头部开源与闭源视频生成方案。

Google 内部代号 Omni 的视频生成能力仍处于高度推测阶段，当前所有外部观察均基于界面 UI 字符串与历史发布节奏。Omni 最终将以独立工具还是 Gemini 多模态基座形态公开，取决于 Google I/O 期间的产品叙事。对开发者与企业用户而言，需关注 Omni 是否开放 API 接口，以及多模态统一底层是否将降低跨模态工作流的集成成本。

Google 正在测试 Omni 视频模型或将于 I/O 大会公布

Omni 界面字符串暴露的产品过渡信号

技术路线推测：独立视频模型还是多模态统一底层？

I/O 2026 发布窗口与市场竞争格局

推荐阅读

Anthropic 被曝筹备 Claude Mythos 1,将集成至 Claude Code 与 Security

GPT-5.6 泄露：六月发布在即，iris-alpha 等三款变体曝光

OpenAI Codex 流量分配转向开源终端工具访问

Claude Mythos Preview 漏洞挖掘成果:Project Glasswing 首月发现逾万高危漏洞

评论 ···

Omni 界面字符串暴露的产品过渡信号

技术路线推测：独立视频模型还是多模态统一底层？

I/O 2026 发布窗口与市场竞争格局

分享

推荐阅读

评论 ···