Google 正在 Gemini 平台中测试代号 Omni 的视频生成模型。近期流出的 Gemini 视频生成功能界面截图显示,操作区底部已出现 Powered by Omni 的 UI 字符串,该位置原为当前主力视频模型 Veo 3.1 的展示位。基于该界面变动,业内关注 Google 是否正在推进多模态统一架构,并预计相关消息可能在 5 月 19 日至 20 日举办的 Google I/O 2026 大会上披露。

Gemini 视频生成功能界面中疑似 Google Omni 模型测试标识截图

Omni 界面字符串暴露的产品过渡信号

根据 外部社区截取的 Gemini 界面原图,Google 用户在前端交互中已可见 Omni 的命名。当前 Gemini 的视频生成流程仍由 Veo 3.1 驱动,图像生成则绑定 Nano Banana 2 与 Nano Banana Pro(后者基于 Gemini 3)。Omni 字符串直接出现在操作引导语 Start with an idea or try a template. Powered by Omni 中,而非隐藏的开发者配置项,表明其可能已具备公开命名属性,或正处于灰度测试阶段。

技术路线推测:独立视频模型还是多模态统一底层?

业内对 Omni 的定位存在三种主要判断。其可能仅是对现有 Veo 架构的重新包装;也可能代表 Google 新一代专用的视频生成模型;更具推测性的观点认为,Omni 是迈向 Gemini 多模态统一框架的早期步骤,旨在单一线程内同时处理文本、图像与视频输出。若第二种或第三种路径成立,Omni 将打破 Google 目前视频与图像生成赛道分离的现状。该判断属于基于界面布局的逻辑推演,具体技术实现仍需以官方白皮书或发布说明为准。

I/O 2026 发布窗口与市场竞争格局

Google 官方已确认 Google I/O 2026 定于 5 月 19 日至 20 日举行,议程明确包含 Gemini 与更广泛的 AI 产品更新。参照过往多模态模型的上路线索,Omni 或在该大会作为重要展示环节亮相。在时间窗口与竞品动态方面,字节跳动的 Seedance 2.0 近期已在多项视频生成评测中取得领先,Google 加速 Omni 相关测试的外部压力显著。若 Omni 正式推向市场,其性能基线将直接对标当前头部开源与闭源视频生成方案。

Google 内部代号 Omni 的视频生成能力仍处于高度推测阶段,当前所有外部观察均基于界面 UI 字符串与历史发布节奏。Omni 最终将以独立工具还是 Gemini 多模态基座形态公开,取决于 Google I/O 期间的产品叙事。对开发者与企业用户而言,需关注 Omni 是否开放 API 接口,以及多模态统一底层是否将降低跨模态工作流的集成成本。

评论