Veo 4 被曝支持多机位场景生成：动态视角切换、9 秒 720p 输出

Google I/O 大会前夕，Veo 4 视频生成模型的核心特性在社交平台被曝光。据爆料，该模型正从单镜头 AI 片段迈向全多机位场景生成，支持动态视角切换与原生音频同步，单条视频时长或达 9 秒、分辨率 720p。

据 Pankaj Kumar 在 X 平台的爆料，Veo 4 的最大升级在于动态机位切换机制。场景可在保持整体连贯性的前提下自然变换视角，突破现有视频生成模型单镜头输出的限制。

泄露素材显示，Veo 4 能生成同步多机位场景，画面衔接与叙事流畅度较 Veo 3 有明显提升。不过部分示例仍存在画面连续性问题，显示该技术尚处于打磨阶段。

音频质量是本次泄露的另一亮点。据爆料描述，Veo 4 原生支持同步对话、环境音效与情境背景音乐的生成，音频与画面的时序对齐能力大幅增强。

输出规格方面，泄露信息显示单条视频时长延伸至约 9 秒，分辨率为 720p。这一参数接近当前主流视频生成模型的商用门槛，但距离长视频生成仍有距离。

爆料者将 Veo 4 定位为 Seedance 2.0 的有力竞争者。字节跳动的 Seedance 2.0 同样主打多镜头叙事与高质量视频生成，两者在动态机位切换与音视频同步方面的技术路线存在重叠。

若泄露信息属实，Veo 4 可能在 I/O 大会期间正式发布，成为谷歌对抗字节跳动视频生成产品的重要棋子。考虑到 Seedance 2.0 已在部分区域开启公测，Veo 4 的实际可用性与定价策略将成为关键变量。

鉴于泄露素材存在样本局限、且谷歌官方尚未回应，Veo 4 的最终规格与发布节奏仍以 I/O 大会官方公告为准。参考历年 I/O 发布节奏，该模型或将于大会首日（5 月 20 日）正式亮相。

推荐阅读