Veo 4 被曝支持多机位场景生成:动态视角切换、9 秒 720p 输出
Google I/O 大会前夕,Veo 4 视频生成模型的核心特性在社交平台被曝光。据爆料,该模型正从单镜头 AI 片段迈向全多机位场景生成,支持动态视角切换与原生音频同步,单条视频时长或达 9 秒、分辨率 720p。

Veo 4 多机位场景生成能力曝光
据 Pankaj Kumar 在 X 平台的爆料,Veo 4 的最大升级在于动态机位切换机制。场景可在保持整体连贯性的前提下自然变换视角,突破现有视频生成模型单镜头输出的限制。
泄露素材显示,Veo 4 能生成同步多机位场景,画面衔接与叙事流畅度较 Veo 3 有明显提升。不过部分示例仍存在画面连续性问题,显示该技术尚处于打磨阶段。
原生音频生成与输出规格
音频质量是本次泄露的另一亮点。据爆料描述,Veo 4 原生支持同步对话、环境音效与情境背景音乐的生成,音频与画面的时序对齐能力大幅增强。
输出规格方面,泄露信息显示单条视频时长延伸至约 9 秒,分辨率为 720p。这一参数接近当前主流视频生成模型的商用门槛,但距离长视频生成仍有距离。
与 Seedance 2.0 的竞争格局
爆料者将 Veo 4 定位为 Seedance 2.0 的有力竞争者。字节跳动的 Seedance 2.0 同样主打多镜头叙事与高质量视频生成,两者在动态机位切换与音视频同步方面的技术路线存在重叠。
若泄露信息属实,Veo 4 可能在 I/O 大会期间正式发布,成为谷歌对抗字节跳动视频生成产品的重要棋子。考虑到 Seedance 2.0 已在部分区域开启公测,Veo 4 的实际可用性与定价策略将成为关键变量。
鉴于泄露素材存在样本局限、且谷歌官方尚未回应,Veo 4 的最终规格与发布节奏仍以 I/O 大会官方公告为准。参考历年 I/O 发布节奏,该模型或将于大会首日(5 月 20 日)正式亮相。
评论 ···