Google DeepMind发布Veo 3:4K电影级视频,AI配音效,人人都是导演
Google DeepMind发布Veo 3,提升视频生成真实感和保真度,支持4K输出,并新增多种创意功能如参考驱动视频和风格匹配,助力电影制作和故事讲述。
Veo - Google DeepMind
Veo 3:视频生成模型新突破
- Google DeepMind 发布了最新的视频生成模型 Veo 3,以及 Veo 2 的新创意功能。
- Veo 3 旨在赋能电影制作人和故事讲述者,提升视频制作的真实感、保真度,支持 4K 输出,并具备更强的物理模拟和音频生成能力。
- Veo 3 可以为视频添加声音效果、环境噪音,甚至对话,所有音频均为原生生成。
- Veo 3 在物理效果、真实感和提示遵循方面表现出色。
Veo 3 示例:
- 提示: 一个老水手,戴着蓝色帽子,手持烟斗,指向波涛汹涌的大海。“这片海洋是一种力量,一种狂野、未驯服的力量。它指挥着你的敬畏,伴随着每一道破晓之光。”
- 提示: 一只猫头鹰在月光下飞过森林,獾惊恐地看着它。“他们今天留下了一个……一个‘球’。它跳得比我跳得还高。”獾结结巴巴地说。“那是什么魔法?”猫头鹰若有所思地叫道。
- 提示: 侦探审问一个看起来很紧张的橡皮鸭。“在泡泡浴之夜,你在哪里?!”他嘎嘎地叫道。
- 提示: 在拥挤的火车站,间谍们交换情报。“缩微胶卷在你的票里。”他咕哝着。“他们正在监视北出口。”她警告说。“使用服务隧道。”
Veo 2 新功能:
- 参考驱动视频: 通过提供场景、角色或物体的图像来引导视频生成,确保视频与创意意图对齐。
- 风格匹配: 通过提供风格参考图像,生成具有相同视觉风格的视频,从绘画到电影效果。
- 角色一致性: 通过提供角色参考图像,确保角色在不同场景中保持一致的外观。
- 相机控制: 精确控制视频中镜头的取景和运动。
- 首尾帧过渡: 在提供的首尾帧图像之间创建自然的过渡效果。
- 外绘: 通过添加新的、匹配的部分来扩展视频,使其适应任何屏幕尺寸或形状。
- 添加对象: 通过引入新的对象来重新构想视频,从逼真的细节到奇幻的元素。Veo 会考虑比例、互动和阴影,以创建自然、逼真的视频。
- 移除对象: 无缝地从视频中移除不需要的对象。Veo 会保留场景的自然构图、互动和阴影。
- 角色控制: 使用你的身体、面部和声音来动画角色。
- 运动控制: 定义视频中对象的精确运动。选择一个对象并定义其路径,Veo 会使其运动起来。
Flow:
- Flow 旨在帮助创意人员使用 Google DeepMind 最强大的生成式 AI 模型创建无缝的电影片段、场景和故事。
安全与责任:
- Veo 在设计时考虑了责任和安全。Google 会阻止有害的请求和结果,测试新功能可能对安全产生的影响,并由内部团队和外部专家尝试查找和修复潜在问题。
- 使用 Veo 制作的视频将使用 SynthID 进行标记,这是一种用于水印和检测 AI 生成内容的技术。
合作伙伴:
- Darren Aronofsky 的 Primordial Soup 与 Google DeepMind 合作,探索 AI 作为释放人类创造力下一篇章的工具。
- Promise 是一家 GenAI 优先的电影工作室,探索 Gemini 和 Veo 如何改进电影制作流程。
- Volley 正在使用 Veo 进行原型设计,为其即将推出的 dungeon crawler 提供视觉体验。
- Fal.ai 上的开发者现在可以将 Veo 与其他生成媒体技术结合使用,以创建新型创意工具