谷歌的Veo 2视频生成模型融入Gemini

Frontiers
2025 年 4 月 15 日
AI

谷歌正将其Veo 2视频生成人工智能模型提供给购买该公司高级人工智能计划Gemini Advanced的用户。

此次功能扩展之际，谷歌正试图回应OpenAI的Sora视频生成平台，同时该领域的竞争也日益激烈。两周前，实力较强的合成媒体公司之一Runway发布了其第四代视频生成器，并获得了超过3亿美元的新资金。

从周二开始，Gemini Advanced的订阅用户将能够在谷歌Gemini应用程序的模型下拉菜单中选择Veo 2。用户可以创建分辨率为720p、纵横比为16:9的8秒视频片段，并可通过Gemini的 “分享” 按钮将这些片段上传到TikTok、YouTube等平台。由Veo 2生成的视频也可以下载为MP4文件，并且会带有谷歌SynthID技术的水印。

Google Veo 2

谷歌Veo 2

图片来源：谷歌

谷歌表示，用户每月能够创建的视频数量有限，并且目前暂不支持Google Workspace的商业和教育计划。

谷歌还将Veo 2与Whisk进行了整合，Whisk是谷歌实验室的一项实验性功能，允许用户使用图片作为提示，通过Gemini创建新图片。一项名为Whisk Animate的新功能，使用户可以将自己生成的图片转化为由Veo 2生成的8秒视频。（谷歌实验室是谷歌用于推出早期人工智能产品的平台，需订阅每月20美元的Google One AI Premium才能使用。）

目前，谷歌对Veo 2的应用可能看起来相当基础。但谷歌旗下DeepMind的首席执行官德米斯·哈萨比斯（Demis Hassabis）最近表示，公司计划最终将其Gemini人工智能模型与Veo相结合，以提高前者对现实世界的理解能力。

与此同时，许多艺术家和创作者对Veo 2这样的视频生成器持谨慎态度，因为它们有可能颠覆整个创意产业。由代表好莱坞动画师和漫画家的工会——动画工会委托进行的一项2024年的研究估计，到2026年，美国超过10万个电影、电视和动画相关工作岗位将受到人工智能的影响。

Frontiers

文章: 248

Frontiers

相关文章

邀请100位AI创作者免费参加善友教授大课，共创先锋联盟计划~一起来玩 ​​​

英伟达开始“祛魅”

百度世界2024，嘉宾已就位！

推荐阅读

邀请100位AI创作者免费参加善友教授大课，共创先锋联盟计划~一起来玩