谷歌的Veo 2视频生成模型融入Gemini

谷歌正将其Veo 2视频生成人工智能模型提供给购买该公司高级人工智能计划Gemini Advanced的用户。

此次功能扩展之际,谷歌正试图回应OpenAI的Sora视频生成平台,同时该领域的竞争也日益激烈。两周前,实力较强的合成媒体公司之一Runway发布了其第四代视频生成器,并获得了超过3亿美元的新资金。

从周二开始,Gemini Advanced的订阅用户将能够在谷歌Gemini应用程序的模型下拉菜单中选择Veo 2。用户可以创建分辨率为720p、纵横比为16:9的8秒视频片段,并可通过Gemini的 “分享” 按钮将这些片段上传到TikTok、YouTube等平台。由Veo 2生成的视频也可以下载为MP4文件,并且会带有谷歌SynthID技术的水印。

Google Veo 2

谷歌Veo 2

图片来源:谷歌

谷歌表示,用户每月能够创建的视频数量有限,并且目前暂不支持Google Workspace的商业和教育计划。

谷歌还将Veo 2与Whisk进行了整合,Whisk是谷歌实验室的一项实验性功能,允许用户使用图片作为提示,通过Gemini创建新图片。一项名为Whisk Animate的新功能,使用户可以将自己生成的图片转化为由Veo 2生成的8秒视频。(谷歌实验室是谷歌用于推出早期人工智能产品的平台,需订阅每月20美元的Google One AI Premium才能使用。)

目前,谷歌对Veo 2的应用可能看起来相当基础。但谷歌旗下DeepMind的首席执行官德米斯·哈萨比斯(Demis Hassabis)最近表示,公司计划最终将其Gemini人工智能模型与Veo相结合,以提高前者对现实世界的理解能力。

与此同时,许多艺术家和创作者对Veo 2这样的视频生成器持谨慎态度,因为它们有可能颠覆整个创意产业。由代表好莱坞动画师和漫画家的工会——动画工会委托进行的一项2024年的研究估计,到2026年,美国超过10万个电影、电视和动画相关工作岗位将受到人工智能的影响。

Frontiers
Frontiers
文章: 93