12月17日消息,谷歌今日发布最新版本的视频生成模型Veo 2,与OpenAI的Sora展开正面竞争。谷歌表示,Veo 2可以生成更为逼真的视频内容。
与此同时,谷歌还对其图像生成模型Imagen进行了升级,推出了Imagen 3,旨在生成内容更为丰富、细节更为精致的图片。
谷歌指出,Veo 2“对现实世界的物理规律以及人类动作和表情的微妙之处有了更深入的理解”。目前,该模型可在谷歌实验室的VideoFX平台上试用,但用户需通过谷歌表格注册,加入等候名单,并等待谷歌在指定时间内临时开放访问。
谷歌在一篇博客文章中提到:“Veo 2同样精通电影制作手法:只需指定一个类型、镜头以及一些电影特效建议,Veo 2即可生成最高可达4K分辨率的视频。”
Veo 2视频生成
尽管Veo 2目前仅对部分受邀用户开放,但原始版本的Veo仍可在Vertex AI平台上使用。通过Veo 2生成的视频将嵌入谷歌特有的元数据水印SynthID,以此标识这些视频为人工智能生成内容。
谷歌也承认,Veo 2可能仍会偶尔出现如多余手指等“幻觉”,但公司承诺新版本将大幅减少此类现象。
Veo 2将与OpenAI近期推出的Sora视频生成模型直接竞争,争夺电影制作人及内容创作者的市场。值得一提的是,Sora在全面开放给付费用户之前,已进行了预览测试。
在谷歌的内部测试中,Veo在“总体偏好”(即观众更喜欢哪些视频)和“提示依从性”(视频与人类创作者指令的匹配度)两项指标上均超越了Sora及其他竞争对手的AI模型,这一表现尤为亮眼。
今年5月,谷歌在I/O开发者大会上首次公布Veo,并与演员兼音乐人唐纳德·格洛沃(Donald Glover)合作,制作了一段展示视频。
AI视频生成仍需改进
长期以来,人工智能视频生成一直是生成式AI领域的重要分支。谷歌、OpenAI等大模型开发者与RunwayML等较小规模的公司在这一领域展开了激烈竞争,互相追赶。
RunwayML作为AI视频生成的先驱之一,最近推出了Gen-3 Alpha Turbo模型,提供了更强大的控制能力。Pika Labs发布了Pika 2.0,赋予用户更多控制权,并支持在视频中加入自定义角色。此外,Luma AI宣布与亚马逊AWS合作,将其模型引入Bedrock平台,以满足企业级需求,同时扩展了Dream Machine视频生成模型的功能。
尽管如此,AI视频生成技术仍需克服创作者和观众的质疑。例如,Sora发布后仍有用户批评其生成的内容存在违背物理规律和人体结构的问题,结果表现不一致。
在最近的游戏奖颁奖典礼上,观众对所谓“AI劣质内容”(AI slop)的不信任感也有所体现,反映了人们对AI生成内容质量的担忧。
不过,部分电影制作人已开始探索AI视频生成器的潜力。例如,著名导演詹姆斯·卡梅隆(James Cameron)加入了Stability AI的董事会,而演员安迪·瑟金斯(Andy Serkis)也宣布成立一家专注于AI的制作公司。
谷歌表示,许多用户对其AI视频生成工具展现出极大的兴趣。该公司透露,YouTube创作者已开始利用VideoFX平台为YouTube短片制作背景,从而节省时间并提升效率。
Imagen 3更新
谷歌还对其图像生成模型Imagen进行了升级,推出了Imagen 3。该模型最近已通过Gemini聊天机器人提供服务,生成的图像更加逼真且色彩鲜艳。
谷歌表示,Imagen 3能够更准确地渲染多种艺术风格,包括写实主义、印象派、抽象艺术及动画风格。同时,模型在遵循用户提示方面的表现也得到了显著提升。
用户可通过ImageFX平台访问并使用Imagen 3。
【来源:网易金沙手机网投老品牌值得信赖 】