重磅:Google 推出图文视频生成双王!Sora要完了?
Google发布了全新的Veo 2视频生成模型和Imagen 3图像生成模型。测试结果显示,Veo 2在画面质量和提示词遵从度上都超越了OpenAI的Sora。此外,Imagen 3在文字渲染和细节呈现方面表现优异,创下了1115的新高分。Google已经在多个平台上推出这两款产品。
Google发布了全新的Veo 2视频生成模型和Imagen 3图像生成模型。测试结果显示,Veo 2在画面质量和提示词遵从度上都超越了OpenAI的Sora。此外,Imagen 3在文字渲染和细节呈现方面表现优异,创下了1115的新高分。Google已经在多个平台上推出这两款产品。
中国电信人工智能研究院发布的新模型TeleAI-VAST,在16项子指标中有9项排名第一,包括物体分类、人体动作等。该模型展示了四位女主角的不同场景下的前后一致性和人物动作精准控制能力,并且实现了声音与画面的同步效果。此外,它采用了独特的两阶段生成架构,使得视频生成更加精确和可控。
生成式AI领域竞争激烈,国内大模型创业公司加速发展。阶跃星辰近期发布了多个多模态理解及生成的大模型,并取得多项国际排名前列的成绩。该公司计划通过多模态理解和生成技术实现AGI(通用人工智能),预计到2028年全球生成式AI产业支出将达到4.58万亿元。
卡内基梅隆大学提出RLT方法,利用视频中重复图像块合并成token技术,显著提升Transformer视频生成速度,训练时间缩短30%,推理阶段提速67%。