多模态统一建模归档 - 每时AI

原来Veo 3早有苗头！人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架

2025年5月29日16时作者机器之心

。第一作者王希华是人大高瓴博士生（导师：宋睿华），他的研究兴趣主要在多模态生成，之前提出利用音频布局

九成以上模型止步白银段位，只有3个铂金！通用AI下半场评测标准来了

2025年5月21日11时作者机器之心

下半场
》中提出了振聋发聩的观点：人工智能的发展正步入一个全新的阶段。在上半场，我们习惯于专注模型架