扩散方法归档 - 每时AI

多模态扩散模型开始爆发，这次是高速可控还能学习推理的LaViDa

下午4时 2025/05/30 作者机器之心

的视觉-语言模型（VLM）也来了，即能够联合处理视觉和文本信息的模型。今天我们介绍的这个名叫
LaV