多模态扩散模型开始爆发,这次是高速可控还能学习推理的LaViDa 下午4时 2025/05/30 作者 机器之心 的视觉-语言模型(VLM)也来了,即能够联合处理视觉和文本信息的模型。今天我们介绍的这个名叫 LaV