Qwen2-VL归档 - 每时AI

如何教会AI像人类一样“慢思考”？阿里&浙大联合提出CMMCoT：多图像理解能力大升级

下午11时 2025/04/24 作者极市干货

阿里巴巴与浙江大学联合提出CMMCoT框架，融合多模态推理链与记忆增强机制，提升复杂多图像理解任务的跨图像推理和可解释性能力。

下午2时 2025/04/21 作者老刘说NLP

实现范式，也有多模态RAG中的embedding和rank模型进展
，可以看看。
另外，
关于幻觉问

下午2时 2025/01/30 作者 AI技术研习社

上一篇文章我们探讨了如何使用自定义数据集进行模型训练，这次我将重点介绍如何使用
LoRA 微调
Qw

下午2时 2025/01/25 作者 AI技术研习社

最近，我尝试对 Qwen2-VL-2B 进行微调。这是一款强大的多模态大语言模型，既能处理文本，又能