多模态问答归档 - 每时AI

告别OCR！这个AI文档神器直接”看懂”PDF，支持文档归类及多模态问答！

上午8时 2025/04/25 作者开源星探

No-OCR 是一款无需 OCR 的 AI 文档处理神器，支持图文混合搜索、视觉问答等功能，提升文档分析效率。

让Stable Diffusion当老师，教多模态大模型（如Llama-3.2）如何看图说话

上午8时 2025/02/18 作者 NLP工程化

中国研究员与DeepMind合作发布《Lavender》研究，仅需少量数据和注意力对齐技术便大幅提升多模态问答模型性能。