告别OCR!这个AI文档神器直接”看懂”PDF,支持文档归类及多模态问答! 上午8时 2025/04/25 作者 开源星探 No-OCR 是一款无需 OCR 的 AI 文档处理神器,支持图文混合搜索、视觉问答等功能,提升文档分析效率。
让Stable Diffusion当老师,教多模态大模型(如Llama-3.2)如何看图说话 上午8时 2025/02/18 作者 NLP工程化 中国研究员与DeepMind合作发布《Lavender》研究,仅需少量数据和注意力对齐技术便大幅提升多模态问答模型性能。