InternVL 归档 - 每时AI

金融领域推理大模型DianJin-R1、Fin-R1及文档转markdown、docx的多模态大模型做法

2025年4月25日14时作者老刘说NLP

今天是2025年4月25日，星期五，北京晴。文章讨论了多模态模型如何将文档图片转为markdown和docx的逻辑，并介绍了Qwen2VL、internvl、GOT-OCR及docling等模型的具体使用方式。此外，还探讨了金融领域推理模型进展，特别关注DianJin-R1的工作，强调数据质量和强化学习在提升模型性能中的重要性。

10倍吞吐提升无损性能：多模态适用的KV cache量化策略来了，即插即用无需改原模型

2025年4月3日11时作者量子位

CalibQuant团队在InternVL-2.5模型上提出了一种1比特量化方法，通过校准策略缓解了低比特数量化带来的失真问题。实验结果显示，在多种任务和内存限制下，该方法相比基线有显著的性能提升。

从视觉问答到多语言翻译：InternVL的多模态“全能”应用图鉴

2025年4月2日14时作者小兵的AI视界

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31