代码推理归档

开源推理大模型全面开花的一周：多模态、RAG、Agent、编码

2025年4月12日19时作者 PaperAgent

热门模型排行榜Top10中出现多款推理大模型，包括代码推理、混合专家视觉-语言模型等。DeepCoder-14B-Preview在LiveCodeBench v5上的准确率提升了8%，仅用140亿参数实现相似性能；Llama-3.1-Nemotron-Ultra-253B-v1基于Meta Llama-3.1-405B-Instruct训练，支持长达128K标记上下文长度。OpenCodeReasoning是最大推理编程合成数据集，用于监督式微调；Kimi-VL-A3B-Thinking在多模态推理和视觉理解方面表现出色；Seed-Thinking-v1.5采用强化学习算法提升模型训练效率。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31