小模型归档 - 每时AI

Agent也能蒸馏了！性能超好

MLNLP社区是国内外知名的机器学习与自然语言处理社区。该社区致力于促进学术界、产业界和爱好者间的交流与进步，特别是针对初学者的提升。近期有论文提出Agent蒸馏技术，通过使用检索工具和代码工具让小模型学会像人类一样解决问题，显著提升了小模型在某些任务上的性能。

2025年4月17日8时作者 NLP工程化

字节开源新型多模态生成模型Liquid，核心创新在于统一编码图像和文本到相同token空间，并使用单一LLM处理视觉理解和生成任务。研究表明，随着模型规模增大，性能下降会消失甚至互相促进。

2025年3月12日23时作者 AI前线

智能流程，从而减少能源和成本方面的担忧。
3 月 12 日，谷歌宣布推出了 Gemma 3 开源 A

2025年3月2日12时作者机器之心

）像人一样，在「用脑过度」也会崩溃，进而行动能力下降。
近日，加州大学伯克利分校、UIUC、ETH

2025年2月25日8时作者新智元

！研究人员通过自我博弈和直接偏好优化，让LLM摆脱人工数据依赖，大幅提升预测能力。
最近，有个爆火的

2025年2月12日23时作者机器之心

DeepScaleR-1.5B-Preview 成功复现 Deepseek-R1 的训练方法，成本仅需4500美元。该模型在AIME2024竞赛中超越了O1-Preview，展示了小模型通过强化学习也能实现飞跃的潜力。