14B 小模型逆袭翻译赛道,论文财报实测超Claude,不信试试“我命由我不由天” 下午4时 2025/03/12 作者 量子位 来自网易有道的14B翻译小模型,测试达行业第一,翻译质量超越一众国内外主流通用大模型。 它就是子曰
MLGym:推进人工智能研究Agent的新框架和基准 上午8时 2025/02/26 作者 NLP工程化 本文提出MLGym框架和基准,评估前沿LLM在AI研究任务上的表现,并强调构建和完善评估体系的重要性。