百万美金炼出「调参秘籍」!阶跃星辰开源LLM最优超参工具 下午4时 2025/03/13 作者 机器之心 DIA H800 GPU 小时(约百万美元),从头训练了 3,700 个不同规模,共计训了 100
大模型不会推理,为什么也能有思路?有人把原理搞明白了 下午8时 2024/12/15 下午1时 2024/11/22 作者 机器之心 机器之心报道 编辑:泽南、杜伟 大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」