从十篇论文中探讨:如何解决推理模型的”过度思考”问题? 2025年5月25日14时 作者 机器学习算法与自然语言处理 业研究人员。 社区的愿景 是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进
DeepSeek精度效率双提升,华为&信工所提出思维链“提前退出”机制 2025年5月11日16时 作者 量子位 华为与中科院提出DEER模型,通过动态提前退出推理机制,在保持精度的同时显著缩短大模型的思维链长度。