微软 Phi-4 震撼发布:14B 参数模型性能超越 一众大模型,数学推理性能提升显著

微软发布的Phi-4大语言模型在数学推理方面表现出色,准确率达到91.8%。该模型通过高质量合成数据集、精心策划的数据以及先进的后训练技术实现了这一成就,并已在Azure AI Foundry平台发布。

多模态慢思考:分解原子步骤以解决复杂数学推理

AtomThink 是一个全流程框架,通过改进多模态大语言模型的原子推理步骤质量来解决复杂的数学推理问题。它发布了一个高质量的长链式思考数据集,并引入了慢思考策略提高了各种数学任务的推理性能。

国产大模型黑马的首个推理模型来了,和 o1 PK后,我发现了AI深度思考的大问题

DeepSeek 推出 R1-Lite 推理模型预览版本,并展示了其完整思考过程。用户可以通过 DeepSeek 的 chat 平台体验该模型,同时讨论了思维链的利与弊及其在实际应用中的挑战。