360 和阿里同时开源 32B 模型,性能比肩 DeepSeek R1
文章介绍了Qwen团队和360智脑在推理模型上的进展,QwQ-32B与Light-R1-32B在数学评测领域表现出色,并且Light-R1-32B为零复现了长思维链能力。
文章介绍了Qwen团队和360智脑在推理模型上的进展,QwQ-32B与Light-R1-32B在数学评测领域表现出色,并且Light-R1-32B为零复现了长思维链能力。
OpenManus 是由 MetaGPT 团队成员构建的无需邀请码工具,让用户实现创意。HunyuanVideo-I2V 是腾讯开源的图像到视频生成框架。Light-R1-32B 超越 R1-Distill,在数学问题上表现出色且成本低廉。Audio-Reasoner 是大型音频语言模型,通过 CoT 推理在基准测试中表现优异。SolGraph 利用 Solana 链上基础设施实现快速透明的 AI 应用。
2B 模型,以及全部训练数据、代码。仅需 12 台 H800 上 6 小时即可训练完成,从没有长思维