360 和阿里同时开源 32B 模型,性能比肩 DeepSeek R1
文章介绍了Qwen团队和360智脑在推理模型上的进展,QwQ-32B与Light-R1-32B在数学评测领域表现出色,并且Light-R1-32B为零复现了长思维链能力。
文章介绍了Qwen团队和360智脑在推理模型上的进展,QwQ-32B与Light-R1-32B在数学评测领域表现出色,并且Light-R1-32B为零复现了长思维链能力。
通义千问团队发布推理模型QwQ,参数量32B,在GPQA等数据集上击败o1-mini,并开源。但其回答较长且冗余,后续需改进简洁度。