李飞飞归档 - 第2页共4页

李飞飞团队50美元训练出DeepSeek R1?

下午2时 2025/02/07 作者 AI大模型实验室

文章介绍了通过16块H100 GPU在26分钟内训练出低成本语言模型S1K的方法，该模型与OpenAI的o1系列和DeepSeek R1系列性能相当。但实际研究发现，论文核心是基于开源Qwen2.5-32B模型，进行小数据集监督微调，并非直接复制了DeepSeek R1。

下午2时 2025/02/07 作者 AI先锋官

斯坦福大学李飞飞团队联合华盛顿大学研究人员利用不到50美元的云计算费用训练出了名为s1的推理模型，其数学与编码能力表现接近OpenAI、DeepSeek等大模型。该模型已在GitHub上发布，并且通过精心挑选的数据集和蒸馏方法实现了低成本高效训练。

上午8时 2025/02/07 作者量子位

研究团队通过蒸馏技术从阿里通义Qwen2.5-32B-Instruct模型出发，结合Gemini 2.0 Flash Thinking实验版数据集训练出高性能推理模型s1-32B，在数学评测集中表现优异。

下午4时 2025/01/22 作者机器之心

机器之心报道
机器之心编辑部
「语言是人类的语言，而 3D 是自然的语言。」
「除了语言，我们还有另

上午8时 2025/01/12 作者 NLP工程化

论文探讨了Agent AI的全面框架，定义其为能够感知视觉和语言输入并产生具身行为的交互式系统。该框架强调跨现实性、多模态方式以及认知能力，未来可应用于虚拟现实和各类软件产品中。

下午8时 2024/12/21 作者 Z Potentials

李飞飞教授在2024年创立了World Labs公司，并发布了首个基于图像生成3D场景的AI系统。同年，她担任斯坦福大学计算机科学教授、HAI研究院院长，并发表了多场关于空间智能的重要演讲和论文。

下午2时 2024/12/13 作者机器之心

斯坦福大学教授李飞飞在人工智能顶会NeurIPS上分享了她的研究，她创立的世界实验室致力于生成3D场景并具备空间智能。她认为机器视觉正朝着全面智能迈出关键一步。