“李飞飞团队50美元复刻DeepSeek R1”之辨
斯坦福大学李飞飞团队联合华盛顿大学研究人员利用不到50美元的云计算费用训练出了名为s1的推理模型,其数学与编码能力表现接近OpenAI、DeepSeek等大模型。该模型已在GitHub上发布,并且通过精心挑选的数据集和蒸馏方法实现了低成本高效训练。
斯坦福大学李飞飞团队联合华盛顿大学研究人员利用不到50美元的云计算费用训练出了名为s1的推理模型,其数学与编码能力表现接近OpenAI、DeepSeek等大模型。该模型已在GitHub上发布,并且通过精心挑选的数据集和蒸馏方法实现了低成本高效训练。
研究团队通过蒸馏技术从阿里通义Qwen2.5-32B-Instruct模型出发,结合Gemini 2.0 Flash Thinking实验版数据集训练出高性能推理模型s1-32B,在数学评测集中表现优异。
一种新的语言建模方法Test-time Scaling通过测试时增加额外计算来提升性能,作者李飞飞等新作S1提出了一种简单而有效的测试时扩展方法,并展示了其实用性。
论文探讨了Agent AI的全面框架,定义其为能够感知视觉和语言输入并产生具身行为的交互式系统。该框架强调跨现实性、多模态方式以及认知能力,未来可应用于虚拟现实和各类软件产品中。
李飞飞发布Agent AI综述性报告,指出LLM之上是Agent AI,并从多模态感知、交互、学习、应用等方面进行阐述,革新游戏、机器人、医疗等行业,推动AI迈向通用人工智能。
李飞飞教授在2024年创立了World Labs公司,并发布了首个基于图像生成3D场景的AI系统。同年,她担任斯坦福大学计算机科学教授、HAI研究院院长,并发表了多场关于空间智能的重要演讲和论文。
斯坦福大学教授李飞飞在人工智能顶会NeurIPS上分享了她的研究,她创立的世界实验室致力于生成3D场景并具备空间智能。她认为机器视觉正朝着全面智能迈出关键一步。
两位AI研究巨擘在NeurIPS会议上讨论时发现「视觉智能三阶阶梯」与Pearl因果推理阶梯有相似之处。李飞飞表示受到Pearl著作《为什么》启发,并称「视觉智能阶梯」灵感源自Pearl的理论,展示出AI各领域潜在联系和普遍规律。
国内智源研究院推出首个利用大规模无标注互联网视频学习的3D生成模型See3D,支持从文本、单视图和稀疏视图到3D的生成。