斯坦福大学归档 - 第6页共9页

“李飞飞团队50美元复刻DeepSeek R1”之辨

2025年2月7日14时作者 AI先锋官

斯坦福大学李飞飞团队联合华盛顿大学研究人员利用不到50美元的云计算费用训练出了名为s1的推理模型，其数学与编码能力表现接近OpenAI、DeepSeek等大模型。该模型已在GitHub上发布，并且通过精心挑选的数据集和蒸馏方法实现了低成本高效训练。

训练1000样本就能超越o1，李飞飞等人画出AI扩展新曲线

2025年2月5日16时作者机器之心

斯坦福大学和华盛顿大学的研究人员提出了一个新的测试时间扩展方法s1，仅使用1000个样本就实现了与OpenAI o1级别的预览性能。该方法通过预算强制来控制解码时间，并在数学问题上提升了27%的表现。

斯坦福揭秘o1-preview软肋！数学竞赛题稍作修改，准确率骤降30%

2025年1月31日16时作者新智元

斯坦福研究发现，即使在数学竞赛中表现出色的大模型o1-preview，在题目稍作修改后准确率也会大幅下降30%。这揭示了AI模型在应对变体题时的局限性。

全球掀DeepSeek复现狂潮！硅谷巨头神话崩塌，30刀见证啊哈时刻

2025年1月26日12时作者新智元

新智元报道
编辑：编辑部 HYZ
【新智元导读】
就在刚刚，网上已经出现了一波复现DeepSeek的

斯坦福大学的并行计算课程

2025年1月21日8时作者 NLP工程化

斯坦福大学CS149课程《并行计算》介绍，由Kayvon Fatahalian和Kunle Olukotun授课，旨在让学生理解并行计算系统设计原理、掌握编程技巧。

斯坦福研究：ChatGPT性能，曾出现下降趋势

2025年1月17日8时作者 AIGC开放社区

专注于AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地。斯坦福大学与加州伯克利大学发布的《ChatGPT行为随时间变化》论文详细分析了GPT-3.5和GPT-4的性能波动及其原因，包括指令遵循度的变化、内容过滤能力的下降等问题。

抢先OpenAI“虚拟员工”！清华复旦斯坦福联手，让Agent接管电脑帮你工作

2025年1月14日16时作者量子位

清华、复旦等联合提出Eko框架，开发者通过简洁代码和自然语言快速构建虚拟员工，支持浏览器和电脑操作，具备生产级干预机制，实现自动化任务如数据收集、测试和文件管理。

1月5日周日 | Python热门项目

2025年1月6日14时作者 AIGC创想者

Python项目排行：涵盖知识策展系统、对话工具、家庭自动化系统及编程语言模型等多个领域。

斯坦福打脸大模型数学水平：题干一改就集体降智，强如o1也失准，能力涌现怕不是检索题库

2025年1月6日12时作者量子位

斯坦福大学研究表明，在更换数学题变量名称后，大模型的准确率直线下降。即使是表现最好的o1-preview模型，其准确率也从50%降至33.96%，表明它们可能更多依赖已存储的答案而非推理能力。团队提出Putnam-AXIOM。该基准解决了现有评估基准数据污染和饱和的问题，为自动化评估提供方法并生成变体数据集。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30