仅50美元!斯坦福团队复制出OpenAI o1 和DeepSeek R1
斯坦福与华盛顿大学研究人员仅用50美元训练出一个性能堪比OpenAI模型的新模型s1,并开源了全部代码和数据。研究揭示,高效训练不依赖大量数据、复杂强化学习或高昂成本。
斯坦福与华盛顿大学研究人员仅用50美元训练出一个性能堪比OpenAI模型的新模型s1,并开源了全部代码和数据。研究揭示,高效训练不依赖大量数据、复杂强化学习或高昂成本。
斯坦福大学和华盛顿大学的研究人员提出了一个新的测试时间扩展方法s1,仅使用1000个样本就实现了与OpenAI o1级别的预览性能。该方法通过预算强制来控制解码时间,并在数学问题上提升了27%的表现。
FlashInfer论文介绍了高效的注意力引擎技术,利用块稀疏和可组合格式解决KV缓存存储问题,并提供了自定义和负载均衡调度功能。
4位华人学者入选AAAI 2025年度Fellow,涵盖计算机视觉、机器学习等多个领域。陈一昕在图神经网络和轻量级算法方面有重要贡献;付昀专注于计算机视觉及商业化创新;熊辉在人工智能和移动计算领域开发了广泛应用的算法;杨明玄在目标跟踪算法和数据集构建上做出了显著贡献。
2025年AAAI Fellow名单公布,四位华人学者入选。包括陈一昕、Yun Raymond Fu、Hui Xiong和Ming-Hsuan Yang等知名学者。
本周解读了AI Agent在2024年的发展情况及面临的技术障碍,以及如何结合机器学习与符号人工智能帮助Agent解决落地问题,文中还提到了人形机器人和AI科学家的相关信息。
首个完全开源的科学助手语言模型OpenScholar在4500万篇论文数据存储库中表现优异,能够高效检索和回答科研相关问题。它比GPT-4o更可靠且成本更低。