DeepSeek R1
训练1000样本就能超越o1,李飞飞等人画出AI扩展新曲线
斯坦福大学和华盛顿大学的研究人员提出了一个新的测试时间扩展方法s1,仅使用1000个样本就实现了与OpenAI o1级别的预览性能。该方法通过预算强制来控制解码时间,并在数学问题上提升了27%的表现。
一招教你解决DeepSeek R1的卡顿问题。
DeepSeek官方服务体验不佳,用户寻求第三方替代方案。硅基流动和Chatbox AI结合使用提供稳定且友好的接口访问DeepSeek模型。教程简单易懂,适合小白用户。
(干货篇)一文带你将 DeepSeek 部署到本地,并对接至Vscode!
通过部署DeepSeek R1大模型,文章介绍了从安装Ollama工具到本地VSCode集成的全流程步骤。不仅包括了轻量级模型的下载和使用体验,还展示了如何借助ChatBox GUI进行更便捷的操作,并进一步在VSCode中接入本地DeepSeek服务。
R1-V项目:将DeepSeek R1的训练方法用在视觉语言模型上
R1-V项目展示了DeepSeek RRP在视觉语言模型上的效果,仅需30分钟和不到3美元的训练成本,在100个步骤内超越了72B模型的OOD测试表现。
手把手带你用DeepSeek-R1和Ollama搭建本地应用,一文搞定!
本教程详细介绍了如何使用DeepSeek R1和Ollama构建本地化的RAG应用系统。通过文档处理、向量存储、Chain构建和RAG实现等四个主要步骤,实现了完整的功能。
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
OpenAI 推出 o3-mini 模型免费开放并降低成本,引发了与 DeepSeek R1 的对比。o3-mini 在模拟弹跳球任务中表现优于 DeepSeek R1,但在四维超立方体内小球的运动轨迹上出现偏差。
OpenAI 急推 o3-mini 救场,实测与DeepSeek谁是最强推理大模型
OpenAI CEO发布o3-mini模型,主打低成本推理功能。与DeepSeek R1相比,o3-mini价格较高但性能不输。通过8道推理题测试对比,显示o3-mini在部分推理任务上表现不如DeepSeek R1。