资讯
国际
分享
大模型
学术
开源
机器人
关于我们

LLM推理能力

DeepSeek-R1技术突破：基础模型强化学习+蒸馏小模型超越o1-mini

2025年1月20日22时作者 PaperAgent

DeepSeek-R1正式发布，API上线、技术报告公开、开源8个模型，涵盖从小至32B的多种规模。报告亮点包括后训练RL和流水线开发技术，并证明了小模型也能达到强大性能。

分类分享标签 671B、 deepseek-ai、 LLM推理能力、大规模强化学习、模型蒸馏、纯靠强化学习激励 1 条评论

搜索

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub Google GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能人形机器人具身智能大型语言模型大模型大语言模型字节跳动工业机器人开源强化学习微软扩散模型技术创新智能体木易机器学习深度学习清华大学生成式AI 用户体验百度腾讯自然语言处理英伟达谷歌阿里云阿里巴巴马斯克

分类

分享
国际
大模型
学术
开源
机器人
资讯

一个关于扩散模型Diffusion的教程
LLMap：为大型代码库提供智能上下文提取的CLI代码搜索工具
一个高效的多向量检索算法：MUVERA-PY
斩获6.4K星，运维救星！全新开源的监控神器上线，全栈监控“六边形战士”！
GenLM Control：用可编程约束控制语言模型生成文本的Python库

2025 年 7 月
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

« 6 月

归档

2025 年 7 月
2025 年 6 月
2025 年 5 月
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月

AI新闻 | X平台｜ APK反编译｜京ICP备2024096144号｜

© 2025 每时AI • Built with GeneratePress

下载我们的APP，AI秒送达！立即下载

×