动态调整归档

OpenAI没做到，DeepSeek搞定了！开源引爆推理革命

2025年5月24日16时作者新智元

名噪一时。而强化学习算法GRPO，是背后最大的功臣之一。然而，开源界对强化学习算法的探索并没有终结。

2025年5月21日14时作者 GiantPandaCV

082781461207006
编辑丨GiantPandaLLM
写在前面
基于上述的两篇文章，我们

2025年5月14日23时作者智东西

搜索，好像一夜之间进入Next Level了。
“用了快两年AI搜索引擎了，终于等到了这个王炸！”近