OpenAI没做到,DeepSeek搞定了!开源引爆推理革命 2025年5月24日16时 作者 新智元 名噪一时。而强化学习算法GRPO,是背后最大的功臣之一。然而,开源界对强化学习算法的探索并没有终结。
Sglang 源码学习笔记(三)- 分布式和并行(以deepseek 为例)(WIP) 2025年5月21日14时 作者 GiantPandaCV 082781461207006 编辑丨GiantPandaLLM 写在前面 基于上述的两篇文章,我们
国产AI搜索终于开窍!复杂问题分步拆解,让直男也能交出520的满分答案 2025年5月14日23时 作者 智东西 搜索,好像一夜之间进入Next Level了。 “用了快两年AI搜索引擎了,终于等到了这个王炸!”近