清华大学DeepSeek:从入门到精通(不跑路)

《DeepSeek:从入门到精通》详细介绍了DeepSeek的核心功能、应用场景及提示语设计原则,强调了推理模型与通用模型的区别,并提出了关键的技能体系和进阶技巧。

“李飞飞团队50美元复刻DeepSeek R1”之辨

斯坦福大学李飞飞团队联合华盛顿大学研究人员利用不到50美元的云计算费用训练出了名为s1的推理模型,其数学与编码能力表现接近OpenAI、DeepSeek等大模型。该模型已在GitHub上发布,并且通过精心挑选的数据集和蒸馏方法实现了低成本高效训练。

Deep Research:不只是一个工具,是新时代的开始(5+实践例子)

OpenAI的Deep Research展示了自主代理与推理模型结合的人工智能系统,能够超越人类专家进行深度研究。它已证明了专注于特定任务的专业AI代理的强大能力,并在多个领域产生了专业级的研究成果。

有道周枫:2025是大模型应用元年,也是中小模型快速发展元年

2024年国内大模型已达到GPT-4水平,多模态和推理模型取得进展。周枫预测2025年是应用元年,中小模型将迎来快速发展。他还强调了实时多模态、开源项目的重要性,并指出推理模型仍有缺陷需改进。同时提到了2B市场疲软的情况,建议企业关注中小和行业模型的发展机会。