Huggingface 关于 Open R1 的文章 2025年2月2日23时 作者 NLP工程化 整理Deepseek R1发布信息及社区工作内容,复现评估、训练管道和推理数据集,并关注各界人士对模型的看法。
IntelllAgent 是一款基于多智能体协作的对话智能体评估与优化框架 2025年2月2日23时 作者 NLP工程化 IntelllAgent 是一款基于多智能体协作的对话智能体评估与优化框架,通过模拟多种交互场景对智能体进行压力测试,以提升其性能、可靠性和用户体验。
LangChain的官方博客发了一篇探索prompt优化的文章 2025年2月2日23时 作者 NLP工程化 文章评估了五种提示词优化方法,并推荐使用Claude-3.5-Sonnet模型,指出其在缺乏领域知识的任务中效果最佳。
万字揭秘DeepSeek !这个创新让全世界疯狂复制,顶尖AI人才年薪千万,训练成本被低估 2025年2月2日23时 作者 APPSO 这可能是迄今为止海外对 DeepSeek 最全面的一份分析报告,来自知名半导体研究机构 Semian
深度|外媒发文:DeepSeek技术开源堪比印刷术普及,打破知识垄断 2025年2月2日23时 作者 Z Potentials DeepSeek 成功使低成本、开源的人工智能模型成为可能,促进全球技术进步。
Linear Attention的cuda kernel实现解析 2025年2月2日23时 作者 极市干货 ↑ 点击 蓝字 关注极市平台 作 者丨BBuf 来源丨GiantPandaCV 编辑丨极市平台 极市
量化天才狂飙AI,全球对冲基金精英如何重塑AI科技创业版图? 2025年2月2日19时 作者 硅谷科技评论 在计算机领域流传着这样一句话:“计算机系最优秀的毕业生不是进大厂,而是选择做量化。”梁文锋,便是这一