Think思考用来增强RAG的Embedding?兼看推理模型使用实践建议等前沿进展

今日为2025年2月15日星期六。文章回顾了昨日的大模型进展,包括GraphRAG、开放AI推理模型使用建议、大模型训练注意力机制等,并介绍了深度思考与RAG结合的新进展,如生成嵌入和输出thought的方法。

瑞银给了份对标名单:寒武纪对英伟达,小米对特斯拉,中芯国际对台积电……

瑞银发布研报指出,寒武纪估值比英伟达高312%,小米和理想汽车的估值分别低于特斯拉80%和90%,中芯国际则低于台积电15%。瑞银认为AI相关股票存在估值重估机会,并看好软件类股票未来几年有望迎来显著的估值提升。

『手把手教程』:4步开启DeepSeek-R1联网搜索功能!

三天前发布的文章介绍了如何从字节火山引擎获取并使用满血版DeepSeek-R1 API服务,其中还包括了开启联网搜索功能的教程。今天的文章重点是分享了一个四步教程,详细说明了如何在字节火山平台创建关联应用、配置应用以实现联网搜索功能。

从理论到代码剖析DeepSeek-R1:从PPO到Reinforce++,再对比GRPO

MLNLP是国内外知名的人工智能社区,致力于促进机器学习与自然语言处理领域的学术交流和技术进步。文章讨论了Reinforce++和GRPO作为PPO变体的应用及其改进,包括去除critic模型、使用远程奖励模型以及在GRPO基础上优化KL估计方法等技术进展。