老刘说NLP
聚焦前沿技术落地:大模型+知识图谱+RAG+文档智能下的老刘说NLP技术社区对外纳新
2025年转眼已过1/6,老刘说NLP技术社区已完成三次线上技术交流,涵盖RAG、Deepseek-R1推理大模型等话题。社区持续发布内容,欢迎更多成员加入,通过会员制提供多种权益和分享机会。
Claude 3.7、QwQ-Max-Preview等推理大模型发布跟踪:兼看大模型逻辑推理技术总结及几点思考
近日推理大模型相关前沿回顾包括Claude 3.7的发布,Qwen的QwQ模型开源,FlashMLA的开源及PaliGemma 2 Mix模型的开源。文章还总结了大模型逻辑推理技术,并提出了一些值得思考的问题。
大模型开源及RAG用于综述写作进展:兼看mobile agent在应用场景选择上一些思考
今天是2025年02月24日,星期一。文章讨论了mobile agent的思考和开源进展,包括MoE小模型Moonlight-16B-A3B、Qwen2.5-VL及deepseek开源周day1开源FlashMLA等项目。此外还介绍了RAG在写作场景中的应用进展。
再聊误区–Deepseek-R1思考过程在使用中的几个问题及对策
DeepSeek R1 在 think 过程中的需求和问题引起了广泛关注,包括输出思考过程的需求、过长或过短的思考时间以及控制思考方向。文章探讨了这些问题,并提出了通过调整模型设置、修改prompt模板和干预token解码采样的方法来解决。