R1复现基座选用Qwen or Llama?兼看Audio-Reasoner多模态语音推理思路
在2025年3月7日的周五,文章探讨了AI内容的影响范围及R1复现基座的一些解释,并介绍了多模态语音大模型在R1方面的尝试。
在2025年3月7日的周五,文章探讨了AI内容的影响范围及R1复现基座的一些解释,并介绍了多模态语音大模型在R1方面的尝试。
2025年3月6日周四北京晴。文章提到了OLMOCR测试情况及GraphRAG和多模态R1的工作进展,强调了奖励函数设计在强化学习中的重要性,并建议简化复杂系统架构以便应用。
2025年转眼已过1/6,老刘说NLP技术社区已完成三次线上技术交流,涵盖RAG、Deepseek-R1推理大模型等话题。社区持续发布内容,欢迎更多成员加入,通过会员制提供多种权益和分享机会。
今天是2025年02月24日,星期一。文章讨论了mobile agent的思考和开源进展,包括MoE小模型Moonlight-16B-A3B、Qwen2.5-VL及deepseek开源周day1开源FlashMLA等项目。此外还介绍了RAG在写作场景中的应用进展。
DeepSeek R1 在 think 过程中的需求和问题引起了广泛关注,包括输出思考过程的需求、过长或过短的思考时间以及控制思考方向。文章探讨了这些问题,并提出了通过调整模型设置、修改prompt模板和干预token解码采样的方法来解决。
社区关于Deepseek-R1类推理大模型的三部曲线上交流顺利结束。老刘说NLP技术社区分享NLP、大模型&RAG&文档智能&知识图谱四个主题的知识与技术,现已举办39次线上报告活动,并将持续纳新。
今天是2025年02月20日,星期四。文章提到了NLP社区的一则有趣事件,并讨论了R1在多模态推理中的进展,包括视频和图像处理的相关工作及技术细节。
今日2025年02月16日北京晴。老刘的三部曲课程与RAG系列课堂完成,涵盖Deepseek-R1及GraphRAG等大模型知识,包括应用场景、技术原理和复现项目等内容。
2025年02月16日,北京晴天。社区第39讲《DeepseekR1及Deepresearch复现》顺利结束,老刘报告了4小时深度讨论内容。介绍了大模型推理和复现进展,包括DeepSeek-MoE-ResourceMap、OpenR1-Math-Raw等资源库,并展示了OpenThinker-32B在MATH500测试中的表现。研究发现,长链推理的结构比内容更重要。老刘呼吁社区成员参与讨论。