R1强化学习策略用在多模态推理开源实现:兼看社区不可思议被侵权之遇
今天是2025年02月20日,星期四。文章提到了NLP社区的一则有趣事件,并讨论了R1在多模态推理中的进展,包括视频和图像处理的相关工作及技术细节。
今天是2025年02月20日,星期四。文章提到了NLP社区的一则有趣事件,并讨论了R1在多模态推理中的进展,包括视频和图像处理的相关工作及技术细节。
今日2025年02月16日北京晴。老刘的三部曲课程与RAG系列课堂完成,涵盖Deepseek-R1及GraphRAG等大模型知识,包括应用场景、技术原理和复现项目等内容。
2025年02月16日,北京晴天。社区第39讲《DeepseekR1及Deepresearch复现》顺利结束,老刘报告了4小时深度讨论内容。介绍了大模型推理和复现进展,包括DeepSeek-MoE-ResourceMap、OpenR1-Math-Raw等资源库,并展示了OpenThinker-32B在MATH500测试中的表现。研究发现,长链推理的结构比内容更重要。老刘呼吁社区成员参与讨论。
2025年02月14日,北京晴。文章介绍了MedRAG工具结合知识图谱解决医疗诊断问题,并回顾了利用知识图谱进行上下文扩展的思路和实践。
今天是2025年02月12日,星期三。老刘在NLP技术社区分享了关于Deepseek R1模型的习得过程、场景机会及技术风险等内容,并介绍了R1卡顿问题、知识库搭建等实践应用细节。
今天是2025年02月08日,星期六。老刘在NLP技术社区分享了关于Deepseek R1类推理大模型的习得过程、认知误区、场景机会及技术风险等内容,强调需从落地角度看问题,并提醒避免空谈和偏见。
老刘说NLP技术社区自建立以来围绕大模型、知识图谱、RAG和文档智能等主题发布每日早报、线上交流活动分享、专题报告等内容,欢迎加入。
今天是2025年02月07日,星期五。老刘说NLP技术社区第27讲线上交流围绕Deepseek R1类推理大模型的习得过程、认知误区展开讨论,分享场景机会及技术风险。
2025年02月06日,星期四,大年初九,北京天气晴。Deepseek-R1近期引发广泛关注,摘要回顾了其蒸馏、推理速度等话题,并探讨知识图谱进展及RAG中Deepthink的使用思考。