老刘说NLP，作者每时AI

大模型推理部署的几个基本认知及prompt压缩策略用于COT推理微调尝试

2025-02-21 作者老刘说NLP

2025年02月21日星期x，介绍了大模型推理压缩策略，包括TokenSkip方法用于Controllable Chain-of-Thought（COT），通过分析和剪枝减少冗余token提高推理效率。相关研究文献推荐加入了LoRA微调技术。

R1强化学习策略用在多模态推理开源实现：兼看社区不可思议被侵权之遇

2025-02-20 作者老刘说NLP

今天是2025年02月20日，星期四。文章提到了NLP社区的一则有趣事件，并讨论了R1在多模态推理中的进展，包括视频和图像处理的相关工作及技术细节。

RAG+的一些前沿动向：兼看长文本、投标写作以及R1可解释性的有趣探索

2025-02-19 作者老刘说NLP

家一起参考。
围绕Ktransformer认知误区，长文本新策略工作，投标文件写作项目，RAG输入去

值得一读之关于ktransformers的一些正确认知和若干细节问题

2025-02-18 作者老刘说NLP

多，也让人产生了许多误区，社区觉得有必要来谈谈这个话题，当然，跟大家强调一下，我们务必要去看
一手消

如何测量大模型是否过度思考？兼看最近GraphRAG及多模态RAG 进展

2025-02-17 作者老刘说NLP

GraphRAG，多模态RAG，这些都有一些往小了做的思路。
另外，关于推理大模型的过度思考问题也是

老刘的R1类推理大模型三部曲及RAG小课堂正式发布

2025-02-16 作者老刘说NLP

今日2025年02月16日北京晴。老刘的三部曲课程与RAG系列课堂完成，涵盖Deepseek-R1及GraphRAG等大模型知识，包括应用场景、技术原理和复现项目等内容。

Deepseek R1及Deep research复现回顾及近期前沿进展速递

2025-02-16 作者老刘说NLP

2025年02月16日，北京晴天。社区第39讲《DeepseekR1及Deepresearch复现》顺利结束，老刘报告了4小时深度讨论内容。介绍了大模型推理和复现进展，包括DeepSeek-MoE-ResourceMap、OpenR1-Math-Raw等资源库，并展示了OpenThinker-32B在MATH500测试中的表现。研究发现，长链推理的结构比内容更重要。老刘呼吁社区成员参与讨论。

Think思考用来增强RAG的Embedding？兼看推理模型使用实践建议等前沿进展

2025-02-15 作者老刘说NLP

今日为2025年2月15日星期六。文章回顾了昨日的大模型进展，包括GraphRAG、开放AI推理模型使用建议、大模型训练注意力机制等，并介绍了深度思考与RAG结合的新进展，如生成嵌入和输出thought的方法。

GraphRAG前沿之MedRAG医疗问答路线：兼看基于KG进行上下文扩展方案

2025-02-14 作者老刘说NLP

2025年02月14日，北京晴。文章介绍了MedRAG工具结合知识图谱解决医疗诊断问题，并回顾了利用知识图谱进行上下文扩展的思路和实践。

GraphRAG前沿之Graph RAG-Tool Fusion：将知识图谱用于Agent工具编排实现思路

2025-02-13 作者老刘说NLP

今天是2025年02月13日，星期四。文章介绍了使用基于知识图谱的方法来改善多智能体系统中的工具检索准确性。通过构建工具依赖关系的知识图谱并结合向量搜索和图遍历技术，可以更准确地找到用户所需的相关工具。

2025 年 6 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30