老刘说NLP，作者每时AI

也看大模型排行榜Chatbot Arena的评估结论及MiMo-7B推理大模型实现思路

2025年5月3日14时作者老刘说NLP

题。
最近看到一句话，很有感触，
真正的技术护城河是：十年如一日的苦活、脏活、累活，说不清、道不明的

Qwen3的混合思考模式再探析及推理大模型系列专题指引

2025年4月30日14时作者老刘说NLP

前大家在纠结R1过度思考等问题，做了许多工程化改造，但是Qwen3模型一更新，在这个技术洪流之下，又

DeepWiki、Chatwiki及DeepSeek-R1T-Chimera进展

2025年4月29日14时作者老刘说NLP

今日2025年4月28日星期日，北京晴。简述Deepresearch与RAG进展及DeepSeek-R1实验模型。DeepWiki为GitHub仓库提供AI驱动的实时交互式文档；Chatwiki为企业打造智能客服机器人问答系统，支持多级权限控制和多种数据导入方式。介绍DeepSeek-R1T-Chimera微调模型，相比原始版本运行速度更快，输出标记数量减少40%。

MCP技术总结及推理大模型强化学习机制分析

2025年4月27日14时作者老刘说NLP

今日记录了MCP相关进展及语音大模型和推理大模型的最新情况，包括Kimi开源语音模型、关于推理能力实证分析的研究，以及Model Context Protocol (MCP) 的综述等内容。

GraphRAG如何用于Agent做memory记忆管理？Graphiti实现解读及相关技术进展回顾

2025年4月26日14时作者老刘说NLP

0250425技术进展早报，社区讨论不少，外部的技术进展也有一些，可看看。
另一个是对GraphRA

金融领域推理大模型DianJin-R1、Fin-R1及文档转markdown、docx的多模态大模型做法

2025年4月25日14时作者老刘说NLP

今天是2025年4月25日，星期五，北京晴。文章讨论了多模态模型如何将文档图片转为markdown和docx的逻辑，并介绍了Qwen2VL、internvl、GOT-OCR及docling等模型的具体使用方式。此外，还探讨了金融领域推理模型进展，特别关注DianJin-R1的工作，强调数据质量和强化学习在提升模型性能中的重要性。