老刘说NLP，作者每时AI

RAG-Challenge金融年报问答竞赛冠军方案思路：从文档解析、提示词到路由逻辑设计

2025年4月12日19时作者老刘说NLP

些思路值得参考，
尤其是文档处理，提示词的设计、路由的设计以及针对表格处理逻辑
。
抓住根本问题，做

大模型落地及Agent记忆的有趣观点：兼看SVG生成用多模态大模型怎么做？

2025年4月11日14时作者老刘说NLP

今天是2025年4月11日，周五。文章讨论了大模型落地以及Agent记忆的有趣观点和SVG生成用多模态大模型的方法。其中提到企业转型最缺懂业务的变革翻译官、需要专注场景且避免技术参数导向ROI等观点；同时介绍了三种基于多模态大模型进行SVG生成的工作及其技术细节。

多模态RAG及多模态R1推理中如何为不同的视觉数据生成描述Caption？OMNICAPTIONER实现思路

2025年4月10日14时作者老刘说NLP

度依赖开源，开源大多数只能赶凑合，能快速上线，但是带来的风险是会黑盒化，不可控。我们如果要开发自己的

多模态RAG及SQLRAG方案总结、大模型应用中的追问及Agent操作UI逻辑思考

2025年4月9日14时作者老刘说NLP

T4O引导追问以及Agent操作电脑、手机屏幕的思考，这是具体的落地问题
。
另一个是
大模型相关技

知识图谱+知识库RAG项目Yuxi-Know及大模型推理内部可视化工具OpenMAV实现拆解

2025年4月8日14时作者老刘说NLP

经讲过多次了，例如，《
大模型黑盒探秘：通过“电路追踪”（Circuit Tracing）揭示大模型

清明假期大模型技术进展回顾：llama4大模型、EasyControl吉卜力风格开源模型及LLM后训练技术总结

2025年4月7日14时作者老刘说NLP

今日介绍请清明假期大模型进展，涵盖Llama4开源评测及吉卜力风格图像生成模型EasyControl_Ghibli，指出中文支持效果不佳，建议谨慎使用。同时总结了多模态微调与继续预训练讨论，并推荐相关技术文章阅读。

Llama4模型四点核心总结及大模型推理数据合成工具Project Loong

2025年4月6日14时作者老刘说NLP

经有了
很多标题党开始说RAG原地失业以及引领多模态的论调了，这并不好
，需要公正的看待这个模型本身

Deepresearch核心技术：如何通过强化学习增强推理大模型搜索规划及反馈能力？

2025年4月5日14时作者老刘说NLP

复现和应用越来越多，也对大模型的规划能力有了越来越多的要求。
假设大模型能力很强，我们可以使用
Co

表格RAG可以怎么做？推理大模型存在“心口不一”？

2025年4月4日14时作者老刘说NLP

事。
一个是推理大模型存在“心口不一”现象，实验如何做的？结论如何看？
一个是表格RAG应该怎么做？

RAG技术于视频文章生成及东方语种+汉语方言识别Dolphin实现思路解析

2025年4月3日19时作者老刘说NLP

2025年4月3日，北京天气晴朗。《Large Language Models Pass the Turing Test》评测了四个系统的表现，发现添加人设提示可以显著提升AI模型被误认为人类的比例。关于RAG和语音识别技术，文章介绍了WIKIVIDEO视频文章生成方案及面向东方语言的Dolphin语音大模型开源方案。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30