老刘归档 - 第3页共5页

清明假期大模型技术进展回顾：llama4大模型、EasyControl吉卜力风格开源模型及LLM后训练技术总结

下午2时 2025/04/07 作者老刘说NLP

今日介绍请清明假期大模型进展，涵盖Llama4开源评测及吉卜力风格图像生成模型EasyControl_Ghibli，指出中文支持效果不佳，建议谨慎使用。同时总结了多模态微调与继续预训练讨论，并推荐相关技术文章阅读。

Deepresearch核心技术：如何通过强化学习增强推理大模型搜索规划及反馈能力？

下午2时 2025/04/05 作者老刘说NLP

复现和应用越来越多，也对大模型的规划能力有了越来越多的要求。
假设大模型能力很强，我们可以使用
Co

视觉多模态RAG技术总结及Vision-R1用于目标检测任务的奖励函数设计

下午2时 2025/03/26 作者老刘说NLP

2025年3月26日，北京天气阴。文章讨论了多模态RAG技术在视觉领域和目标检测中的应用，并介绍了GPT-4发布的新功能及OpenAI承认的技术风险。同时，文章还提到了Vision-R1方案及其强化学习奖励函数设计。

也看基于版式分析的PDF文档翻译项目及文档版式分析模型PP-DocLayout

下午2时 2025/03/25 作者老刘说NLP

今天是2025年3月25日，星期二。文章介绍了两个文档相关的项目，一个是基于版式分析的PDF文档翻译项目Fast_pdf_trans和PDFMathTranslate，另一个是文档版式分析模型PP-DocLayout。PP-DocLayout能够检测多种类型的文档，并且其三种不同比例的模型在处理复杂布局方面表现良好。而PDFMathTranslate则使用Pdfminer.six等库解析PDF文档，保留了排版信息进行翻译。