公司深度报告自动生成company-research-agent框架及PP-DOCBEE文档大模型数据合成策略解析
今天是2025年5月6日,星期二,北京晴。文章介绍了两个项目:一是Deepresearch变体之公司报告自动生成company-research-agent的实现拆解,二是多模态文档大模型PP-DOCBEE的数据合成策略。前者着重于工程设计和流程细节,后者则关注数据合成的具体方法和技术。
今天是2025年5月6日,星期二,北京晴。文章介绍了两个项目:一是Deepresearch变体之公司报告自动生成company-research-agent的实现拆解,二是多模态文档大模型PP-DOCBEE的数据合成策略。前者着重于工程设计和流程细节,后者则关注数据合成的具体方法和技术。
今日2025年4月28日星期日,北京晴。简述Deepresearch与RAG进展及DeepSeek-R1实验模型。DeepWiki为GitHub仓库提供AI驱动的实时交互式文档;Chatwiki为企业打造智能客服机器人问答系统,支持多级权限控制和多种数据导入方式。介绍DeepSeek-R1T-Chimera微调模型,相比原始版本运行速度更快,输出标记数量减少40%。
2025年4月24日北京晴。文章探讨了检索增强生成(RAG)与推理(Reasoning)结合的必要性及实现范式,并总结了Agents、RAG产品及大模型安全的相关研究。
今天是2025年4月20日,星期日,北京,晴。文章介绍了NodeRAG优化方案在图维度上的应用及其具体实现细节,包括异构图的定义、节点类型和增强方法,展示了其如何提高检索和理解的精确性和层次化能力,并分析了实际部署时的数据占用情况。
2025年4月19日,北京晴天。关于多模态文档RAG系统的文章介绍了其在处理文档时的优势,如保留布局结构、表格完整性及视觉元素等,并分享了开源框架demo和AI搜索案例的实现方式。LAYRA框架支持PDF批量上传和解析功能,而ReZero通过强化学习优化LLM搜索性能。
G的花式变体及落地建议》,回放链接见社区群。
在本次分享中,尝试回答了以下问题:
目前RAG都有哪些
度依赖开源,开源大多数只能赶凑合,能快速上线,但是带来的风险是会黑盒化,不可控。我们如果要开发自己的