PaperAgent

给MCP加上RAG，工具准确率提升200%，起飞~

下午7时 2025/05/07 作者 PaperAgent

大型语言模型在利用外部工具方面遇到提示膨胀和选择复杂性的挑战，引入了RAG-MCP框架通过检索增强生成技术解决这些问题，显著提高工具选择准确性并减少提示大小和token数量。

下午7时 2025/05/06 作者 PaperAgent

RLMs的最新发展及其复现研究总结，强调监督微调和基于可验证奖励的强化学习方法的重要性，并讨论了数据构建、训练策略和奖励设计的关键要素。

下午7时 2025/05/05 作者 PaperAgent

s
）显著扩展了LLMs以处理视觉、音频和视频等多种模态，但在多模态输入之间
实现稳健的推理
仍然是

下午2时 2025/05/03 作者 PaperAgent

Agentic RAG-R1 是由北京大学研发的一项开源研究项目，通过引入强化学习策略（GRPO），构建了一个可自我规划、检索、推理与总结的智能体式 RAG 系统，显著提升了语言模型的自主性和效率。

下午7时 2025/05/02 作者 PaperAgent

TreeHop研究提出了一种全新的多跳问答解决方案，通过在嵌入空间中完成推理，实现99%的延迟降低和5%-0.4%的模型参数量减少，显著提高效率，并能在工业场景中高效部署。

下午2时 2025/04/30 作者 PaperAgent

RAG与推理之间的协同作用
进行了系统性的综述，明确了“推理”在RAG背景下的定义。构建了一个全面的

下午2时 2025/04/29 作者 PaperAgent

Qwen3即将发布，包含多种尺寸的超大规模语言模型。最新消息显示Qwen3已经在凌晨5点正式开源。

下午2时 2025/04/29 作者 PaperAgent

PaperCoder 是一个多智能体的 LLM 系统，通过规划、分析和生成三个阶段将机器学习论文转化为可运行的代码库，并在多个会议论文上进行了评估，表现出色且超越现有基线。

下午7时 2025/04/27 作者 PaperAgent

DeepSeek R2泄露信息：1.2T参数、混合MoE架构；5.2PB训练数据，在C-Eval 2.0上达到89.7%的准确率；52%利用率华为昇腾910B芯片；价格仅为GPT-4o十分之一。

下午7时 2025/04/27 作者 PaperAgent

对现有的AI Agent通信协议进行了分类和概述，分为上下文导向型和代理间通信型两大类，并细分为通用型和特定领域型。通过具体案例分析了不同协议的工作流程和适用场景。