给MCP加上RAG,工具准确率提升200%,起飞~
大型语言模型在利用外部工具方面遇到提示膨胀和选择复杂性的挑战,引入了RAG-MCP框架通过检索增强生成技术解决这些问题,显著提高工具选择准确性并减少提示大小和token数量。
大型语言模型在利用外部工具方面遇到提示膨胀和选择复杂性的挑战,引入了RAG-MCP框架通过检索增强生成技术解决这些问题,显著提高工具选择准确性并减少提示大小和token数量。
RLMs的最新发展及其复现研究总结,强调监督微调和基于可验证奖励的强化学习方法的重要性,并讨论了数据构建、训练策略和奖励设计的关键要素。
Agentic RAG-R1 是由北京大学研发的一项开源研究项目,通过引入强化学习策略(GRPO),构建了一个可自我规划、检索、推理与总结的智能体式 RAG 系统,显著提升了语言模型的自主性和效率。
TreeHop研究提出了一种全新的多跳问答解决方案,通过在嵌入空间中完成推理,实现99%的延迟降低和5%-0.4%的模型参数量减少,显著提高效率,并能在工业场景中高效部署。
PaperCoder 是一个多智能体的 LLM 系统,通过规划、分析和生成三个阶段将机器学习论文转化为可运行的代码库,并在多个会议论文上进行了评估,表现出色且超越现有基线。
DeepSeek R2泄露信息:1.2T参数、混合MoE架构;5.2PB训练数据,在C-Eval 2.0上达到89.7%的准确率;52%利用率华为昇腾910B芯片;价格仅为GPT-4o十分之一。
对现有的AI Agent通信协议进行了分类和概述,分为上下文导向型和代理间通信型两大类,并细分为通用型和特定领域型。通过具体案例分析了不同协议的工作流程和适用场景。