PaperAgent

4大类AI Agent协议框架全面综述

下午7时 2025/04/27 作者 PaperAgent

对现有的AI Agent通信协议进行了分类和概述，分为上下文导向型和代理间通信型两大类，并细分为通用型和特定领域型。通过具体案例分析了不同协议的工作流程和适用场景。

分类分享标签 Agora、 AI Agent、 ANP、 MCP、上下文导向型、代理间通信型发表评论

字节ReTool：用于大模型中战略性工具使用的强化学习

下午7时 2025/04/26 作者 PaperAgent

通过强化学习增强推理能力的ReTool在AIME2024上达到67.0%准确率，在与先进模型结合后进一步提升至72.5%，显著优于基线。

分类分享标签 400个、准确率、字节、工具集成学习、强化学习、长形式推理发表评论

一篇142页全面复盘DeepSeek R1思考推理技术综述

下午7时 2025/04/26 作者 PaperAgent

通过分类体系分析DeepSeek-R1的推理模块及其在不同任务中的表现，揭示了推理链条的结构一致性、反刍行为和长度对性能的影响，并发现存在一个“最佳点”来优化模型性能，同时探讨了长文本处理与人类认知负荷的关系。

分类分享标签 DeepSeek-R1、 Garden path sentences、上下文管理、复杂问题、多样性、最佳推理长度发表评论

380篇文献！首份Agentic大模型最新技术综述

下午2时 2025/04/25 作者 PaperAgent

和
交互
的能力，基于此对相关技术进行综述，并提出了一个
研究议程
，指导未来研究方向。
Agent

分类分享标签 AI Agents、 Workflow、协作、插件、编排、记忆发表评论

53.2k星，微软开源的MarkItDown接入MCP，文档一键转换Markdown！

下午2时 2025/04/25 作者 PaperAgent

微软发布MarkItDown Python工具用于将文件和文档转换为Markdown格式，提供MCP服务器支持与LLM应用程序集成。

分类分享标签 LLM、 MarkItDown、 Python、 SSE、微软、服务器接口发表评论

ICLR 2025杰出论文解读：中科大LLM编辑、DeepMind安全对齐、LLM微调学习动态

下午2时 2025/04/24 作者 PaperAgent

ICLR 2025杰出论文奖揭晓。包括普林斯顿大学、Google DeepMind等机构的论文在内，共评选出3篇杰出论文和3篇荣誉提名论文，涵盖安全对齐、学习动态及模型编辑等多个方向的研究成果。

分类分享标签 ICLR、学习动态、安全对齐、微调目标、杰出论文奖、模型编辑发表评论

ICLR 2025杰出论文揭晓：中科大LLM编辑、DeepMind安全对齐、LLM微调学习动态

下午7时 2025/04/23 作者 PaperAgent

ICLR 2025杰岀论文奖揭晓！3篇杰出论文涵盖安全对齐、语言模型学习动态和编辑等方面的研究成果，强调了当前大型语言模型存在的问题及潜在解决方案。

分类分享标签 Google DeepMind、 Safety Alignment、中国科学技术大学、增强方法、新加坡国立大学、普林斯顿大学发表评论

Model Context Protocol (MCP) is a standardized interface aimed at achieving seamless interaction between AI models and external tools and resources, breaking down data silos and enhancing interoperability across different systems. MCP’s core components include the MCP host, client, and server, working together to enable secure and efficient communication with AI applications and external data sources. It covers lifecycle stages like creation, operation, and updates of MCP servers, along with an ecosystem including key adopters such as Anthropic, OpenAI, and community-driven platforms. This protocol also discusses security threats at each stage and proposed mitigation strategies.