开源平台
对标OpenAI,谷歌开源Agent SDK,支持MCP、A2A、5000星
谷歌在Google Cloud Next大会上发布了首个智能体开发套件—ADK。此套件能简化开发复杂流程的智能体,支持双向音频、视频及最新的A2A协议,并兼容超过200个第三方模型。ADK简单介绍仅需6行代码即可实现问答智能体开发。Agent Engine则负责部署和管理智能体,提供短期记忆功能,确保智能体会话连续性,还提供了Vertex AI评估工具以优化智能体性能。
实时回放+全链路监控!AgentOps如何让AI代理告别“人工智障”?
AgentOps 是一个开源平台,为 AI 代理开发、评估和监控提供一站式解决方案。它支持多种主流 AI 框架,并能与 LLM 提供商无缝集成。核心功能包括会话回放与分析、LLM 成本管理、性能监控、安全与合规性以及框架集成等。
更精细的解耦评估!VisualSimpleQA开创视觉语言大模型事实问答评测新范式
VisualSimpleQA 提出了一个面向事实查询的多模态评测基准,旨在有效评估大型视觉语言模型(LVLMs)在事实问答任务中的表现。该基准采用了解耦评估框架和明确的样本难度标准,能够区分不同模型的表现,并揭示了当前前沿 LVLMs 在视觉和语言模块上的改进空间。
赶紧放弃强化学习?!Meta 首席 AI 科学家杨立昆喊话:当前推理方式会“作弊”,卷大模型没有意义!
这样的困境:它们基于深度学习架构,通过在大规模数据上进行预训练、调整参数,看似构建起了对世界的“理解