对标OpenAI,谷歌开源Agent SDK,支持MCP、A2A、5000星

谷歌在Google Cloud Next大会上发布了首个智能体开发套件—ADK。此套件能简化开发复杂流程的智能体,支持双向音频、视频及最新的A2A协议,并兼容超过200个第三方模型。ADK简单介绍仅需6行代码即可实现问答智能体开发。Agent Engine则负责部署和管理智能体,提供短期记忆功能,确保智能体会话连续性,还提供了Vertex AI评估工具以优化智能体性能。

实时回放+全链路监控!AgentOps如何让AI代理告别“人工智障”?

AgentOps 是一个开源平台,为 AI 代理开发、评估和监控提供一站式解决方案。它支持多种主流 AI 框架,并能与 LLM 提供商无缝集成。核心功能包括会话回放与分析、LLM 成本管理、性能监控、安全与合规性以及框架集成等。

更精细的解耦评估!VisualSimpleQA开创视觉语言大模型事实问答评测新范式

VisualSimpleQA 提出了一个面向事实查询的多模态评测基准,旨在有效评估大型视觉语言模型(LVLMs)在事实问答任务中的表现。该基准采用了解耦评估框架和明确的样本难度标准,能够区分不同模型的表现,并揭示了当前前沿 LVLMs 在视觉和语言模块上的改进空间。