开源平台归档

刚刚，DeepSeek开源新版R1，媲美OpenAI最高o3模型

上午8时 2025/05/29 作者 AIGC开放社区

今天凌晨，全球开源大模型平台DeepSeek发布了R1最新0528版本。其性能媲美OpenAI最新的o3模型高版本，并且具备与o3相似的风格和功能。

重磅解读！AI Agent 是大模型的终极落点？42页深度剖析来了！

下午2时 2025/05/16 作者 AI技术研习社

大模型新形态AI Agent正在崛起，它能自主执行任务、迭代学习，并通过LLM+规划+记忆+工具调用等模块协同工作。AI Agent未来可应用于自动化和拟人化两大方向，提升效率或满足情感需求，成为数字拍档。

社区供稿 | 阶跃星辰开源图像编辑模型 Step1X-Edit: 人人都能用的“改图大师”！

下午2时 2025/04/30 作者 Hugging Face

阶跃星辰发布开源图像编辑大模型 Step1X-Edit，具备语义理解、保持身份一致性及精准控制能力，支持11类图像编辑任务。其架构结合了MLLM与Diffusion技术，在多个指标上超越现有开源模型，已在官网上线供用户体验。

连Claude 3.5都败下阵来，大语言模型能否定位软件服务的故障根因？

下午4时 2025/04/22 作者机器之心

数据科学学院的贺品嘉教授和微软主管研究员何世林博士。贺品嘉老师团队的研究重点是
软件工程、LLM f

对标OpenAI，谷歌开源Agent SDK，支持MCP、A2A、5000星

上午11时 2025/04/14 作者 AIGC开放社区

谷歌在Google Cloud Next大会上发布了首个智能体开发套件—ADK。此套件能简化开发复杂流程的智能体，支持双向音频、视频及最新的A2A协议，并兼容超过200个第三方模型。ADK简单介绍仅需6行代码即可实现问答智能体开发。Agent Engine则负责部署和管理智能体，提供短期记忆功能，确保智能体会话连续性，还提供了Vertex AI评估工具以优化智能体性能。

实时回放+全链路监控！AgentOps如何让AI代理告别“人工智障”？

下午2时 2025/04/08 作者小兵的AI视界

AgentOps 是一个开源平台，为 AI 代理开发、评估和监控提供一站式解决方案。它支持多种主流 AI 框架，并能与 LLM 提供商无缝集成。核心功能包括会话回放与分析、LLM 成本管理、性能监控、安全与合规性以及框架集成等。

Neuronpedia：开源的神经元可解释性平台

上午8时 2025/04/08 作者 NLP工程化

Neuronpedia 是一个开源的神经元可解释性平台，支持多种AI模型和数据集，并提供丰富的可视化功能。

更精细的解耦评估！VisualSimpleQA开创视觉语言大模型事实问答评测新范式

下午4时 2025/03/20 作者 PaperWeekly

VisualSimpleQA 提出了一个面向事实查询的多模态评测基准，旨在有效评估大型视觉语言模型（LVLMs）在事实问答任务中的表现。该基准采用了解耦评估框架和明确的样本难度标准，能够区分不同模型的表现，并揭示了当前前沿 LVLMs 在视觉和语言模块上的改进空间。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30