2025年3月25日11时 - 第11页共12页

DeepSeek昨夜上新！新旧版V3对比实测，代码能力飙升，震惊海外用户

2025年3月25日11时作者智东西

DeepSeek上线新版本DeepSeek-V3-0324，参数增加至6850亿，性能提升显著。新版模型允许商用和模型蒸馏等行为，并在代码、数学等方面表现出色，引发网友期待R2和V4的发布。

2025年3月25日11时作者新智元

了。
参数量685B的V3，代码数学推理再次显著提升，甚至代码追平Claude 3.7，网友们实测后

2025年3月25日11时作者智东西

新模型Qwen2.5-VL-32B-Instruct在视觉理解和数学推理方面表现出色，并且其纯文本能力优于GPT-4o mini。该模型已在GitHub和Hugging Face上开源，可用于多种场景，包括对图片的理解、解决复杂的数学问题等。

2025年3月25日11时作者新智元

本文介绍了当前科研人员青睐的AI模型：o3-mini、DeepSeek-R1、Llama、Claude 3.5 Sonnet和Olmo 2。它们各有优劣，但为科研人员提供了多样选择。

2025年3月25日11时作者 AIGC开放社区

专注AIGC领域的专业社区，盘点2025年3月及以前获得1亿美元以上融资的9家大模型企业及其产品特点。

2025年3月25日11时作者 AIGC开放社区

阿布扎比财富基金ADQ与Energy Capital Partners合作250亿美元建AI数据中心发电厂

2025年3月25日11时作者机器之心

大学奥斯丁分校
最新评测基准 SPIN-Bench，用一套 “组合拳” 暴击了大模型的软肋。
研究显

2025年3月25日11时作者 AIGC开放社区

DeepSeek发布V3-0324模型，代码能力媲美闭源最强模型Claude 3.7。该模型速度快、免费且开源，采用创新策略平衡专家负载和路由机制，性能表现优异。

2025年3月25日11时作者 AI寒武纪

Sam Altman 推出的 DeepSeek v3 版本在编程能力和前端表现方面超越了 Claude 3.7，并且没有做任何宣传就上传至 Hugging Face。实测显示，DeepSeek v3 在多个任务上的表现都非常出色，包括赛朋克风格的贪吃蛇游戏和天气卡片生成任务。

2025年3月25日8时作者 NLP工程化

5个开源框架用于智能体记忆：Graphiti构建时间感知的知识图谱；Letta提供透明且长期记忆状态的智能体；Mem0结合LLM和向量存储技术主动学习适应变化；Memary赋予AI类似人类的记忆能力；Cognee将知识图谱与RAG结合维护动态知识图谱。