开源模型归档 - 第2页共10页 - 每时AI

Sam Altman:即将推出远超预期的开源模型，ChatGPT记忆功能正在实现《Her》的愿景

2025年6月22日8时作者 AI寒武纪

Sam Altman 在旧金山与YC CEO对话中分享了关于OpenAI的未来、AGI愿景以及下一代技术浪潮的观点。他透露即将发布一个远超预期的开源模型，并且明确指出了GPT-5及多模态超级模型的发展方向，强调不要复制ChatGPT而是创造真正缺失的东西。

DeepSeek又冲上第一！

2025年6月17日23时作者智东西

新版DeepSeek-R1在编程能力榜单上冲至第一，并且在文本领域开源模型中排名第一。

月之暗面又开源了！登顶全球第一，还超了新版DeepSeek-R1

2025年6月17日16时作者智东西

Kimi-Dev-72B是首个在SWE-bench Verified编程基准测试中取得全球最高开源模型成绩的代码大模型，参数量仅为72B。通过大规模强化学习优化，Kimi-Dev-72B不仅能在错误修复和单元测试方面表现出色，还支持自我博弈机制以同时担任BugFixer和TestWriter的角色。

炸裂！MiniMax推出全球最长上下文推理模型M1：512张H800三周完成训练，成本仅54万美金

2025年6月17日11时作者 AI寒武纪

MiniMax举办开源周活动，正式发布最新推理模型MiniMax-M1，支持100万token输入与8万token输出，参数量达4560亿。通过大规模强化学习训练，仅耗资53.47万美元。该模型采用混合注意力架构和闪电注意力机制，显著提升推理效率，并在复杂任务中表现突出。

刚刚，LMArena最新模型榜单出炉！DeepSeek-R1网页编程能力赶超了Claude Opus 4

2025年6月17日11时作者机器之心

DeepSeek 更新其R1推理模型至0528版本，提升性能并参加LMArena大模型公共基准测试平台的排行榜，DeepSeek-R1（0528）在文本、编程、数学等多个领域排名领先。

通义实验室最新成果WebDancer：开启自主智能DeepResearch的新时代

2025年6月13日14时作者机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

多模态推理新基准！最强Gemini 2.5 Pro仅得60分，复旦港中文上海AILab等出品

2025年6月6日23时作者量子位

复旦大学及香港中文大学MMLab联合上海人工智能实验室等多家单位提出了MME-Reasoning，全面评估多模态大模型的推理能力。该基准分为三类推理：演绎、归纳和溯因，并涵盖三种问题类型。评测结果显示当前最优模型得分仅60%左右，显示了对逻辑推理能力的要求极高。

Anthropic“断供”Windsurf，硅谷也玩“二选一”

2025年6月5日11时作者硅星人Pro

时间。”
这是Windsurf CEO Varun Mohan在当地时间6月4日发布的一条略显无奈的

小米又发新模型！MiMo-VL多模态模型开源，仅7B参数部分性能直逼R1、o3-mini

2025年5月30日23时作者头部科技

小米大模型Core团队推出多模态开源模型MiMo-VL-7B系列，该模型在视觉理解和推理任务中表现出色，并在多个数学竞赛中超越了Qwen2.5-VL-7B和DeepSeek等同级别模型。