AI 模型大爆发:字节豆包 1.6、OpenAI o3-pro、Mistral 同周登场! AI Weekly 6.9-15

📢本周AI快讯 | 1分钟速览🚀

1️⃣ 🎯 字节发布豆包大模型 1.6 :推出 豆包 1.6 系列和视频生成模型 Seedance 1.0 pro,支持 256K 上下文,综合成本下降 63%,视频生成仅需 3.67 元/条。

2️⃣ 💰 硅基流动获阿里云领投融资 :完成数亿元 A 轮融资,平台用户突破 600 万,日均 Token 生成量上千亿,将加大研发投入拓展海内外市场。

3️⃣ 🧠 OpenAI 发布最强推理模型 :正式推出 o3-pro 模型,AIME 2024 准确率达 93%,支持实时搜索、文件分析等工具,API 定价为输入 20 美元/百万 tokens。

4️⃣ 🎤 ChatGPT 语音模式大升级 :语音交互更自然,新增 50+ 语言实时翻译功能,优化对话流畅度,特别适用于国际交流场景。

5️⃣ ⏰ OpenAI 开源模型延期发布 :Sam Altman 宣布推迟至夏末,称取得”意想不到且相当惊人”的成果,目标超越 DeepSeek-R1 等顶尖开源模型。

6️⃣ 📈 OpenAI 年收入破 100 亿美元 :较 2024 年底几乎翻倍,ChatGPT 周活用户超 5 亿,设定 2029 年实现 1250 亿美元年收入目标。

7️⃣ 🚀 Mistral 推出推理模型系列 :发布 Magistral Small 和 Magistral Medium,开源版本 240 亿参数,支持多语言,推理性能提升 175%。

8️⃣ ☁️ Mistral 发布 AI 云平台 :推出 Mistral Compute,配备 18,000 块英伟达 GPU,为欧洲企业提供本地化 AI 基础设施替代方案。

9️⃣ 🍎 苹果 WWDC 发布重大更新 :推出 Liquid Glass 设计语言和升级版 Apple Intelligence,新增实时翻译等功能,但 Siri 大模型重构推迟至 2026 年。

🔟 📝 Anthropic 终止 Claude Explains :AI 博客项目仅运行一周即关闭,因透明性问题遭批评,被质疑更像自动化内容营销而非教育工具。



01|字节发布豆包大模型 1.6 与视频生成模型 Seedance 1.0

6 月 11 日,字节跳动旗下火山引擎在 FORCE 原动力大会上正式发布了 豆包大模型 1.6 和视频生成模型 Seedance 1.0 pro

豆包大模型 1.6:多模态理解与成本优化并进

豆包大模型 1.6 系列包括综合模型 doubao-seed-1.6、深度思考模型 doubao-seed-1.6-thinking 和极速模型 doubao-seed-1.6-flash,均支持最长 256K 上下文、多模态输入和图形界面操作能力。在推理、数学、代码等任务上表现优异,曾在高考数学全国卷模拟测试中取得 144 分的成绩。

定价方面,豆包 1.6 首创按输入长度区间定价模式,0–32K 输入区间的价格为输入 0.8 元/百万 tokens、输出 8 元/百万 tokens,综合成本较上一代模型下降 63%,仅为 DeepSeek R1 等竞品的三分之一,显著降低了企业使用门槛。

Seedance 1.0 pro:高质量视频生成,成本优势明显

Seedance 1.0 pro 是一款支持文本和图像输入的 AI 视频生成模型,具备无缝多镜头叙事、多动作与灵活运镜能力,能够生成 1080P 高质量视频。在多个评测中超越了 Veo3、可灵 2.0 等主流模型,登顶全球竞技场第一。

该模型的价格为每千 tokens 0.015 元,生成一条 5 秒的 1080P 视频仅需约 3.67 元,成本优势明显。



02|硅基流动完成数亿元 A 轮融资,阿里云领投

6 月 9 日,国内 AI 基础设施初创企业硅基流动(SiliconFlow)宣布完成数亿元人民币 A 轮融资,由阿里云领投,创新工场等老股东超额跟投,华兴资本担任独家财务顾问,这也是硅基流动半年内完成的第二轮融资。

硅基流动成立于 2023 年 8 月,致力于打造大模型时代的 AI 基础设施平台。其核心产品包括大模型云服务平台 SiliconCloud 和一站式工作流设计平台 BizyAir。SiliconCloud 已上线包括阿里巴巴通义千问 Qwen3DeepSeek-R1V3 等在内的上百款主流开源大模型,提供从模型精调、托管到部署的一站式解决方案。截至目前,平台总用户数突破 600 万,企业客户数达数千家,日均 Token 生成量上千亿。

此次融资将主要用于加大研发投入,拓展海内外市场,推动 AI 技术的深度应用。



03|OpenAI 发布最强推理模型 o3-pro

6 月 10 日,OpenAI 正式推出其迄今最强的推理模型 o3-pro,现已面向 ChatGPT Pro 和 Team 用户开放,并通过 API 提供服务。该模型以更强的推理能力和工具集成,专为数学、科学、编程等高复杂度任务设计,替代了此前的 o1-pro 模型。

o3-pro 特别适用于需要高可靠性和深入分析的任务,尽管响应时间较长,但在复杂问题上的表现尤为出色。

并且,该模型具备丰富的工具支持,包括:

  • 实时网页搜索
  • 文件分析(如 PDF、数据文件)
  • 图像输入推理
  • Python 代码执行
  • 基于记忆的个性化响应

在多个基准测试中,o3-pro 显示出卓越的性能。例如,在 AIME 2024 数学竞赛中,o3-pro 的准确率达到 93%,在 GPQA Diamond 博士级科学测试中为 84%,在 Codeforces 编程竞赛中获得 2748 的 Elo 分数,均优于 o3 和 o1-pro 模型。

在定价方面,o3-pro 的 API 使用费用为每百万输入 tokens 20 美元,输出 tokens 80 美元,显著高于标准版 o3 的 2 美元和 8 美元。

目前,o3-pro 尚不支持图像生成,Canvas 功能也暂未兼容,临时聊天功能因技术问题被暂时禁用。



04|ChatGPT 高级语音模式升级:更自然的 AI 语音助手

6 月 8 日,OpenAI 对 ChatGPT 的高级语音模式进行升级,显著提升了语音交互的自然度和情感表达能力,同时新增了实用的多语言翻译功能。

此次升级使 ChatGPT 的语音交互更贴近真人对话,语调更自然,语速、停顿和强调等细节处理更加细腻,能够表达同情、讽刺等多种情绪。此外,系统还优化了对话流畅度,减少了不必要的中断,并新增了暂停功能,允许用户在对话过程中整理思绪。

升级后的高级语音模式支持超过 50 种语言的实时翻译功能。用户只需在对话中请求翻译,系统即可持续提供翻译服务,直至用户要求停止或切换语言。这一功能特别适用于国际出行、远程办公和语言学习等场景,提升了跨语言交流的效率和体验。



05|OpenAI 推迟开源模型发布,Sam Altman 称“非常值得等待”

6 月 10 日,OpenAI 首席执行官 Sam Altman 在社交平台 X 上宣布,原定于 6 月发布的开源模型将推迟至夏末。他表示,团队在开发过程中取得了“意想不到且相当惊人”的成果,因此需要更多时间进行完善。Sam Altman 强调,这一延迟将带来更高质量的模型,值得用户耐心等待。

据悉,该开源模型旨在具备与 OpenAI o 系列模型相似的推理能力,目标是超越当前顶尖的开源推理模型,如 DeepSeek 的 R1 模型。在开源 AI 模型领域竞争日益激烈的背景下,OpenAI 此次延迟发布被视为确保模型性能和质量的战略举措。

Sam Altman 此前曾表示,OpenAI 在开源模型方面曾“站在了历史的错误一边”,此次发布开源模型被视为修复与开发者关系的重要一步。



06|OpenAI 年收入突破 100 亿美元,2029 年目标 1250 亿美元

OpenAI 近日被报道,其年度经常性收入(ARR)已达到 100 亿美元,较 2024 年底的 55 亿美元几乎翻倍,展现出强劲的增长势头。这一增长主要得益于 ChatGPT 的广泛应用,目前每周活跃用户超过 5 亿,付费企业客户达 300 万。值得注意的是,这一收入数据不包括来自微软的授权费用和大型一次性交易。

尽管收入增长迅猛,OpenAI 仍面临高昂的运营成本。据报道,2024 年公司亏损约 50 亿美元,主要用于模型训练、数据中心建设和高性能 GPU 的采购。为了支持未来的发展,OpenAI 于 2025 年 3 月完成了由软银领投的 400 亿美元融资,估值达到 3000 亿美元。

展望未来,OpenAI 设定了到 2029 年实现 1250 亿美元年收入的宏伟目标。这一增长将依赖于 ChatGPT 订阅服务、API 销售以及新兴的 AI 智能体等多元化产品线。公司预计,AI 智能体等新产品的收入将超过 ChatGPT,成为主要增长引擎。然而,实现这一目标需要年均增长率达到 93%,在竞争日益激烈的 AI 市场中,这一挑战不容小觑。



07|Mistral AI 推出首个推理模型系列 Magistral

6 月 10 日,法国人工智能初创公司 Mistral AI 正式发布其首个推理模型系列 —— Magistral,该系列包括两个版本:开源的 Magistral Small 和面向企业的 Magistral Medium,通过多步骤推理提升模型在数学、物理等复杂任务中的一致性和可靠性。

Magistral Small 拥有 240 亿参数,已在 Hugging Face 平台以 Apache 2.0 许可证开放下载,支持包括英语、法语、西班牙语、阿拉伯语和简体中文在内的多种语言。Magistral Medium 则为性能更强的企业级模型,目前处于预览阶段,可通过 Mistral 的 Le Chat 聊天平台、公司 API 以及第三方合作伙伴云平台访问。

Magistral 系列模型采用了 Mistral 自研的强化学习(RL)训练框架,从零开始训练,未依赖其他预训练模型的数据蒸馏。在 AIME-24 等推理基准测试中,Magistral Medium 的表现相比基础模型有显著提升,正确率提升近 175%。

尽管在部分基准测试中,Magistral 的表现尚未超过 OpenAI 的 o3 模型和谷歌的 Gemini 2.5 Pro,但其在多语言支持、推理速度和可解释性方面的优势,使其在欧洲市场具有独特的竞争力。



08|Mistral 推出 AI 云平台 Mistral Compute

6 月 11 日,法国初创企业 Mistral AI 在巴黎 VivaTech 科技大会上正式发布 AI 云平台 Mistral Compute,从 AI 模型开发商转型为全面的 AI 基础设施提供商,为欧洲企业和政府提供替代 AWS、Azure 等美国云服务的本地化解决方案。

Mistral Compute 是一个集成式 AI 平台,提供从裸金属 GPU 到全托管 PaaS 的多样化服务,支持用户构建和部署定制化的 AI 工作负载。该平台首个数据中心位于法国埃松省,配备 18,000 块英伟达最新 Grace Blackwell GPU,未来将扩展至 100 兆瓦规模。Mistral 还计划在全球范围内拓展基础设施,特别是在欧洲、中东、亚洲和南半球市场,以满足对主权 AI 和本地数据合规性的需求。

法国总统马克龙在发布会上称这一合作为“历史性”,强调其对欧洲数字主权和可持续发展的重要意义。



09|苹果 WWDC 2025:Liquid Glass UI + Apple Intelligence 升级

在 6 月 9 日开幕的 WWDC 2025 上,Apple 宣布了其近年来最重大的软件更新,包括全新的 Liquid Glass 设计语言和升级版的 Apple Intelligence AI 系统。然而,备受期待的 Siri 大模型重构仍未完成,正式发布时间尚未公布。

Apple 推出的 Liquid Glass 是一套全新的用户界面设计语言,融合了玻璃的光学特性与液体的流动感。该设计语言将应用于 iOS 26、iPadOS 26、macOS Tahoe、watchOS 26 和 tvOS 26 等操作系统,带来半透明、动态响应的 UI 元素,提升用户的视觉体验。

Apple Intelligence 是 Apple 推出的 AI 系统,此次升级引入了实时翻译功能,支持在 Messages、FaceTime 和 Phone 等应用中进行语音和文本的即时翻译。该功能完全在设备端处理,确保用户隐私不被泄露。此外,Apple Intelligence 还新增了智能通话筛选、Hold Assist 等功能,提升了用户在日常使用中的便利性。例如,Hold Assist 功能可以在用户拨打客户服务电话时,自动检测等待音乐,并在接通时提醒用户,节省等待时间。

尽管 Apple 在 WWDC 2025 上展示了多项 AI 相关功能,但备受关注的 Siri 大模型重构仍未完成。Apple 软件工程高级副总裁 Craig Federighi 表示,新的 Siri 需要更多时间来达到高质量标准,预计将在未来一年内分享更多细节。这意味着,Siri 的重大升级可能要等到 2026 年才能正式推出。



10|Anthropic 终止 Claude Explains 博客试点项目

6 月初,Anthropic 悄然关闭了其名为 Claude Explains 的 AI 博客项目,该项目上线仅一周便被终止。该博客旨在展示其大语言模型 Claude 的内容生成能力,初期发布了诸如“如何使用 Claude 简化复杂代码库”等技术主题的文章。尽管内容由人类编辑审校,但博客页面已被重定向至 Anthropic 官网,原始内容亦被移除。

Claude Explains 被定位为一项试点项目,旨在结合用户对“技巧与建议”类内容的需求与公司的市场营销目标。Anthropic 表示,该博客由主题专家和编辑团队监督,旨在展示人类专业知识与 AI 能力的协同工作方式,而非取代人类专家。

然而,该博客在社交媒体上遭遇了透明性方面的批评。用户质疑博客内容中 AI 与人类编辑的具体贡献比例,认为其更像是自动化内容营销的尝试,而非真正的教育工具。尽管在短暂的运行期间内,Claude Explains 吸引了超过 24 个网站的链接,但这些初步的关注并未能挽救该项目的命运。




我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用AI为你的未来加速。



(文:AI信息Gap)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往