字节发布 SeedEdit 3.0,ChatGPT 企业版大升级,谷歌 Gemini 再进化! AI Weekly 6.2-8

Anthropic 突然限制 Windsurf 接入 Claude 模型,网友:真正的商战,就是这么朴实无华!

📢本周AI快讯 | 1分钟速览🚀

1️⃣ 🎨 字节跳动发布 SeedEdit 3.0 :最新 AI 图像编辑模型,可用性率达 56.1%,超越 GPT-4o 和 Gemini 2.0,已在豆包 PC 端和即梦网页端上线测试。

2️⃣ 🔍 阿里开源 Qwen3-Embedding :8B 参数模型在 MTEB 多语言榜单夺冠,得分 70.58,支持 100+ 种语言,已在 GitHub 和 Hugging Face 开放。

3️⃣ 🧠 快手推出 Auto Think 模型 :自动调整思考深度,代码生成和数学推理任务得分提升约 20 分,采用三阶段强化学习训练。

4️⃣ 📊 ChatGPT 企业版重大升级 :新增 AI 录音转录和云文件智能分析,支持 Google Drive、Dropbox 等平台,可直接从文件提取数据回答问题。

5️⃣ 💾 OpenAI 开放记忆功能 :ChatGPT 免费用户可享受轻量级记忆功能,AI 能跨对话引用近期内容,提供个性化回复。

6️⃣ 🚀 谷歌发布新版 Gemini 2.5 Pro :06-05 版本在 WebDevArena 评分达 1443 分,位居榜首,新增”可配置思维预算”功能优化资源分配。

7️⃣ ⏰ Gemini 推出定时任务 :AI Pro 和 Ultra 用户可设置自动执行任务,如每日邮件总结、周期性内容生成等。

8️⃣ 💻 Cursor 1.0 正式发布 :推出 BugBot 自动代码审查、Memories 项目记忆、一键安装 MCP 等功能,全面支持 Jupyter Notebook。

9️⃣ 🔧 Mistral Code 企业版上线 :支持 80+ 种编程语言,可本地部署,整合四款自研模型,满足企业安全合规需求。

🔟 🎬 Manus 推出文生视频 :与 OpenAI Sora 竞争,付费用户可抢先体验,支持多场景生成,Basic 版 19 美元/月起。

1️⃣1️⃣ 📝 Anthropic 推出 Claude Explains :AI 技术博客展示 Claude 内容创作能力,由 AI 生成、人类专家审校的协作模式。

1️⃣2️⃣ 🚫 Anthropic 限制 Windsurf :大幅限制 Claude 3.5/3.7 模型访问权限,用户需通过自带 API 密钥方式接入。



1. 字节跳动发布 AI 图像编辑模型 SeedEdit 3.0

6 月 6 日,字节跳动正式发布了其最新一代 AI 图像编辑模型 SeedEdit 3.0。该模型在理解用户指令和保持图像内容一致性方面表现出色,尤其在处理真实图像输入时,能够更好地遵循编辑指令并保留图像中的 ID/IP 信息。在官方测试中,SeedEdit 3.0 的可用性率达到 56.1%,显著优于前代版本 SeedEdit 1.6(38.4%)以及其他主流模型如 GPT-4o(37.1%)和 Gemini 2.0(30.3%)。

SeedEdit 3.0 引入了多项关键技术创新,包括基于元信息的图像混合策略和联合学习框架,结合扩散损失与奖励损失,提升了模型在多样化数据源上的编辑能力。此外,该模型支持中英文双语指令,能够精准理解复杂词汇和专有名词,确保编辑结果的高质量和自然美感。

目前,SeedEdit 3.0 已在字节跳动的豆包 PC 端和即梦网页端上线测试,用户只需通过简单的文字指令,即可实现如更换背景、风格转换、添加或删除特定区域元素等复杂操作。

2. 阿里通义开源 Qwen3-Embedding 与 Reranker 模型

6 月 6 日,阿里通义千问正式开源了基于 Qwen3 的文本嵌入模型 Qwen3-Embedding 及排序模型 Qwen3-Reranker,专为文本表征、语义检索与排序任务设计,显著提升多语言与跨语言处理能力。

在多项基准测试中,8B 参数规模的 Qwen3-Embedding 模型在 MTEB 多语言排行榜上位列第一,得分达 70.58,超越了多个商业 API 服务。该模型支持超过 100 种语言,包括主流自然语言和多种编程语言,具备强大的多语言、跨语言及代码检索能力。

Qwen3-Embedding 系列提供从 0.6B 到 8B 参数规模的多种模型配置,满足不同场景下的性能与效率需求。开发者可以灵活组合表征与排序模块,实现功能扩展。

目前,这些模型已在 GitHub、Hugging Face 和魔搭社区等平台上线,开发者可免费获取并用于商业部署。

3. 快手开源 Auto Think 大模型 KwaiCoder-AutoThink-preview

6 月 4 日,快手 Kwaipilot 团队正式发布并开源了名为 KwaiCoder-AutoThink-preview 的自动思考大模型,旨在解决当前大模型在处理简单任务时常出现的“过度思考”问题。该模型融合了“快思考”与“慢思考”两种能力,能够根据问题的复杂度自动调整思考深度,从而提升处理效率与准确性。

Auto Think 的核心创新在于其三阶段强化学习训练范式。首先,通过引入省略号提示词(Ellipsis Prompt)激活模型的思考模式切换能力;其次,利用带有过程监督的强化学习方法 Step-SRPO,分别优化快思考和慢思考模式下的回答质量;最后,对思维链进行精炼,使模型能够更精准地选择最优思考路径。

在实际应用中,Auto Think 在代码生成和数学推理等任务中表现出色,开启自动思考模式后,模型得分提升高达 20 分左右。目前,该模型已在 Hugging Face 平台上线,开发者可免费下载使用。

4. 企业版 ChatGPT 升级为效率利器:AI 录音与云文件分析

6 月 4 日,OpenAI 宣布对 ChatGPT 企业版进行重大更新,旨在将其打造为团队和小型企业的高效生产力工具。此次更新引入了 AI 录音转录和云文件智能分析等多项新功能,旨在提升团队协作效率。

首先,新增的“录音”功能允许用户通过点击应用中的“录音”按钮,启动一个小部件来录制音频并实时转录为文字。转录内容随后被整理成结构化笔记,包括整体摘要、关键点、行动事项和未解问题等。

此外,OpenAI 还为云存储服务推出了内置集成功能,当前已支持 Google Drive、Dropbox、OneDrive、Box 和 SharePoint 等平台。ChatGPT 现在能直接从用户文件中提取数据,回答如“去年第一季度我们的收入是多少?”或“最近的旅行报告中我使用了多少次海运?”等上下文丰富的问题。

此次更新还扩展了连接器(connector),支持连接 HubSpot、Linear 以及部分 Microsoft 和 Google 工具。此外,Pro、Team 和 Enterprise 客户还能使用 Anthropic 的 Model Context Protocol(MCP)协议,连接更多工具,进一步扩展兼容性。

5. OpenAI 向 ChatGPT 免费用户开放记忆功能

6 月 3 日,OpenAI 宣布将 ChatGPT 的记忆功能扩展至所有免费用户。此前,该功能仅限于 Plus 和 Pro 订阅用户使用。

此次更新为免费用户提供了“轻量级”记忆功能,使 ChatGPT 能够在不同对话中引用近期的聊天内容,从而提供更相关和个性化的回复。例如,如果用户曾提到自己是素食者,ChatGPT 在未来的对话中可能会自动推荐符合素食偏好的食谱。

该记忆功能主要包括两部分:

  • 保存的记忆(Saved Memories):用户可以明确要求 ChatGPT 记住特定信息,如姓名、偏好或兴趣。

  • 聊天历史引用(Chat History Reference):ChatGPT 能够利用最近的对话内容,提供更贴合上下文的回答。

用户可在设置中管理这些功能,选择启用或禁用记忆功能,删除特定记忆,或使用“临时聊天”模式,确保对话内容不被记录或引用。

6. 谷歌发布 Gemini 2.5 Pro 06-05 版本

6 月 6 日,谷歌正式发布了 Gemini 2.5 Pro 模型的 06-05 预览版本,标志着该模型进入“长期稳定版本”阶段。此次更新在多个 AI 性能基准测试中取得显著提升,进一步巩固了其在大模型领域的领先地位。

在最新的 LMArena 和 WebDevArena 测试中,Gemini 2.5 Pro 分别提升了 24 分和 35 分,WebDevArena Elo 评分达到 1443 分,位居排行榜首位。此外,该模型在 Aider Polyglot 多语言编码测试中表现优异,超过了 OpenAI 的 o3 系列和 Anthropic 的 Claude 4 Opus 等竞争对手。在 GPQA 和 Humanity’s Last Exam 等高难度测试中也展现出顶级性能。

除了性能提升,谷歌还针对用户反馈对模型进行了优化,改善了回答的风格与结构,使其在创意性、格式清晰度和响应连贯性方面表现更佳。开发者还可通过“可配置思维预算”功能,灵活控制模型在处理复杂任务时的计算资源分配,提升效率并降低资源浪费。

目前,Gemini 2.5 Pro 06-05 版本已在 Google AI Studio 和 Vertex AI 平台上线,供开发者和企业用户使用。

7. 谷歌 Gemini 推出“定时任务”功能

6 月 7 日,谷歌正式为其 AI 助理 Gemini 推出“定时任务”(Scheduled Actions)功能,进一步强化其作为智能代理的能力。该功能允许用户通过文字或语音指令,安排 Gemini 在特定时间自动执行任务,例如每天早上总结未读邮件与日程,或每周生成博客创意。用户还可以设定一次性请求,如在颁奖典礼结束后获取摘要。所有已安排的任务可在 Gemini 应用的“计划操作”页面中统一管理。

目前,“计划操作”功能面向 AI Pro 和 AI Ultra 订阅用户开放。这一新功能与 OpenAI ChatGPT 的类似功能相呼应,体现了 AI 助理从信息工具向通用执行代理的演进趋势。

此次更新是 Google 在 2025 年 I/O 大会提出的“Agent Mode”战略的一部分,旨在让 Gemini 能够理解用户需求并主动采取行动。

8. Cursor 1.0 正式发布:BugBot、Memories、一键安装 MCP

6 月 5 日,AI 编程助手 Cursor 正式发布 1.0 版本,标志着其从测试阶段迈入成熟产品阶段。此次更新引入了多项核心功能,包括自动化代码审查工具 BugBot、项目记忆系统 Memories、一键安装 MCP 服务器、全面开放的 Background Agent、对 Jupyter Notebook 的支持,以及全新的设置与仪表盘界面,全面提升开发者的使用体验。

BugBot 是本次更新的核心亮点之一,能够自动分析 GitHub 上的 Pull Request(PR),识别潜在的代码错误和问题,并在 PR 上留下详细的评论。开发者只需点击“Fix in Cursor”按钮,即可跳转至 Cursor 编辑器进行一键修复,大幅减少了手动审查的时间成本,提升了团队协作效率。

Memories 功能目前处于测试阶段,允许 Cursor 按项目自动记录关键对话内容,便于开发者在后续工作中快速调用相关上下文,提高项目连续性和工作效率。

此外,Cursor 1.0 推出了 Background Agent,一个远程编码助手,用户可通过聊天界面中的云图标或快捷键 Cmd/Ctrl+E 启用(需关闭隐私模式)。该功能现已全面开放,支持在 Jupyter Notebook 中创建并编辑多个单元格,特别适合数据科学和算法实验。目前此功能支持 Sonnet 模型,后续有望扩展至更多模型。

9. Mistral 发布企业级 AI 编程助手 Mistral Code

6 月 4 日,法国 AI 创企 Mistral 正式推出其企业级 AI 编程助手平台 Mistral Code,旨在为大型开发团队提供可部署在本地的高性能代码生成与辅助工具。该平台整合了四款自研模型,支持超过 80 种编程语言,并可根据企业私有代码库进行定制训练,满足安全性、合规性与生产力的多重需求。

Mistral Code 构建于开源项目 Continue 之上,结合企业级功能如角色权限管理、审计日志和使用分析,提供统一的开发体验。其核心模型包括:Codestral(代码自动补全)、Codestral Embed(代码检索与嵌入)、Devstral(多步骤编码任务代理)以及 Mistral Medium(对话式协助)。这些模型可在企业私有代码库上进行微调,提升对特定框架和编码风格的适应性。

Mistral Code 支持多种部署方式,包括公有云、专属云以及完全隔离的本地 GPU 环境,确保代码数据不离开企业内部系统,满足数据主权与合规要求。目前,该平台已在 JetBrains IDE 和 VS Code 上开放私测,预计不久将全面上线。

10. Manus 推出“文生视频”功能

6 月 4 日,AI 初创公司 Manus 推出其原生的“文生视频”功能,正式进军 AI 视频生成领域,与 OpenAI 的 Sora 等产品展开直接竞争。该功能目前已面向 Basic、Plus 和 Pro 等付费会员用户开放抢先体验,用户只需输入文本指令,系统即可在几分钟内生成结构清晰、故事连贯的视频内容。

Manus 的“文生视频”功能基于其自研的 AI 智能体技术,支持多场景生成,包括产品演示动画、剧情短片片段、教育科普视频等,输出内容涵盖动态分镜、场景切换、基础配音等要素。此外,Manus 提供了 Basic(19 美元/月)、Plus(39 美元/月)和 Pro(199 美元/月)三种等级的会员服务,价格略低于 OpenAI Sora 的专业版每月 200 美元。

用户反馈方面,部分用户表示,Manus 在响应提示词、生成多场景视频并整合成完整内容方面的表现优于 Sora。目前,Manus 计划在未来将该功能向所有用户开放,进一步推动 AI 视频创作的普及。

11. Anthropic 推出 AI 技术博客 Claude Explains

6 月 3 日,Anthropic 悄然上线了名为 “Claude Explains” 的博客项目,旨在展示其大语言模型 Claude 在内容创作方面的能力。该博客主要聚焦技术主题,如编程技巧、AI 应用等,内容由 Claude 生成,并由人类专家进行审校和润色,体现了 AI 与人类协作的内容创作模式。

Anthropic 表示,博客内容并非完全由 AI 自动生成,而是经过人类专家和编辑团队的多轮审阅和优化,加入了实际案例和背景知识,以确保内容的专业性和可读性。这一协作过程展示了 AI 在辅助人类工作、提升内容质量方面的潜力,而非取代人类专家。

目前,博客已发布多篇技术文章,涵盖如何使用 Claude 简化复杂代码库、优化代码效率等主题。Anthropic 计划未来扩展博客内容,涵盖创意写作、数据分析和商业策略等领域,进一步探索 AI 与人类专家协作的可能性。

12. Anthropic 限制 Windsurf 访问 Claude 模型

6 月 3 日,AI 编程工具 Windsurf 宣布,Anthropic 已大幅限制其对 Claude 3.5/3.7 Sonnet 模型的直接访问权限,且通知时间不足五天。Windsurf 首席执行官 Varun Mohan 表示,公司曾明确表示愿意支付全额费用以维持访问,但仍遭遇突如其来的限制,导致平台用户在短期内可能面临 Claude 模型的可用性问题。

此次限制发生在 OpenAI 宣布以约 30 亿美元收购 Windsurf 的消息公布后不久。业内人士普遍认为,Anthropic 此举是出于对潜在竞争对手的防范,尤其是在 Claude 模型可能被整合进 OpenAI 生态系统的背景下。Anthropic 联合创始人 Jared Kaplan 表示,公司更倾向于与未来可持续合作的客户建立长期伙伴关系,暗示不愿为可能被竞争对手收购的工具提供支持。

为应对这一挑战,Windsurf 已暂停免费和试用用户对 Claude 3.x 模型的直接访问,转而允许用户通过“自带 API 密钥”(BYOK)方式接入 Claude 模型。此外,Windsurf 推出了 Gemini 2.5 Pro 的限时优惠,以缓解 Claude 模型访问受限带来的影响。




我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用AI为你的未来加速。



(文:AI信息Gap)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往