DeepSeek恢复充值，OpenAI发布GPT-4.5，Claude 3.7重磅来袭！ AI Weekly 2.24-3.2

📢本周AI快讯 | 1分钟速览🚀

1️⃣ 💰 DeepSeek 重开 API 充值 ：推出错峰优惠，V3 模型可享50%折扣，R1 模型高达75%折扣，优惠时段为每日00:30至08:30。

2️⃣ 📈 DeepSeek 利润率惊人 ：理论利润率高达545%，基于大规模跨节点专家并行技术，优化资源利用和性能。

3️⃣ 🧠 阿里 Qwen 推出”深度思考” ：Qwen Chat 平台新增QwQ功能，基于 Qwen2.5-Max 推理模型，支持联网搜索，计划开源。

4️⃣ 💻 腾讯元宝电脑版发布 ：支持 Windows 和 macOS，基于混元 turbo，可切换 DeepSeek-R1 模型，与腾讯生态无缝衔接。

5️⃣ 📱 OPPO 接入 DeepSeek-R1 ：ColorOS 系统正式接入满血版R1模型，覆盖40余款 OPPO 及一加机型，支持 AI 唤醒和语音交互。

6️⃣ 🔹 vivo 上线 DeepSeek-R1 ：蓝心小V升级至5.2.1.22版本后可体验，支持深度思考和联网搜索，新增作业助手智能体。

7️⃣ 🔍 豆包测试自研推理模型 ：字节跳动未接入 DeepSeek-R1，而是选择自研深度思考模型，已开始小范围灰度测试。

8️⃣ 🌐 夸克 AI 搜索增强 ：正式接入阿里自研”深度思考”推理模型，提升复杂问题的理解和推理能力。

9️⃣ 🚀 百度文心 4.5 将发布 ：3月16日正式亮相，引入原生多模态和深度思考能力，计划6月30日起正式开源。

1️⃣0️⃣ ✨ OpenAI 发布 GPT-4.5 ：幻觉现象显著减少，准确率提升至62.5%，情商和创造力增强，目前仅向 Pro 用户开放。

1️⃣1️⃣ 📊 Deep Research 功能扩展 ：OpenAI 向 ChatGPT Plus 用户开放，每月10次查询机会，支持嵌入图像和增强文件理解。

1️⃣2️⃣ 🎤 ChatGPT 语音免费开放 ：高级语音模式向免费用户开放，基于 GPT-4o mini 模型。

1️⃣3️⃣ 🤖 Anthropic 推出混合推理模型 ：Claude 3.7 Sonnet 集成快速响应与深度思考能力，推出 Claude Code 辅助编码工具。

1️⃣4️⃣ 🔄 Claude GitHub 集成全面开放 ：包括免费用户、Pro 用户和团队用户，可直接同步代码库提升开发效率。

1️⃣5️⃣ 🧩 Gemini “全局记忆”免费化 ：谷歌向免费用户开放全局记忆功能，AI 能记住所有对话提供个性化回复。

1️⃣6️⃣ 👨‍💻 Gemini Code Assist 个人版 ：谷歌推出免费编程工具，每月提供18万次代码补全，支持所有编程语言。

1. DeepSeek 恢复 API 充值服务并推出错峰优惠

2 月 25 日，DeepSeek 宣布重新开放其 API 充值服务，并在特定时段提供最高达 75% 的折扣优惠。

错峰时段优惠

为鼓励开发者在服务器负载较低的时间段使用，DeepSeek 推出了错峰时段优惠政策：

优惠时段：北京时间每日 00:30 至 08:30。
优惠力度：

DeepSeek-V3 模型：调用费用在此期间享受 50% 的折扣。
DeepSeek-R1 模型：调用费用在此期间享受 75% 的折扣。

计费机制

DeepSeek 的计费方式基于模型处理的总 token 数量，计算公式为：

扣减费用 = token 消耗量 × 模型单价。

用户的费用将从其充值余额或赠送余额中扣除，系统优先使用赠送余额。

2. DeepSeek-V3/R1 理论利润率高达 545%

3 月 1 日，DeepSeek 发布了《DeepSeek-V3/R1 推理系统概览》文章，详细介绍了其推理系统的优化细节，并披露了成本和利润率等关键信息。根据文章，假设 GPU 租赁成本为每小时 2 美元，系统每日总成本约为 87,072 美元。在此基础上，若所有 tokens 均按照 DeepSeek-R1 的定价计算，理论上每日总收入可达 562,027 美元，利润率高达 545%。然而，实际收入可能因 DeepSeek-V3 和 DeepSeek-R1 定价差异以及夜间折扣等因素而低于理论最大值。

在技术层面，DeepSeek-V3/R1 推理系统采用了大规模跨节点专家并行技术，旨在提升吞吐量并降低延迟。通过专家分散部署和计算与通信的重叠执行，系统实现了高效的资源利用和性能优化。此外，系统还引入了多层次的负载均衡机制，以确保各节点的工作负载均衡，避免性能瓶颈。

3. 阿里 Qwen Chat 平台上线“深度思考”功能

2 月 25 日，阿里巴巴旗下的 Qwen 团队在 Qwen Chat 平台推出了全新的“深度思考（QwQ）”功能。该功能由 QwQ-Max-Preview 模型支持，这是一个基于 Qwen2.5-Max 的推理模型，旨在增强 AI 的推理能力。

QwQ 模型不仅具备强大的推理能力，还支持联网搜索功能，能够展示完整的思维链过程，提升用户体验。Qwen 团队表示，QwQ-Max 的正式版本即将发布，届时将同步推出 Android 和 iOS 平台的应用程序，并计划基于 Apache 2.0 开源许可证开放 QwQ-Max 和 Qwen2.5-Max 的权重。

4. 腾讯元宝电脑版正式发布

3 月 1 日，腾讯正式发布了面向 Windows 和 macOS 平台的 AI 助手——腾讯元宝电脑版。该助手基于腾讯自研的混元 turbo 大模型，同时支持与 DeepSeek-R1 模型的双模切换，为用户提供 AI 搜索、总结、写作等核心功能。

腾讯元宝能够解析多种格式的文档，包括微信公众号链接、网址，以及 PDF、Word、txt 等，支持超长的上下文窗口，满足用户在日常生活和工作中的多样化需求。此外，元宝还融入了腾讯文档、电脑管家、搜狗输入法等生态产品，用户在元宝中生成的文章可直接跳转至腾讯文档进行编辑，实现无缝衔接。

值得一提的是，借助 DeepSeek-R1 大火的腾讯元宝正在各大平台疯狂砸广告，有收割流量的嫌疑。

5. OPPO ColorOS 正式接入 DeepSeek-R1

2 月 26 日，OPPO 宣布其 ColorOS 系统正式接入了满血版 DeepSeek-R1 模型，涵盖包括 OPPO Find N5 在内的 40 余款 OPPO 及一加机型。

全新升级的小布助手在功能上进行了全面提升，支持一键 AI 唤醒、语音对话交互、联网搜索以及生成结果导出等多元化操作。此外，OPPO 还进行了本地化的网络部署，进一步提升了助手的响应速度和处理能力。

此次升级的机型包括 OPPO Find X8 系列、OPPO Find X7 系列、OPPO Find N3 系列、OPPO Find N2 系列、OPPO Reno13 系列、OPPO Reno12 系列、OPPO Reno11 系列、OPPO Reno10 系列，以及一加 13 系列和一加 Ace 系列等多款热门机型。

6. vivo 正式上线满血版 DeepSeek-R1

2 月 25 日，vivo 宣布正式上线满血版 DeepSeek-R1，进一步提升其 AI 体验。用户将蓝心小V升级至 5.2.1.22 版本后，即可体验这一新模型。升级后的蓝心小V支持深度思考和联网搜索功能，并新增了「作业助手」智能体。

在 vivo 云端算力的支持下，DeepSeek-R1 实现了秒级响应，并与手机生态系统无缝融合。用户可通过电源键或语音唤醒蓝心小V，使用语音或文字输入指令，生成的结果还可拖拽至「岛」进行分享。

值得注意的是，搭载 OriginOS 5 的机型均支持满血版 DeepSeek-R1。

7. 豆包内测字节跳动自研深度思考模型

2 月 25 日，字节跳动旗下 AI 助手豆包开始小范围测试自研的深度思考模型。与外界猜测不同，此次测试并未接入 DeepSeek-R1 模型，而是采用了豆包团队自主研发的推理模型。

部分被灰度测试的用户在与豆包对话时，已能看到思维链的呈现，显示出模型推理过程的透明性。豆包相关负责人表示，团队正在测试不同实验版本，以探索最佳表现方式，旨在提升 AI 助手的推理能力和用户体验。

8. 夸克 AI 搜索上线“深度思考”推理模型

3 月 1 日，夸克 AI 搜索正式接入阿里自研的“深度思考”推理模型。该模型基于阿里通义千问基模开发，旨在提升搜索的理解和推理能力，让用户在复杂问题的搜索过程中获得更精准的答案。

据悉，“深度思考”推理模型能够更好地解析用户意图，对搜索内容进行多步推理和深度关联，提供更符合语境的答案，而非仅依赖关键词匹配。阿里透露，未来夸克 AI 搜索还将升级更大规模的模型，以进一步增强搜索体验。

9. 百度文心大模型 4.5 将于 3 月 16 日发布

2 月 28 日，百度官方宣布，文心大模型 4.5 将于 3 月 16 日正式发布。此次升级不仅在基础模型能力上有显著提升，还引入了原生多模态和深度思考等新特性。

原生多模态能力使模型能够处理和理解多种类型的数据，如文本、图像和音频，提供更丰富的交互体验。深度思考功能则增强了模型的推理和分析能力，使其在复杂任务中表现更为出色。

值得关注的是，百度计划在未来几个月内逐步推出文心 4.5 系列，并于 6 月 30 日起正式开源。

10. OpenAI 正式发布 GPT-4.5

2 月 27 日，OpenAI 发布了最新的 AI 模型—— GPT-4.5，被誉为迄今为止最大、最强的聊天模型。该模型通过扩展无监督学习和推理能力，拥有更广泛的知识库和更深刻的世界理解能力。与之前的模型相比，GPT-4.5 的“幻觉”现象显著减少，准确率提升至 62.5%，幻觉率降至 37.1%。

值得一提的是，GPT-4.5 展现出更高的“情商”，能够更细腻地解读用户的微妙线索或隐含期望。在写作和设计方面，GPT-4.5 的审美直觉和创造力也有所提升。OpenAI 表示，用户与 GPT-4.5 的互动将更加自然，仿佛在与一位有思想的人交流。

然而，由于 GPT-4.5 是一个庞大且计算密集型的模型，运行成本相对较高。目前，GPT-4.5 仅向每月支付 200 美元的 ChatGPT Pro 用户开放，未来将逐步向其他订阅层级用户开放。

11. OpenAI 向 ChatGPT Plus 用户开放 Deep Research 功能

2 月 26 日，OpenAI 宣布将 Deep Research（深度研究）功能正式向 ChatGPT Plus、Team、Edu 和 Enterprise 用户开放。此前，这一功能仅对每月 200 美元的 Pro 计划用户开放。现在，Plus 用户每月可获得 10 次深度研究查询机会，而 Pro 订阅用户的查询限额也从每月 100 次提升至 120 次。

Deep Research 功能使 ChatGPT 能够深入分析和综合来自多种来源的信息，包括文本、图像和 PDF 文件。用户可以在发送请求前点击聊天界面中的深度研究图标来尝试这一功能。根据问题的复杂程度，ChatGPT 生成答案的时间可能在 5 到 30 分钟之间。

此外，OpenAI 对深度研究工具进行了多项改进。现在，ChatGPT 可以在回答中嵌入图像，以提供更丰富的见解。系统对文件类型的理解也得到了提升，这将有助于更好地分析各类文档。

12. OpenAI 免费开放 ChatGPT 实时语音功能

2 月 26 日，OpenAI 宣布免费开放 ChatGPT 的高级语音模式（Advanced Voice Mode），让所有用户都能体验更自然的语音对话。该功能由 GPT-4o mini 模型提供支持，用户只需点击屏幕右下角的语音图标，即可进入专用界面，并根据需要开启或关闭麦克风、结束对话。

此前，这一功能仅限于付费订阅用户，现在所有用户均可免费使用。免费用户在音频输入和输出上会有每日使用限制，用户在剩余 3 分钟使用时间时会收到警告，达到限额后对话将自动结束。用户可以通过语音与 ChatGPT 进行更自然的互动，提升了使用体验。

13. Anthropic 推出首个混合推理模型 Claude 3.7 Sonnet

2 月 24 日，人工智能公司 Anthropic 发布了其最新的混合推理模型—— Claude 3.7 Sonnet。该模型集成了快速响应与深度思考两种能力，是公司迄今最智能的 AI 模型。

Claude 3.7 Sonnet 的最大特点在于其混合推理能力。用户可根据需求，在标准模式下获得即时响应，或启用“扩展思考模式”，使模型进行更深入的推理和分析，以解决复杂问题。

目前，Claude 3.7 Sonnet 已在 Claude 应用、Anthropic 的 API、Amazon Bedrock 和 Google 的 Vertex AI 上线。其定价与前一版本相同，每百万输入 tokens 收费 3 美元，每百万输出 tokens 收费 15 美元。

此外，Anthropic 推出了 Claude Code，这是一款 AI 辅助的编码工具，旨在与开发者积极协作，执行搜索、编辑、测试等任务，进一步提升开发效率。

14. Anthropic 全面开放 Claude GitHub 集成

2 月 27 日，Anthropic 宣布其 AI 助手 Claude AI 的 GitHub 集成功能正式向所有用户开放，包括免费用户、Pro 用户和团队用户。通过将 GitHub 代码库直接同步到 Claude，开发者可以利用 Claude 的上下文理解能力，测试和调试代码，深入理解代码库，提升开发效率。

此前，GitHub 集成功能仅限于 Claude 企业版用户。

15. 谷歌 Gemini 向免费用户开放“全局记忆”功能

3 月 1 日，谷歌宣布旗下 Gemini AI 的“全局记忆”功能正式向免费版用户开放。此前，这一功能仅供 Gemini Advanced 付费用户使用。通过“全局记忆”，AI 能够记住用户与其进行的所有对话，提供更个性化的回复。用户无需翻阅历史记录即可承接上一次对话，提升了人机交互的流畅性。

此外，用户还可以要求 Gemini 总结此前的对话内容，并在此基础上进行深入讨论。在隐私方面，用户可通过 Gemini 应用的个人资料卡，查看、删除和管理聊天记录，确保数据安全。

16. 谷歌推出 Gemini Code Assist 个人版编程工具

2 月 25 日，谷歌正式发布了面向个人开发者的免费版本编程工具——Gemini Code Assist。该工具由谷歌的 Gemini 2.0 模型驱动，旨在为学生、自由职业者、编程爱好者和初创公司提供先进的编程助手功能。

与其他免费编程助手每月仅提供约 2,000 次代码补全不同，Gemini Code Assist 为个人用户每月提供高达 180,000 次代码补全，几乎无限制地满足开发需求。该工具支持所有公共领域的编程语言，并可在 Visual Studio Code、GitHub 和 JetBrains 等开发环境中使用。开发者可以通过自然语言指令，生成完整的代码块、在编写时完成代码，并通过聊天机器人界面获得编程协助。

此外，Gemini Code Assist 的聊天功能支持上下文窗口中最多 128,000 个输入 tokens，使其能够处理大型文件，进一步提升开发效率。需要注意的是，免费个人版不包含标准版和企业版中的高级功能，如生产力指标、与谷歌云服务的集成等。

我是木易，一个专注AI领域的技术产品经理，国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”，致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”，用AI为你的未来加速。

（文：AI信息Gap）

2025 年 6 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30