低调升级,实力暴涨!新版 DeepSeek R1,成了 o3 和 Gemini 2.5 的最强平替
DeepSeek R1 推出升级版,推理能力增强、幻觉率下降、支持函数调用,并引入8B小模型辅助教学。新版性能提升显著,已超越开源之王Qwen3。
DeepSeek R1 推出升级版,推理能力增强、幻觉率下降、支持函数调用,并引入8B小模型辅助教学。新版性能提升显著,已超越开源之王Qwen3。
DeepSeek模型发布小版本更新,主要改进包括思考过程更加简洁、增加Emoji表情及整体回答更加流畅。尽管如此,更新内容细节未知,短期内无法期待DeepSeek R2发布。
Anthropic 发布了全新版本的 Claude 4,包括旗舰版和免费版。旗舰版 Claude Opus 4 是迄今为止最强大的模型,面向所有用户开放使用的 Claude Sonnet 4 则具有更高的性价比。新版本在编程能力、代理能力和安全性方面都有显著提升。
上周,马斯克的AI初创公司xAI旗下的聊天机器人Grok因发布种族灭绝阴谋论而引发关注。xAI公开了所有系统提示词以重建用户信任,包括通用对话、深度搜索功能等提示词。
OpenAI发布新功能Codex,一个远程AI编程助手。Codex分为本地和云端两种形态,能够帮助开发者编写代码、修复Bug、优化性能等任务。Codex-1模型在SWE-Bench测试中表现优异,用户可通过ChatGPT侧边栏访问Codex,并在未来推出按需付费模式。
谷歌取消了免费用户Gemini 2.5 Pro Preview的API配额,导致使用该模型需要付费。虽然可以在Google AI Studio中免费使用,但不再能通过API白嫖。
GPT-4.1 正式上线 ChatGPT,专为编程和指令执行优化。模型拥有百万上下文长度,并在 SWE-bench 编程基准测试中超越了其他模型,提供更快的响应速度和更高的指令跟随准确性。
览🚀
1️⃣
🚀 腾讯助力 DeepSeek 性能飙升
:DeepSeek 开源的 GPU 通信框架
文章介绍了谷歌《Prompt Engineering》白皮书的中文翻译版本,推荐了DeepL Pro和沉浸式翻译两种方式,并重点推荐了BabelDOC PDF翻译效果最佳。
马斯克的 Grok Studio 推出了 PDF 渲染新功能,只需几句对话就能快速生成符合要求的现代 PDF 文件,包括学术论文、简历和餐厅菜单等。