大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2025我们继续出发。
AI Weekly『1月13-1月19日』
-
阶跃星辰推出推理模型
Step R-mini
:首款“慢思考与反思”逻辑机制推理模型,基准测试超越o1-preview
。 -
面壁智能发布
MiniCPM-o 2.6
:8B参数全模态模型,支持端侧设备多模态实时流式交互。 -
稀宇科技开源
MiniMax 01
系列模型 :4560亿参数,支持400万 token 上下文输入,性能媲美国际领先模型。 -
讯飞发布深度推理模型
星火X1
:全国产算力训练,多个测试指标国内第一,已落地教育和医疗场景。 -
字节跳动豆包上线 AI 编程功能 :支持多文件上传与 GitHub 仓库接入,实现高效代码生成与优化。
-
马斯克 xAI 推出网页版
Grok
:无需 X 账户即可访问,支持实时信息收集和图像生成。 -
Mistral AI 发布
Codestral 25.01
模型 :支持80多种语言,256K token 上下文长度,代码生成速度提升两倍。
1. 阶跃星辰推出 Step Reasoner mini 模型
1月15日,阶跃星辰宣布其自研推理模型 Step Reasoner mini
(简称 Step R-mini
)正式上线。该模型为 Step
系列的首款推理模型,专注于逻辑推理、代码生成、数学问题解决等复杂任务,同时兼具通用领域的能力。
Step R-mini
采用“慢思考与反思”的逻辑机制,在 AIME 和 Math 等基准测试中表现优异,成绩超越 o1-preview
,比肩 OpenAI o1-mini
。此外,模型还支持用户在阶跃星辰的“跃问”平台进行在线体验,并计划未来推出视觉推理模型。
2. 面壁智能发布全模态模型 MiniCPM-o 2.6
1月16日,面壁智能发布了全模态模型 MiniCPM-o 2.6
,参数量为 8B,号称性能比肩 GPT-4o
和 Claude-3.5-Sonnet
。该模型采用端到端多模态架构,可同时处理文本、图像、音频和视频等多种类型的数据,生成高质量的文本和语音输出。
此外,MiniCPM-o 2.6
支持可配置声音的中英双语语音对话,具备情感、语速、风格控制,以及端到端声音克隆和角色扮演等进阶功能。值得一提的是,该模型能够在端侧设备(如 iPad)上实现多模态实时流式交互。
3. 稀宇科技发布并开源MiniMax 01系列模型
1月15日,稀宇科技(MiniMax)发布并开源了新一代 MiniMax-01 系列模型,包括基础语言大模型 MiniMax-Text-01
和视觉多模态大模型 MiniMax-VL-01
。该系列模型参数量达 4560 亿,单次激活参数量为 459 亿,首次大规模实现线性注意力机制,打破了传统 Transformer 架构的记忆瓶颈,能够高效处理长达 400 万个 token 的上下文输入。
在多项任务评测中,MiniMax-Text-01
的性能与国际领先模型相当,尤其在长文本处理和多模态理解任务中表现出色。目前,开发者可通过 MiniMax 开放平台获取该系列模型的完整权重,并进行进一步研究和应用。
4. 讯飞发布深度推理模型 星火X1
1月15日,科大讯飞发布了基于全国产算力训练的深度推理模型 星火X1
,在数学推理和复杂问题分解等领域表现卓越,多个测试指标位居国内第一。该模型已应用于教育和医疗场景,为个性化教学和疑难病症诊断提供支持。
同时,讯飞还升级了 星火4.0 Turbo
,优化图文识别、长文本处理和混域知识搜索技术,进一步推动行业智能化落地。此外,发布了国内首个语音到语音同传模型“星火语音同传”,在翻译领域表现媲美人类同传译员,为国际交流提供技术支持。
5. 字节跳动豆包上线 AI 编程功能
1月16日,字节跳动旗下的豆包宣布,电脑版和网页版全新上线AI编程功能。该功能支持一键上传多个本地代码文件,并可实时引入 GitHub 开源仓库,快速获取项目的完整上下文,避免逐段复制代码的繁琐操作。此外,豆包全新的代码编辑器支持沉浸式阅读,用户可精准圈选代码片段进行解释或调整,并在查看代码仓库时方便地切换目录。这项功能还提供编程语言自学引导,结合思路讲解和代码示例,帮助用户生成、解释、修复和优化代码。对于备考刷题和代码报错排查,豆包也能提供有效支持。
6. 马斯克 xAI 推出网页版Grok聊天机器人
1月15日,埃隆·马斯克(Elon Musk)旗下的 xAI 公司宣布,旗下聊天机器人 Grok 的网页版正式上线。用户无需访问 X.com 或拥有 X 账户,只需在浏览器中访问 grok.com,并提供出生年份,即可开始使用。Grok 支持实时信息收集、回答问题,并具备图像生成功能。输入框下方的菜单允许用户添加附件,并切换“自动”、“可视化”、“搜索”和“仅模型”模式,以更好地控制 Grok 的响应。此外,用户可以选择连接 X 账户,或通过 Google 或电子邮件登录,以享受更多功能和服务。免费计划的用户每 2 小时可生成 10 张图像,每天有 3 个图像分析积分和 4 次图像生成次数。登录后,用户可开启“临时模式”,在此模式下,聊天内容不会出现在历史记录中,也不会用于训练模型,确保用户隐私安全。
7. Mistral AI 发布 Codestral 25.01 模型
1月8日,Mistral AI 宣布推出其最新的代码生成模型 Codestral 25.01
。该模型支持超过 80 种编程语言,并将上下文长度提升至 256K 个 tokens。与前代产品相比,Codestral 25.01 的架构和分词器经过优化,代码生成和补全速度提高了约两倍。在 HumanEval、MBPP 和 CruxEval 等基准测试中,Codestral 25.01 的准确率和生成速度表现出色,特别是在 Fill-In-the-Middle(FIM)任务中,Pass@1 测试的平均通过率达到 95.3%。开发者现可通过 Mistral 的 IDE 插件合作伙伴,以及 Mistral、Google、Microsoft 和 Amazon 的 API 访问该模型。
(文:AI信息Gap)