2025-01-30 - 第2页共4页

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

下午4时 2025/01/30 作者量子位

首个FP4精度的大模型训练框架发布，可使所需存储和计算资源更少。与BF16相当的训练效果下，最高可达130亿参数规模的模型。研究团队采用定制化的FP4矩阵乘法、不同粒度量化策略以及新的梯度估计方法。

下午4时 2025/01/30 作者 Z Potentials

中国公司DeepSeek发布开源推理模型R1和图像生成模型Janus Pro，引发全球关注。这标志着中美在AI领域的竞争以及封闭与开源模式之间的较量正发生转变。

下午4时 2025/01/30 作者机器之心

一线 AI 洞察，智者深度思考
深入产业变革，共创 AI 未来
2025 年伊始，全球 AI 业界被

下午4时 2025/01/30 作者智东西

日本软银集团正在洽谈向OpenAI投资至多250亿美元，这将使软银成为OpenAI最大的财务支持者。

下午4时 2025/01/30 作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

下午4时 2025/01/30 作者智东西

DeepSeek爆火引发多国关注与调查，OpenAI与Anthropic联合调查其使用API接口行为，Amodei呼吁加强芯片管制，意大利下架应用。

下午4时 2025/01/30 作者机器之心

机器之心报道
编辑：大盘鸡、微胖
经过一系列测试 —— 从创意写作到复杂的教学，DeepSeek-R

下午2时 2025/01/30 作者小兵的AI视界

在机器人技术蓬勃发展的时代浪潮中
，机器人操作的智能化与精准化成为了研究的核心焦点。从工业生产线上的

下午2时 2025/01/30 作者 AI技术研习社

上一篇文章我们探讨了如何使用自定义数据集进行模型训练，这次我将重点介绍如何使用
LoRA 微调
Qw