微软开源多模态AI基础模型!无需额外微调轻松拿捏网页、机器人

微软研究院开源Magma模型,首个能理解多模态输入并进行实际操作的基础模型,在CVPR会议上获得接收。该模型融合视觉、语言与动作能力,使用Set-of-Mark和Trace-of-Mark两大标注方法提高准确性。

大模型训练开销还能更小!微软推出首个FP4训练框架,训练效果与BF16相当

首个FP4精度的大模型训练框架发布,可使所需存储和计算资源更少。与BF16相当的训练效果下,最高可达130亿参数规模的模型。研究团队采用定制化的FP4矩阵乘法、不同粒度量化策略以及新的梯度估计方法。

微软研究院开源AIOpsLab:一个AI驱动的云运维框架

微软研究院发布AIOpsLab开源框架,旨在解决云运维中的复杂故障诊断和事件缓解问题。该工具提供了一个标准化且可扩展的平台来评估和增强不同云环境中的AI智能体,支持包括事件检测、根本原因分析和缓解在内的一系列运维任务。