蚂蚁清华联手放大招!彻底开源RL框架AReaL-boba,人人可复现QwQ
蚂蚁与清华大学联合推出的AReaL开源强化学习框架发布里程碑版本,提供详细的教程和高性能的SGLang框架集成,大幅提升训练速度,并在数学推理能力上达到同尺寸模型的SOTA水平。
蚂蚁与清华大学联合推出的AReaL开源强化学习框架发布里程碑版本,提供详细的教程和高性能的SGLang框架集成,大幅提升训练速度,并在数学推理能力上达到同尺寸模型的SOTA水平。
DeepSeek研究团队发表LADDER论文,介绍一种通过递归问题分解和强化学习提升AI模型能力的新方法。该方法使7B规模的Qwen模型在MIT Integration Bee比赛中得分达到90分,超越了o1的成绩。
广和通在2025世界移动通信大会发布星云系列AI模组及解决方案,覆盖1T~50T算力等级,支持智能陪伴机器人等终端设备的本地化大模型部署与应用开发。
本文指导如何在个人电脑上部署和使用 DeepSeek-R1(无限制版),包括环境准备、安装必要的软件、获取模型文件及加载模型的基本步骤。介绍腾讯推出的 ima.copilot 智能工作台,具备智能写作和文档解读功能,助力提高效率。
非营利机构AI2推出完全开放模型OLMo 2,其在同等大小模型中表现最优,并公开了训练数据和方法。OLMo 2系列包括7B和13B型号,在多个任务上优于Llama-2系列模型,同时降低了能耗。
国产大模型一周动态回顾,包括新发布的UI-TARS GUI Agent模型,这是一个集成了视觉语言模型的原生GUI代理系统,旨在实现端到端任务自动化。