中国大模型站上世界前列,其中阿里AI全球第三

近日,斯坦福大学以人为本人工智能研究所发布《2025年人工智能指数报告》,中国在顶尖AI模型数量和质量上保持领先,并在全球重要模型公司中占据第三。阿里AI贡献全球第三,靠的是技术实力而非PPT、PR或邀请码等软实力。

李飞飞团队「具身智能」最新研究:机器人接手所有家务

机器之心报道
研究团队开发出BEHAVIOR Robot Suite(简称BRS),一种综合性框架,用于掌握机器人在多样化家庭任务中的移动全身操作。通过JoyLo和WB-VIMA两项关键技术创新,实现对高自由度移动机械臂的流畅控制,并进行高质量的数据收集和学习策略优化。实验结果显示,BRS支持多种日常家务任务,且能高效完成精细操作。

巴黎AI峰会集锦!奥特曼大放厥词:5000亿星际之门在随后的5万亿AI集群面前不算什么

欧盟委员会主席冯德莱恩宣布投资2000亿欧元推动欧洲人工智能发展,包括建设新基金支持200亿欧元的投资。李飞飞认为AI可能带来文明级影响,并强调基于科学而非科幻进行治理的重要性。

s1推理模型=数据筛选+推理预算强制,也提醒大家不要进入思维误区

MLNLP社区介绍其愿景是促进国内外自然语言处理及相关领域的交流合作。近日,李飞飞团队的《s1: Simple test-time scaling》引起广泛关注。s1主要通过数据筛选与推理预算强制提升模型性能。核心贡献包括开源训练数据及改进效果验证方法。

李飞飞、DeepSeek为何偏爱这个国产模型?

阿里云通义千问的Qwen模型在短短时间内取得了显著突破,仅用1000个样本在H100上监督微调26分钟就训练出与顶尖推理模型相当的新模型s1-32B。这一成果引起了AI社区的关注和赞誉,取代了Llama成为开源AI社区的重要标杆基座模型。

50美元复现DeepSeek R1,李飞飞团队为何也选了阿里Qwen

阿里云通过开源领先模型繁荣AI生态,推动技术创新与商业良性循环。通义千问系列模型屡获佳绩,吸引开发者和企业加入其云计算平台,实现’全尺寸、全模态、多场景’的开源布局。

李飞飞团队50美元训练出DeepSeek R1?

文章介绍了通过16块H100 GPU在26分钟内训练出低成本语言模型S1K的方法,该模型与OpenAI的o1系列和DeepSeek R1系列性能相当。但实际研究发现,论文核心是基于开源Qwen2.5-32B模型,进行小数据集监督微调,并非直接复制了DeepSeek R1。