LeCun世界模型出2代了!62小时搞定机器人训练,开启物理推理新时代

Meta发布世界模型V-JEPA 2,一个基于视频训练的AI模型能够理解、预测物理世界变化,并在多任务中表现优异。Meta还提出了三个新基准测试来评估现有模型从视频中理解和推理物理世界的性能。

Day0迁移、一键部署,华为开源的昇思MindSpore成为大模型开发的“万能钥匙”

华为昇思MindSpore支持主流大模型的快速迁移与一键部署,实现零损耗移植和高效推理。通过MSAdapter工具简化代码转换,动态图多级流水、JIT编译等技术加速训练调试,百亿参数模型加载时间缩短至30秒。

AI自动写学术综述:10分钟生成6万字,成本不到四块钱

学术综述论文在快速增长的研究文献中发挥着重要作用。SurveyForge通过并行生成与协调机制等技术手段,实现了高效的自动化综述生成,并通过SAM评估指标系列建立了统一的质量标准。

黄仁勋发布量子计算专用CUDA!预言量子计算机几年内应用,但现在还离不开GB200

英伟达CEO黄仁勋在GTC巴黎演讲中提出量子计算正处于重要‘拐点’,预计未来几年逻辑量子比特数量将大幅增长。他推出了CUDA-Q平台来加速量子和经典计算结合的项目,并强调了AI将在工业革命中的作用。

何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

研究者提出一种新的正则化方法Dispersive Loss,旨在改进扩散模型生成图片的效果。该方法不需要定义正样本对,通过鼓励中间表示的分散性来提高模型的泛化能力和生成质量。论文在ImageNet数据集上进行了测试,并展示了其有效性。

Meta千万年薪狂揽大牛,CEO扎克伯格亲自请客吃饭,谷歌DeepMind已被挖

Meta公司正从谷歌、Sesame AI等科技公司挖走顶尖工程师,并砸重金招聘约50人组建新团队以攻克通用人工智能(AGI)。该公司还同意收购AI数据标注创企Scale AI 49%的股份,计划成立专注于开发“超级智能”系统的实验室。然而已有来自领先AI研究实验室的关键人物拒绝了丰厚报酬。