ICLR 2025 Spotlight|让机器人实现“自主进化” 蚂蚁数科与清华联合提出具身协同框架BodyGen
果:由蚂蚁数科与清华大学联合团队提出的全新的具身协同框架 BodyGen 成功入选 Spotligh
果:由蚂蚁数科与清华大学联合团队提出的全新的具身协同框架 BodyGen 成功入选 Spotligh
Google 和 OpenAI 分别发布了新功能。OpenAI 推出了4o 文生图功能,能创建高质量图像;Google 使用 DeepSeek 模型进行更新,提升了模型质量和代码表现。
MagicMotion提出了一种新的图像到视频生成框架,能够在指定的轨迹条件下精确控制物体运动。该方法构建了大规模的轨迹数据集,并引入了隐分割损失以提高对象形状感知能力。实验结果显示,MagicMotion在多种指标上优于现有方法,展示了卓越的性能。
谷歌发布的Gemini 2.5 Pro模型在多个基准测试中达到SOTA水平,并且在Arena排行榜上排名第一。它具有强大的推理能力和代码生成能力,在视觉和编程领域表现卓越。
谷歌发布下一代AI推理模型Gemini 2.5,具备多模态能力,并在多个基准测试中表现优异。该模型通过Google AI Studio提供给开发者,并计划在未来几周公布其API定价。
OpenAI正式推出GPT-4o原生图像生成功能,Sam Altman认为这代表了赋予用户创作自由度的新高度。亮点包括上下文理解、复杂指令执行、文本与图像融合及聊天式交互能力。该功能已向ChatGPT和Sora的Plus、Pro、Team用户以及免费用户提供,并计划扩展至企业版、教育版和开发者API使用。