轨迹可控视频生成新范式,复旦微软破解视频生成难题,精准控制任意物体运动

MagicMotion提出了一种新的图像到视频生成框架,能够在指定的轨迹条件下精确控制物体运动。该方法构建了大规模的轨迹数据集,并引入了隐分割损失以提高对象形状感知能力。实验结果显示,MagicMotion在多种指标上优于现有方法,展示了卓越的性能。

速递|《指环王》级文本吞吐,谷歌发布Gemini2.5 Pro的能效比突破密码

谷歌发布下一代AI推理模型Gemini 2.5,具备多模态能力,并在多个基准测试中表现优异。该模型通过Google AI Studio提供给开发者,并计划在未来几周公布其API定价。

突发!ChatGPT原生图像生成正式上线,网友:截胡谷歌Gemini 2.5发布

OpenAI正式推出GPT-4o原生图像生成功能,Sam Altman认为这代表了赋予用户创作自由度的新高度。亮点包括上下文理解、复杂指令执行、文本与图像融合及聊天式交互能力。该功能已向ChatGPT和Sora的Plus、Pro、Team用户以及免费用户提供,并计划扩展至企业版、教育版和开发者API使用。