速递|​8秒视频只是起点,谷歌Veo 2携8秒720P视频登陆Gemini,硬刚OpenAI Sora

谷歌即将在其Gemini平台上推出新的Veo 2视频生成AI模型,该模型目前仅限于订阅Gemini Advanced的付费用户使用。Gemini Advanced用户可创建720p分辨率8秒的16:9宽高比视频,并通过Gemini的分享按钮上传至TikTok、YouTube等平台。

视频推理R1时刻,7B模型反超GPT-4o!港中文清华推出首个Video-R1

港中文和清华团队推出Video-R1模型,首次将强化学习的R1范式应用于视频推理领域。通过升级的T-GRPO算法和混合图像视频数据集,Video-R1在视频空间推理测试中超越了GPT-4o,并且全部代码和数据集均已开源。