SIGGRAPH 2025 快手可灵团队提出3D感知的可控电影级视频生成工作CineMaster!
近期,可灵研究团队推出的CineMaster电影级文本到视频生成框架允许用户通过3D感知控制目标和相机运动来创作高质量视频内容。该方法在SIGGRAPH 2025会议中被收录,并展示了从任意视频中提取3D控制信号的数据构建流程。
近期,可灵研究团队推出的CineMaster电影级文本到视频生成框架允许用户通过3D感知控制目标和相机运动来创作高质量视频内容。该方法在SIGGRAPH 2025会议中被收录,并展示了从任意视频中提取3D控制信号的数据构建流程。
谷歌即将在其Gemini平台上推出新的Veo 2视频生成AI模型,该模型目前仅限于订阅Gemini Advanced的付费用户使用。Gemini Advanced用户可创建720p分辨率8秒的16:9宽高比视频,并通过Gemini的分享按钮上传至TikTok、YouTube等平台。
谷歌DeepMind发布的新模型Veo 2可以在用户提示下生成最高8秒720P电影级视频,已超过多个同类应用。API可免费使用,目前支持图片转视频和多种场景视频生成。
今日OpenAI发布GPT-4o原生多模态模型,其生图能力震撼亮相,超越Gemini等竞品。作为200刀的Pro会员,用户可直接用嘴实现生图和改图需求。
专注AIGC领域的专业社区分享了OpenAI GPT-4和Sora的新更新,特别是文生图模型的能力增强,包括逼真度高、支持自定义操作等功能。文章展示了几个实际生成的案例,如奇幻世界和人体结构介绍图,并提及OpenAI联合创始人Sam Altman对这一新模型的高度评价。
Sora由积分制改回订阅制,OpenAI推出的新模型允许ChatGPT Plus和Pro用户无限生成高质量视频(最高1080p分辨率、最长20秒)。
OpenAI计划将AI视频生成工具Sora直接集成到其应用ChatGPT中,但该版本可能无法提供与独立Web应用程序相同的控制程度。
OpenAI正在为Sora测试新的图像生成功能,包括隐藏的切换按钮和改进后的视频推送分类。目前尚不清楚将由哪款模型提供支持。