速递|Moonvalley发布首个公开数据训练的AI视频模型Marey:如何实现360度镜头控制与物理模拟

图片来源:Moonvalley

总部位于洛杉矶的人工智能视频生成初创公司Moonvalley 团队认为,仅靠文本提示无法完成电影制作。

正因如此,该公司于本周二向公众开放了其“3D 感知模型,承诺采用混合方法,为电影制作人提供比其他标准文本转视频模型更强的控制权。 

Moonvalley 最初在 月份以测试版形式推出了名为 Marey 的模型,现已推出基于月度积分的订阅服务。用户可支付 14.99 美元获得 100 积分,34.99 美元获得 250 积分,149.99 美元获得 1000 积分。用户可生成最长 秒的片段,这与公开视频生成模型的行业标准相符。 

这家由曾参与开发谷歌自有视频生成模型的 DeepMind 前研究人员,联合创立的初创公司声称,Marey 是少数完全基于公开授权数据训练的模型之一。这与 Moonvalley 的目标客户群体完美契合:那些希望避免因 AI 生成内容可能涉及版权材料而面临未来诉讼的电影制作人。 

对于独立电影制作人Ángel Manuel Soto 而言,Marey 的最大卖点在于它实现了顶级 AI 叙事工具的民主化,尤其为长期被传统电影制作拒之门外的人群提供了机会。在波多黎各长大的 Soto 表示,过去仅租赁拍摄设备就需要筹集数百甚至数千美元资金。

回到家乡,我们讲述自己的故事都需要获得许可,他说道。“AI 让你能够按照自己的方式实现梦想,不必因为有人拒绝投资、认为你们国家的故事无法盈利就放弃自己的梦想。

索托表示,如今Marey 已帮助他将制作成本降低了 20%至 40%,工作也更加自由。

索托此前曾与 Moonvalley 旗下工作室 Asteria 合作制作 HBO 纪录片《Menudo: Forever Young》。General Catalyst 的CEO Hemant Taneja 透露,Asteria(又名 XTR)今年已被 Moonvalley 收购。(GC 曾是 Asteria 的主要股东,并向合并后的实体追加了投资。)

Moonvalley CEO兼联合创始人 Naeem Talukdar 展示了 Marey 如何应用于影视前后期制作——无论是拍摄前的场景测试还是拍摄后的镜头角度调整,以及如何用它控制物体、角色、动作和场景构图。

Talukdar 透露,Marey 对物理世界的理解能力可能随着技术发展转化为更具互动性的叙事方式。目前这种理解能力——Marey 与 Google 的 Veo 3 和 OpenAI 尚未公开的 Sora 等其他模型共享,使 Marey 能够实现诸如模拟运动同时遵守物理定律等功能。 

例如,一段野牛在草原上奔跑的视频,可以转化为一辆凯迪拉克在相同环境中飞驰的画面,草叶与尘土会随车辆运动产生相应变化。或者,Marey 能将乔治·华盛顿形象的人物叠加到演员身上,从演员的面部表情到前臂肌肉的演讲手势都能精准转化。

更独特的是Marey 支持自由镜头运动功能。

Talukdar 演示了如何用鼠标调整摄像机轨迹:他仅通过拖拽光标,就为落基山脉火车上女性的视频添加了平移滑动变焦效果。他还指出,Marey 能实现接近 360 度的镜头运动,并遵循指令生成手持摄像机或轨道车拍摄效果的画面。

Marey 还能改变视频背景,让电影制作人从原始素材出发构建理想场景。Talukdar 展示了一段视频:一名男子在郊区道路上骑摩托车,随后画面转变为同一位未戴头盔的男子,骑着略有不同的摩托车行驶在乡村公路上。

Talukdar 表示,Moonvalley 计划在未来几个月内推出新的控制功能,如光照调节、深度物体轨迹和角色库等。

Marey 的公开发布使其直接与日益增长的 AI 视频生成器领域展开竞争,包括 Runway Gen-3Luma Dream MachinePika 和 Haiper 等模型。


参考资料

https://techcrunch.com/2025/07/08/moonvalleys-ethical-ai-video-model-for-filmmakers-is-now-publicly-available/

编译:ChatGPT


——-

(文:Z Potentials)

发表评论