OpenAI Day 3 放出「Sora」王炸,网友炸锅了?

Sora 「翻车」了?
凌晨,OpenAI Day 3 发布了备受期待的 AI 视频生成工具 Sora 及其配套平台 sora.com。这个被誉为「改变视频创作未来」的工具,却在首日就遭遇了不小的争议。有用户测试,从分不清人脸和猪脸,到生成效果与预期严重不符,Sora 的表现似乎让不少人大跌眼镜。
作为 OpenAI 在视频领域的重磅产品,Sora 到底是革命性突破还是雷声大雨点小?让我们一起来看看这个争议颇多的新产品。
其主要功能如下:
  1. 核心生成能力
    1. 文本到视频的智能转换
    2. 支持图片/视频参考输入
    3. 多种预设风格可选
    4. 参数精确调节(分辨率、时长等)
  2. 专业编辑工具集
    1. Re-cut:视频片段剪辑与修剪
    2. Remix:通过自然语言修改视频内容
    3. Blend:多个视频的智能混合
    4. Loop:无缝循环播放处理
    5. Story Board:内容精确控制工具

Sora:OpenAI 的野心与现实的差距

从功能上看,Sora 确实给人留下了深刻印象。它不仅支持文本生成视频,还能进行图片到视频的转换,甚至可以对已有视频进行改编和混合。
特别值得一提的是其故事板(Storyboard)功能,能够将简单的文本描述转化为带有时间线的完整剧情。
在技术规格方面,Sora 也展现出不俗实力。支持最高 1080p 的分辨率,最长可达 20 秒的视频时长,这在当前 AI 视频生成领域已经算得上领先水平。Plus 用户每月可生成 50 个视频,而 Pro 用户则享有更多特权,包括 500 个优先处理的视频额度,以及无水印下载等。

当美好愿景遭遇现实考验

然而,实际使用体验却暴露出不少问题。有用户反馈,Sora 在人脸识别方面存在严重缺陷,甚至会将人脸和猪脸混淆。这不禁让人想起早期 AI 绘画工具的各种「奇葩」作品。
更令人担忧的是,生成的视频内容经常与用户输入的 prompt 大相径庭。这种「听不懂人话」的问题,对于一个商用级别的工具来说显然是难以接受的。
值得一提的是,OpenAI 似乎也意识到了这些问题。在官方说明中,他们承认 Sora 在模拟复杂场景的物理效果方面可能存在困难,对因果关系的理解也不够准确。这种坦诚固然值得赞赏,但也暴露出 AI 视频生成技术仍处于初级阶段的现实。

写在最后

站在 2024 年的节点回望,AI 视频生成技术的发展确实令人惊叹。从最初的简单特效,到现在能够生成完整视频序列,进步之大有目共睹。但 Sora 的「翻车」经历也提醒我们,技术发展往往需要经历从量变到质变的漫长过程。
正如著名 YouTuber 马奎斯·布朗利所说:「这个结果既令人恐惧又令人振奋。」一方面,我们为 AI 技术的潜力感到兴奋;另一方面,也要对技术可能带来的影响保持清醒认识。
对创作者而言,与其盲目追捧或全盘否定,不如将 Sora 视为创作工具箱中的新选项。它也许无法取代传统的视频创作流程,但在特定场景下仍能发挥独特价值。毕竟,工具的价值不在于它有多完美,而在于我们如何善用它的优势、规避它的不足。
历史总是在不断重复:新技术的出现往往伴随着质疑和争议,但真正优秀的产品最终会在实践中证明自己的价值。对于 Sora 来说,现在或许还为时尚早,但它无疑为 AI 视频生成领域提供了一个新的参考坐标。让我们拭目以待,看看这个充满争议的新产品,最终能在 AI 视频创作的舞台上占据怎样的位置。

作者:Fish   

(文:毫河风报)

发表评论