水母在天空中飞翔(图片来源:sora官网)
“改变世界的产品”来了。
钛媒体AGI获悉,北京时间12月10日凌晨,美国OpenAI公司推出 AI 文生视频模型Sora的新版本Sora Turbo,称其比2月预览的Sora模型更快,可生成最高1080p分辨率、最长20秒视频,支持用户输入文字或上传图像,并上线全新UI界面,以便对生成视频进行修改、创建、扩展、循环、混合,或用文本生成全新的内容。
OpenAI称,Sora Turbo将免费提供给ChatGPT Plus和Pro用户,Plus用户每月最多可以生成50个480p分辨率视频,每月20美元(约合人民币145元);Pro订阅者则最多可生成500个视频,并支持20秒时长、1080p分辨率,可下载无水印版视频,对应每月费用200美元(约合1450元)。
作为OpenAI的重要世界模拟器,你可以看到,上面这组Sora演示画面能够实现一致性和动作连贯性,流畅度也比之前Sora预览版高很多。
OpenAI CEO奥尔特曼(Sam Altman)表示,“视频对 OpenAI 来说很重要,我想分享三点:首先,我们热衷于为创作者打造工具。这种创造文化对我们至关重要,也是我们希望人类利用 AI 的方式之一。在早期测试者中,我们观察到一种新型的协作创作动态,这不仅有趣,而且显示了 AI 创意工具的潜在使用模式;第二,我们不希望这个世界只是科技。如果 AI 系统主要通过文本来与人互动,我认为我们错过了一些重要的东西。我们希望我们的 AI 能理解并生成视频,我认为这将深刻改变我们使用计算机的方式;第三,这对我们的AGI路线图至关重要。视频将是一个重要的环境,我们或AI将在这里学习到很多关于如何实现我们在世界上所需的目标。”
国内对于此次Sora Turbo的发布看法不一。
多位 AI 行业人士向钛媒体App表示,这是改变下一个 AI 视频生成领域的新契机。也有 AI 视频领域技术专家王海(匿名)对钛媒体App坦言,“此前先机都已经被OpenAI‘清零’,今天对于国产AI视频生成行业来说可能是一场‘噩梦’。”
事实上,随着Sora预览版公布,过去300多天引爆了全球 AI 视频创业热潮,国外Runway、Pika、HeyGen都曾声称可以超越Sora,字节、快手、阿里、腾讯等互联网科技巨头也纷纷公布 AI 视频产品,使用者超过百万;智谱、生数、爱诗科技、智象未来等AI 视频初创公司则已经开始从产品转向商业化。AI 短剧导演陈坤曾透露,AI使得的制作周期从通常的3-6个月缩短到了2个月,成本达到传统制作流程的1/4以下。
生数科技联合创始人、CEO唐家渝早前向钛媒体App表示,“整体上来讲,我们(中国)追赶Sora肯定比追赶GPT-4容易一些。今年一定能达到Sora目前版本的效果,很难说是三个月还是半年(笑),但这件事我们的信心还是非常足的。”
一场与Sora的中美 AI 视频生成竞争已经爆发。
生成一个视频0.75元、市场规模将超180亿,
视频大模型正加速竞赛
“为什么AI视频生成这种产品,优爱腾(优酷、爱奇艺、腾讯视频)和B站不做,却被快手可灵做了出来?”
早前一场私下讨论中,有投资人对一位即将做 AI 视频生成的创业者进行上述质询。他认为,这轮 AI 视频生成的机会已经与传统互联网视频领域有很大不同,优酷、爱奇艺、腾讯视频都不再做 AI 视频领域,但影视行业却看到了发展需求。
2024年2月,OpenAI发布视频生成模型Sora,首次由 AI 生成了长达1分钟的多镜头长视频,输入寥寥数语便能生成效果炸裂视频,镜头感堪比电影,震惊全球。
随后,全球掀起了一场关于Sora的讨论风暴,犹如两年前的ChatGPT爆火,大量 AI 公司以做“中国版Sora”为目标,众多企业、教授、互联网大厂都下场参与其中。
清华大学计算机科学与技术系博世AI教授、生数科技创始人兼首席科学家朱军,曾任字节跳动AI Lab总监、爱诗科技创始人王长虎,前京东集团副总裁、加拿大工程院外籍院士、智象未来创始人梅涛,新加坡国立大学校长青年教授、潞晨科技创始人尤洋等人都已进入 AI 视频这一“红海”赛道当中创业。
事实上,红杉资本2023年发布的一篇关于生成式 AI 发展进程的预测报告中表明,在历经文生文、文生图的升级迭代后,底层大模型技术迭代放缓,因此,视频方向将是 AI 领域需要重点关注的方向之一,因为视频杂糅了文本、语音、图像等多维度内容,有更多的想象空间。
所谓生成式 AI 视频生成,就是通过计算机视觉、机器学习、ViT架构等多种AI技术手段,可实现视频内容生成过程的自动化。
无论是文生视频,还是图生视频、视频生视频,AI 驱动的视频生成工具的使用不断增加,将有助于增强视频制作工作流程,为影视、游戏、培训与教育、营销与广告、社交媒体等领域发展提供更多增长空间。
据Fortunebusinessinsights数据,2024年,全球 AI 视频生成市场规模预计达6.148亿美元,预计到2032年,整个市场规模将超过180亿元,增至25.629亿美元(约合人民币186.36亿元),年复合增长率19.5%,市场前景广阔。
早在Sora发布之前,2023年1月起,Runway、Genmo、英伟达、Pika等海外公司都迅速公布 AI 视频生成和多模态技术产品。而随着Sora爆火,AI+视频技术和产品正在迅猛升级迭代,诸如电影、广告、视频剪辑、视频流媒体平台、UGC 创作平台、短视频综合平台等众多行业有望受益。
-
智谱、生数科技(清华系)、爱诗科技、智象未来HiDream(中科大系)等初创公司和产业链上下游企业; -
快手、字节跳动、腾讯、阿里等拥有短视频和 AI 技术的互联网科技龙头; -
TeleAI、智源等央国企搭建的AI研究院和新型研发机构。
商业化层面,AI视频生成提供To C端、To B端服务两种。如今,不少AI产品已经开始进军海外,并且推出了较为完备的会员付费体系,快速进行商业化变现。
C端层面,快手可灵、字节即梦、智谱清影、生数Vidu都提供每月的付费服务,或者是有一定限额免费生成AI视频;而B端层面,快手可灵、字节即梦(火山引擎)、生数Vidu、爱诗科技、智象未来等都提供API接口和相关解决方案服务。
AI生成视频仍无法彻底替代影视行业

(文:钛媒体AGI)