这里是“AI新榜”推出的对话栏目「头号AI玩家」,在这里我们与一线AI玩家及公司深度对话,尽力挖掘变革时代下的新故事、新探索和新洞见。
本文为第6篇,对话的是AI短片《鬼饮食》的创作者“JimHuiHui”,他在美国从事游戏UI程序设计,过去一年他利用业余时间创作了数部AI短片,期间凭借《鬼饮食》拿下了洛杉矶独立短片奖。一个程序员如何用AI“拍”出一个获奖短片?我们最近和他聊了聊。
零帧起手,谁能想到程序员也开始跨界用AI“拍”片了,作品一出手还直接拿下了美国洛杉矶独立短片奖(Independent Shorts Awards)。
获奖短片中文片名叫《鬼饮食》,讲述了中国西南县城青年徐夏,因父亲重病需筹集巨额医药费,而后在道德和法律边缘挣扎的故事。
短片导演“JimHuiHui”并非专业影视制作科班出身,而是一名在美国加州工作的游戏UI程序员。
Independent Shorts Awards是一个由全球最大电影资料库IMDb认证的国际短片电影节,在过去六年中推动了多个奥斯卡提名项目。作为一部AI短片,《鬼饮食》在这样一个非AI专属的电影竞赛中获得最佳动画金奖,这不仅对创作者来说是一种莫大的肯定,更展现出了用AI处理复杂叙事的新可能。
难以在不同镜头、场景和关键帧里保持人物画面一致性,一直以来是AI视频大规模落地应用的障碍。无论是长视频形态的电影、剧集,还是短视频形态的广告、MV、社交媒体内容,想做精细化的内容而非搞抽象整活,让人物在不同的镜头和场景下看起来一样,是创作者不得不处理的难题。
《鬼饮食》是少见的强叙事且在人物画面一致性处理上不会让观众出戏的作品。实际上,它在获奖之前就已经在社交媒体上积累了一波口碑。在X(前推特)和B站上分别获得了5万和9万的播放量,吸引同行盛赞“这是我看到的第一个用AI把故事讲完整的短片”,还有人评论留言想要短片制作用到的Midjourney风格参考sref指令。
Jim回复分享的相关Midjourney提示词为:red color tone, dim lighting, at night, animation in the style of Yoshiharu Tsuge and Masaaki Yuasa hand-drawn in a bright, colorful yet flat illustration style
制作上,Jim用到的工具都是市面上常见的AI工具,创作者本人也没有任何影视专业相关的工作或学习背景。《鬼饮食》是其出于自身创作兴趣,业余时间花费近3个月,从去年7月底到10月中旬,用242个AIGC镜头制作而成。
我们好奇《鬼饮食》的创作细节,于是联系到了Jim,和他聊了聊这部短片的详细制作过程、以及他是如何从一名程序员跨界到AI视频创作的。
如果新的一年你也想用AI进行视频创作,参加各大竞赛、开辟一个新副业,希望以下内容可以为你提供借鉴。
从戏剧到电影再到如今的短视频,无需赘言“讲故事”这一古老的人类文化活动在大众娱乐文化领域的影响力。
《鬼饮食》项目始于去年7月25日。Jim接到哔哩哔哩AI影视板块的邀约,参加了B站推出的AI影像扶持计划“奇点剧场”,合作要求创作者使用AI工具制作至少十分钟的短片,且无题材限制。
合作性质上也更偏内容合作,而非商业项目,B站会为创作者提供一定的创作补助,但项目完成后没有任何签约或商业购买行为。因而,创作者拥有足够的创作空间。
为了规避AI的缺陷,很多短片会倾向于采用意识流或梦境的创意手法,让AI自行发挥“想象力”。
但Jim在“宽松的创作要求”下,仍然选择了一个重叙事的黑色犯罪故事。
在他看来,用AI制作影片始终无法规避的一个问题是如何达到传统影片的基准线。“虽然可以用艺术流或艺术片的方式规避AI的限制,但这种方式没有办法让作品走向更广阔的观众和市场。即使是传统影视中的纯意识流影片,也是非常小的一个分支。”
“如果能够有更多的AI影片让观众用专业影视的标准,而非用AI的标准去看待,这就真正证明了AI带来的创作价值。”他补充道。
《鬼饮食》是一部黑色动画短片。黑色(Noir)是一种风格化的电影类型,通常采用高对比度画面营造压抑、阴暗的氛围,主角也往往是具有复杂心理和道德困境的人物。
这种电影类型是好莱坞的经典类型片种之一,演变至今大众电影消费中最常见的犯罪、惊悚等题材的影片中都有黑色电影的影子。
国内知名动画导演刘健的一系列具有黑色电影气质的作品《刺痛我》《大世界》给了Jim启发。“我的创作初衷是从我最舒适、最熟悉的元素出发,也就是以我的家乡——川渝地区为故事背景,把本土元素做得更酷,让海外观众在看的时候能注意到这是来自中国的作品,并且有本土独特的风格,而不是现在比较流行的科幻或奇幻类题材。”
因此,你可以在《鬼饮食》中看到夸张的大面积色块画面风格,配合影片中人物的川渝口音,以及具有地域特色的食物和路边餐厅招牌。这些元素叠加在一起既保留了本土特色,又在视觉风格上符合海外观众的观影习惯。
强烈的视觉风格,不仅契合黑色电影设定还可以减轻后期调色压力,保持影片画面风格一致性。
同时在角色形象设计上,Jim会设置一些标志性的元素,如反派角色万哥的光头、墨镜和绿色运动服等,来弥补AI生成在人物一致性上的不足。“鲜明的人物特征可以确保观众在多人的复杂场景中,能快速识别对应的角色和人物关系。”
万哥最终设定形象
这样处理的背后,其实是因为AI生图工具的限制。《鬼饮食》的制作可以分为以下3个步骤:
一是文生图阶段,用到的工具是AI文生图领域的头部产品Midjourney;
二是图生视频阶段,用AI视频工具让图片变成动态视频片段,用到的工具包括可灵、即梦、Pika、PixVerse和Runway;
三是视频剪辑阶段,用到的工具是CapCut(剪映海外版)。
在文生图阶段,如果没有专业狠活的介入,一般玩家会用Midjourney内置的人物参考cref指令和风格参考sref指令来确保画面风格和人物的一致性。
Jim一开始也是这么做的,但在实际使用过程中,他发现这两个指令并不能满足他的创作需求,很多视角的镜头生成十分困难。“cref指令虽然能够较好地还原人物形象,但生成的人物角度非常死板。例如,提示词要求生成侧面或辅助角度的画面,但它生成的人物还是正面的。”
由于没有使用Midjourney的一致性功能,Jim在人物设计阶段就设定了严格的标准:人物特点必须鲜明,尽量减少冗余元素。例如,万哥的形象最初的设定其实是寸头,但哪怕是寸头,经AI处理后也会有细微的差别。“好不容易生成的画面角度对了,结果发型有问题,让人非常头疼。当然我可以用Photoshop修一下,但那样工程量就会变得很大。”
万哥最初的形象
进入图生视频阶段,Jim主要使用的AI视频工具是可灵、即梦和Pika。“因为每个工具擅长的领域不一样,所以在这个环节我试了很多工具,可灵是综合能力最强的,无论是场景、动作还是说话镜头,尤其是人物面部特写,都能带来惊喜的效果;即梦的电影感很好,部分挥锤、砸物等动作镜头表现出色;Pika擅长生成稳定的说话动画和静态镜头。”
除了工具分散,这一环节更为核心的一个问题是AI生成的动态画面不稳定。
AI改变了传统影视制作的工作流程。原本的制作流程是线性的,遵循“编写脚本→设计分镜→拍摄→剪辑”的顺序。由于拍摄需要投入大量时间和资源,一旦需要修改脚本或分镜,就会导致时间和资源的大量浪费。
而AI工作流,由于试错成本低,创作者可以灵活地根据AI生成的镜头来调整脚本和分镜。
不过,由于技术上的限制,AI工作流带来的一个问题是创作者需要不断修改分镜和剪辑节奏去适配AI生成的镜头。
Jim认为AI生成的视频片段作为一个镜头,最大的局限是画面信息密度不足。“画面信息密度指的是单位时间内画面向观众传达的信息量。无论是画面中人物动作缓慢,还是镜头间切换时间过长,都会让观众觉得无聊,甚至影片会给人一种PPT演示的感觉。”
但对于AI来说,生成一个时长较长且有信息量的镜头是极其困难的。在《鬼饮食》制作期间,AI生成的素材限制主要体现在生成时长和动作速度上。
“去年9月,AI生成的素材时长3到5秒,与此同时,AI生成的人物动作普遍很慢。虽然最近可灵1.6更新后已经有所改善了,但整体动作速度仍然是不理想的。当时我为了加快镜头速度,去除瑕疵,平均每个镜头用到的有效时长只有1到2秒。”
为了确保AI生成的每段素材“画面信息密度足够”,Jim表示他不得不“把镜头剪得很碎”。
在一些转场的间隙,他会融入动物或食物的特写镜头作为“闲笔”,起到人物象征、暗示角色命运的作用。例如,在故事高潮部分,反派万哥胁迫男主徐夏杀人却遭到反杀。在这段戏中,分别出现了猫头鹰和蛇的特写镜头,象征着徐夏和万哥之间的对峙。紧接着的下一场戏中,出现了一个泡着蛇的酒罐,暗示万哥此时已经死亡。
Jim在他的另一部作品《硬波普枪手》中,还使用过一种模仿传统连环画或漫画书中常见的格子布局的剪辑风格。这种风格通过模仿漫画书的分格方式来呈现故事,通常每个“格子”(即镜头)展示一个完整的动作或场景,类似于漫画书中的一页,来增加每一帧画面的信息量。
此外,《鬼饮食》在场景细节上的处理非常细致。例如,街边的店铺、餐馆菜单上都出现了与场景相协调的中文文字。这些细节是Jim在文生图阶段就通过简单的AE分层动画、Photoshop添加中文字等方式融入到每个镜头中的。
影片中电视机播放的新闻也是AE分层动画,通过绿幕抠像做的。
绿幕镜头
说起推动《鬼饮食》诞生的最初契机,Jim认为可以追溯到2024年年初,他决定做一名B站UP主的那个瞬间。
驱动他做出第一部短片的重要时刻是,Pika生成了一对男女对视的镜头,让他觉得镜头中的两个人仿佛真的在对话和交流,情愫在两人之间流转。“当时《繁花》正在热播,我一开始只是想试试风格相似的图片动态生成的效果如何。”
以这个惊喜瞬间为起点,他制作了第一部AI短片《春雨》并发布在B站上。
也是因为《春雨》这部短片,让B站的AI影视团队注意到他,才有了《硬波普枪手》《鬼饮食》等作品的面世。这两部作品都是Jim受B站邀请,参加平台推出的相关AI影像项目而创作的。
这一切在Jim看来,这些都是AIGC出现之前他很难实现的内容创作。“虽然我本身有很强的创作欲望,但传统电影制作是一个重资产的领域,而且有很高的门槛。”
从《春雨》到《鬼饮食》,他一直以“一人团队”的形式独立制作每一部短片。只有《鬼饮食》的音乐、音效和人声配音部分寻求了专业人士的帮助。“目前AI语音技术很难精确地模仿人声的起伏和情感变化,尤其短片还是以川渝地区的方言为主,AI很难做到富有情感且自然的效果。”
可以说过去一年AI在图像视频领域的飞速发展,催生了像Jim这样的一批AIGC创作者涌现。在AIGC出现之前,他们有创作的欲望但苦于没有创作的工具,传统影视的行业门槛是想法与现实之间无法逾越的障碍。
如果说短视频时代的“摄像机”是人手一台的手机,那么AI的出现就如同给每个人配备了一台功能更为强大的“新型摄影机”,创作者可以不再受限于传统影视制作中高昂的成本、复杂的技术和繁琐的流程,让一人制作团队成为可能。
(文:AI新榜)