AI「视觉图灵」时代来了!字节OmniHuman,一张图配上音频,就能直接生成视频 下午11时 2025/02/05 作者 机器之心 字节跳动推出的新技术OmniHuman能够利用单张图片和音频生成生动人物视频,支持任意大小的人物占比。OmniHuman采用多模态混合训练策略,从大规模数据中受益,解决了现有方法的局限性。