字节跳动数字人团队归档

AI「视觉图灵」时代来了！字节OmniHuman，一张图配上音频，就能直接生成视频

2025年2月5日23时作者机器之心

字节跳动推出的新技术OmniHuman能够利用单张图片和音频生成生动人物视频，支持任意大小的人物占比。OmniHuman采用多模态混合训练策略，从大规模数据中受益，解决了现有方法的局限性。