字节黑科技 INFP,音频驱动的双边互动视频生成框架,实时生成,轻量又强大! 上午8时 2024/12/22 作者 开源星探 字节最新发布的INFP是一款新颖的声控头部生成框架,支持双边互动。它能够根据输入的双轨道音频实时生成虚拟头像,并实现角色自动切换、高度真实的表情与动作同步等特性。