情绪可控归档

腾讯混元开源新作！超强的音频驱动数字人生成模型，支持多角色、多风格及口型与表情同步！

上午8时 2025/05/30 作者开源星探

腾讯混元与腾讯音乐联合开源的数字人音频驱动模型HunyuanVideo-Avatar，支持单或多角色对话和多种图像风格生成。通过一张人物图片和一段音频（最长14秒），生成高保真语音驱动动画，并引入了三项关键创新。