面部感知音频适配器归档

一张图片+ 一条音频，照片开口说话唱歌，多角色、情绪控制都拿捏了。

2025年5月28日19时作者 AI进修生

腾讯混元联合腾讯音乐发布新模型HunyuanVideo-Avatar，支持上传照片和音频生成动态视频。该模型能自动识别场景氛围和情绪，并且可以控制角色的情绪和多角色同框对话，已在多个App中应用。