又一开源AI克隆数字人,音频驱动图片中角色口型生成视频,支持卡通角色。 下午11时 2025/05/20 作者 开源AI项目落地 FantasyTalking 是一款先进的音频驱动肖像动画生成技术,支持通过音频信号控制表情、唇部动作和身体姿态生成自然流畅的动画。
来了,阿里巴巴开源最强大模型Qwen3,一开源就收获超17k星,效果超越顶级大模型 上午11时 2025/04/29 作者 每日AI新工具 ,提供多种尺寸和专家模型,具备优秀推理、对话和工具使用能力。 Qwen3 是由阿里云 Qwen 团队
阿里巴巴发布FantasyTalking,它可以对角色进行口型同步,并具有逼真的面部和全身动作 上午8时 2025/04/12 作者 NLP工程化 阿里巴巴发布FantasyTalking,能够实现角色口型同步,并具备逼真的面部和全身动作,表现优于现有SOTA方法。