阿里巴巴开源的 3D 动画神器,单张图片秒变可动3D人体视频!

阿里巴巴通义实验室发布的大规模人体重建模型LHM,可在几秒钟内将一张全身照片转换为可动画的3D头像,支持实时渲染和姿势控制。该模型已开源并提供在线试用和本地部署选项,能够降低技术门槛并在多个领域如内容创作、虚拟现实和游戏开发中应用。

一款刚刚开源的TTS语音模型!25ms超低延迟支持实时对话,4种规格适配全场景!

Orpheus TTS 是一款全新的开源 TTS 模型,支持接近人类的自然情感表达、超低延迟(25-50毫秒)以及强大的零样本语音克隆功能。该模型提供从 150M 到 3B 参数四种不同规模的选择。

AI语音克隆神器!Seed-VC:零样本实时转换语音和歌声,实时语音延迟最低300毫秒!

Seed-VC 是一款强大的开源语音转换和歌声转换工具,支持零样本语音克隆、实时语音转换及AI歌曲转换。它基于字节跳动 SEED-TTS 架构开发,延迟低至400毫秒,适用于配音、虚拟主播等场景。

AI思考路径可视化!ReasonGraph:这款开源工具让AI的”思考”一目了然!

ReasonGraph 是一款开源工具,将大语言模型的推理过程可视化为直观图表,支持多种推理方式,并实时更新和交互分析。它能帮助用户理解AI思考路径,适用于LLM研究、调试评估等场景。