快速生成
开源播客TTS神器!高效TTS模型:Muyan-TTS,0.33秒生成1秒音频,零样本语音合成!
Muyan-TTS 是一款专为播客场景设计的开源文本转语音(TTS)模型,具有超低延迟生成能力、支持自定义说话人及长文本连续合成等特性。主要特点包括快速生成、说话人适配和离线部署友好。
几秒生成逼真3D场景,泛化媲美Stable Diffusion 浙大&蚂蚁等提出Prometheus
↑ 点击
蓝字
关注极市平台
作者丨AI生成未来
来源丨AI生成未来
编辑丨极市平台
极市导读
浙大
在线教程丨10s 出图!腾讯首个 3D 生成大模型上线
腾讯团队推出Hunyuan3D-1.0,仅需10秒生成高质量3D资产。该框架结合多视角生成与稀疏视角重建技术,在质量和效率上实现了平衡,支持文生3D和图生3D功能。