最大肺活量的音频模型来了!SpeechSSM 能一口气生成16分钟音频,人都分不出来!

SpeechSSM 新模型可一口气生成16分钟语音故事,无需文字辅助。相比传统AI「业余选手」,它采用分割处理内容方法,使模型在任何时刻只需处理固定长度的内容,并保持声音特征稳定,实现流畅连贯的即兴演讲效果。