最大肺活量的音频模型来了!SpeechSSM 能一口气生成16分钟音频,人都分不出来!

SpeechSSM 新模型可一口气生成16分钟语音故事,无需文字辅助。相比传统AI「业余选手」,它采用分割处理内容方法,使模型在任何时刻只需处理固定长度的内容,并保持声音特征稳定,实现流畅连贯的即兴演讲效果。

斯坦福研究:ChatGPT性能,曾出现下降趋势

专注于AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。斯坦福大学与加州伯克利大学发布的《ChatGPT行为随时间变化》论文详细分析了GPT-3.5和GPT-4的性能波动及其原因,包括指令遵循度的变化、内容过滤能力的下降等问题。