
AI 初创公司 Stability AI 已与芯片制造商 Arm 合作,将 Stability 的 Stable Audio Open(一种可以生成音效的音频的 AI 模型)带到运行 Arm 芯片的移动设备上。
许多 AI 驱动的应用程序可以生成音频,比如 Suno 和 Udio,但大多数都依赖云端处理,这意味着它们无法离线使用。
此外,一些音频生成模型是在受版权保护的内容上训练的,这带来了知识产权风险。Stability 声称 Stable Audio Open 的训练,完全由免版税的音频和歌曲组成。
Stable Audio Open 在 Arm 芯片上运行,本周将在巴塞罗那的世界移动通信大会上进行演示。
它可以根据文本描述生成声音,例如“日落时分的轻柔海浪声”。Stability 表示,他们与 Arm 合作优化并“提炼”了 Stable Audio Open,将生成速度提高了 30 倍。在 Armv9 CPU 上生成一段 11 秒的音频样本大约需要 8 秒钟。
需要明确的是,优化后的 Stable Audio Open 模型目前还不能下载。但在声明中,Stability 的 CEO Prem Akkaraju 暗示,Stability 未来将努力将其模型(包括 Stable Audio Open)引入消费者应用和设备中。
“随着越来越多的专业创作者和企业采用生成式 AI 来推动他们的生产流程,我们的模型和工作流程必须无处不在,以便建设者能够构建,创作者能够创作,”Akkaraju 说。“正是出于这个原因,我们很高兴与 Arm 合作。”
该公司表示,正在与 Arm 合作,进一步优化和微调 Stable Audio Open 以适应移动设备。
Stability,这家因流行的图像生成模型 Stable Diffusion 而闻名的公司,去年在包括 Eric Schmidt 和 Napster 创始人 Sean Parker 在内的投资者寻求扭转业务的情况下筹集了新资金。
据报道,Stability 的联合创始人兼前首席执行官 Emad Mostaque 因管理不善导致公司陷入财务困境,员工纷纷辞职,与 Canva 的合作告吹,投资者对公司前景感到担忧。
在过去的几个月里,Stability 聘请了一位新 CEO,任命《泰坦尼克号》导演 James Cameron 加入其董事会,并发布了多款新的图像生成模型。
本文翻译自:Techcrunch
编译:ChatGPT
(文:Z Potentials)