OpenAI 发布新型音频模型,听起来比以往任何时候都更像人类

OpenAI发布了两款新的音频模型GPT-4o-transcribe和GPT-4o-mini-transcribe,旨在提升语音转文本的准确性,并引入可操控性文本转语音功能。此举为自然、直观的口语对话迈出了重要一步。

高通收购设备端AI先驱 Edge Impulse

加州公司Edge Impulse同意被高通收购,旨在增强其边缘人工智能应用生态系统。Edge Impulse简化了在嵌入式系统中创建AI和ML模型的过程,并已吸引了17万多名开发人员。此次收购预计将补充高通对物联网转型的战略方法,包括全面的芯片组路线图、统一的软件架构等。

AI生成交响乐,这一天终究还是来了

NotaGen 是首个针对古典音乐交响乐的 AI 音乐生成模型,来自中央音乐学院、清华和北航的开发人员宣布其开源。模型涵盖基础版及增强版NotaGen-X,并在专业数据集上进行了微调,实现高度可控性和专业性,提升了古典音乐生成质量。