高质量音频民主化,ai|coustics用生成式AI解决糟糕的音频问题获500万欧元融资
总部位于柏林的ai|coustics在500万欧元种子轮融资中获得支持,计划利用资金扩展平台和优化市场渗透。该公司通过软件解决方案提供高质量音频,解决语音AI应用中的低质量数据问题。
总部位于柏林的ai|coustics在500万欧元种子轮融资中获得支持,计划利用资金扩展平台和优化市场渗透。该公司通过软件解决方案提供高质量音频,解决语音AI应用中的低质量数据问题。
NewSound推出首款由AI驱动的非处方助听器,集成Femtosense AI加速技术和Clara语音增强技术,解决听力受损者在嘈杂环境下的理解难题。
Sonible公司推出AI驱动的纯:deess插件,用于去除人声中的齿音和刺耳频率。它通过实时分析输入信号自动识别不同的齿音并计算目标频谱以达到理想状态。用户可以通过简单的旋钮调节抑制强度,同时提供颜色和频谱塑形功能,支持多种格式和授权方式,适用于录音、混音等多种场景。
Skywork AI(昆仑万维)发布了Mureka O1和Mureka V6模型,作为首款音乐推理大型模型,超越了SunO。Mureka V6支持多种语言生成AI音乐,而Mureka O1引入了CoT技术,显著提高音乐质量、效率和灵活性。两款产品现已全面上市。
阿里巴巴发布Qwen2.5-Omni-7B多模态AI模型,支持文本、图像、音频和视频等多种数据形式,并在手机和平板等终端设备上高效运行,推动AI技术普及。
洛杉矶初创企业Noctal完成180万美元种子轮融资,用于开发全球首个AI音效导演系统。创始人Isaiah Chavous曾管理2600万美元预算,并在山火中逃生。融资由Caruso Ventures领投,计划2025年推向市场。Noctal的核心技术包括时空感知音频引擎、情境化音景生成、风格迁移系统等。
纽约地铁系统引入AI技术进行实时轨道检测和维护,通过谷歌Pixel手机收集数据并利用机器学习模型识别隐患,有望减少突发故障导致的延误,节约维护成本,并为其他城市提供借鉴。
语音克隆人工智能技术快速发展,但缺乏有效监管导致安全隐患。去年民主党初选事件暴露出其潜在风险,多种工具存在安全漏洞。《消费者报告》发现大多数公开可用的语音克隆工具易于绕过安全性措施。此技术易被滥用,可能导致虚假信息传播和个人隐私侵犯,亟需加强监管和自我约束。
OpenAI发布了两款新的音频模型GPT-4o-transcribe和GPT-4o-mini-transcribe,旨在提升语音转文本的准确性,并引入可操控性文本转语音功能。此举为自然、直观的口语对话迈出了重要一步。