在2025年的CES展会上,Skyworks公司推出了一款全新的软件解决方案,可以显著提升电影对白的清晰度,同时不降低整体音质。这款名为“AI Dialog Boost”的嵌入式软件,通过改善语音清晰度,为多种媒体播放和捕捉设备提供了全新体验。该软件可以根据不同的嵌入式应用进行定制,确保包括音响条(soundbars)、耳机、电视、收音机以及其他音频设备在内的多种设备都能获得更好的音质表现。
我们有多少次在观看动作电影时,因为对白、音乐和音效的音量不匹配而不得不启用字幕?根据CBS新闻的一项最新调查,超过一半的美国人至少有时会使用字幕。这表明,许多人在他们的理想听音音量下仍难以听清对白。而Skyworks公司创造了一种能够解决这一反复出现问题的方案,同时又不会降低背景音质:Skyworks AI Dialog Boost。
基于Skyworks的AI降噪模型,这款创新的解决方案能够将对白、旁白以及其他形式的语音从背景音乐和音效中分离出来,并实时进行重新混音。有别于传统的算法方法(通常简单粗暴地调整频率和动态范围,导致非语音声音质量下降),Skyworks的AI Dialog Boost通过语音分离和增强技术来实现这一点,同时在现有音频处理路径中集成时不会增加任何延迟。
这一能够从通用音频信号中隔离语音的先进AI技术,基于一款获得专利并获奖的神经网络,经过大量语音和噪声信号的训练。该解决方案从企业级到边缘设备均可扩展,并且在典型的实现中,仅需大约300万参数,同时在集成到现有音频处理路径时不会引入任何延迟。
作为一种可扩展的算法,Skyworks AI Dialog Boost能够根据具体嵌入式应用进行定制。这一解决方案运行在600MHz的Tensilica HiFi4内核上,CPU负载低于80%,以48kHz的立体声格式工作。而且,由于该处理是实时进行的,系统设计者可以让终端用户根据自己的偏好设置混音的级别。
Skyworks AI Dialog Boost的集成还可应用于麦克风或视频设备中,使其在摄像头系统内即可实时处理,显著减少风声、操作噪音和环境噪音等不必要的声音,从而能够直接捕捉高质量的语音,而无需后期处理。
“AI在这一领域是一个颠覆性技术,提供了从现有音频混合中实时提取语音的独特能力,这在以往只能是梦想。它将在诸如电视和音响条等多种应用中产生重大影响,为系统设计者提供自定义调整功能,并为听力受损人群提供改善,同时也让听力正常的人群受益。”Skyworks音频与AI系统组的市场总监Shawn Scarlett表示。
“Skyworks在利用AI突破传统信号处理技术的创新上处于行业领先地位,而我们的AI Dialog Boost正是这一演进的完美例证。它不仅能提供突破性的性能,同时也能满足嵌入式应用的扩展需求。此外,它还将补充我们的新款SM4G音响条处理器,使其更容易推出一款高质量、功能丰富的音响条产品。”
Skyworks AI Dialog Boost将成为即将推出的SM4G音响条处理器的关键组成部分,进一步提升Skyworks在消费音频领域的行业声誉。
(文:AI音频时代)