Sonos推出AI语音增强应用帮助听力障碍人士

由英国皇家听力障碍研究所(RNID)共同设计,旨在满足听力受损人士的需求,但不仅限于此,Sonos的全新语音增强解决方案现已在Sonos Arc Ultra音响条上推出。该解决方案由一个AI驱动的应用程序支持,语音增强处理能够为那些在观看电视剧、电影或节目时难以听清对话内容的人群提供清晰的语音。



正如广泛讨论的那样,电影和节目中的对话由于多种原因变得难以听清:制作仓促、混音不佳、全球各地的口音,甚至是房间的声学特性。另一个关键原因是,人们如今在流媒体服务上观看内容,而这些服务并没有遵循长期以来(大多是自我约束的)在公共和私人广播中强制执行的标准,这导致了到达消费者的平台之间存在不一致性。现代“智能电视”上过于复杂且设计不佳的用户界面往往使问题更加严重,因为消费者甚至不知道他们在观看内容时激活了哪些设置——即使他们去检查,也无法理解其中的技术术语和含义。


对于听力受损者来说,这种情况显然更糟。调高音量并不能解决问题,而字幕对于那些真正致力于享受电影制作的所有视觉元素的人来说可能会分散注意力。尽管这个问题正在通过多种方式解决——有时结果相互冲突——但Sonos决定在其自己的生态系统中提供另一种选择。


Sonos更新的语音增强功能为用户提供了四个控制级别,允许根据不同的需求调整对话清晰度,其中包括专门为听力受损者设计的一个级别。该功能于2025年5月13日通过免费软件更新首次在Sonos Arc Ultra音响条上推出。


Sonos首席研究科学家Matt Benatan表示:


“在Sonos,我们的目标始终是帮助人们享受美妙的声音。我们知道我们还能为听力受损者做更多,因此我们与RNID(皇家听力障碍研究所)展开了前所未有的合作,设计了一种语音增强解决方案,真正解决了这个群体在观看电视时面临的独特挑战。”


“这不仅仅是实用性的,更是情感上的。观看电视剧和电影最重要的一个方面是,能够围绕实时观看的文化和娱乐活动产生共鸣。如果一位观众无法完全听清对话,他们享受和参与当下的能力可能会丧失。”


据Sonos称,尽管他们的电视音响条多年来一直提供基本的语音增强功能,但这些功能往往缺乏真正解决问题所需的效率和音质。该公司现在踏上了一段漫长旅程,利用人工智能带来的可能性,打造一个有意义的解决方案。



“通过将机器学习应用于我们的语音提取技术,我们找到了一种方法,可以从中心声道中分离对话,并实时澄清语音。”Sonos声音体验工程师Harry Jones解释道。“这让我们能够在最需要的时候突出对话,而不会过度影响音量或削弱整体的影院体验。”


其结果是一个动态的语音增强工具,用户可以通过Sonos应用程序的首页选择四个不同的级别——其中最高级别是专门为听力受损者设计的。低级别在保持原始体验和创作者意图的同时,引入了微妙的对话强调;中级增强提供了更好的对话清晰度,并在周围混音元素之间达到了一种得体的平衡。这两个选项应该能满足大多数没有听力受损的用户的需求。


高级增强设置使对白明显突出,同时降低了其他混音元素的音量;而最高级别的增强则将对话清晰度置于首位,是专门为听力受损者设计的。与低、中、高级别更平衡的方法不同,最高级别进一步控制了非语音元素的动态范围,将对话牢牢置于体验的前沿。



在与RNID合作过程中,Sonos与37名不同年龄和听力能力的参与者合作,收集了他们详细的日常聆听体验,并在近一年的时间里针对各种类型的内容测试了这一功能。


RNID首席研究员Lauren Ward表示:


“我们希望确保语音增强功能适用于所有人,甚至是那些可能没有意识到自己听力受损的人。”


“英国每三名成年人中就有一人经历听力受损,而在美国,近四分之一的成年人也有听力受损的情况。这个工具有可能对大量人群产生影响。”


Sonos还与电影声音混音师Chris Jenkins合作,平衡语音提取技术,同时保持其他混音元素(如音效和音乐)的艺术完整性。“Sonos的语音增强功能是解决如今人们可获取的广泛内容带来的对话挑战的一大步。”Jenkins补充道。“这也证明了在利用人工智能进行开发时保留人为触感的重要性——我们进行了无数次聆听会话,共同调整每个设置,以确保其在增强对话的同时,仍忠实于创作者的意图。”


“在开发语音增强功能时,我们知道我们希望从最早的开发阶段就将听力受损者的视角放在首位。”Benatan说。“我们从RNID的研究人员和参与者那里学到的东西与Chris Jenkins的反馈完美互补,使我们能够考虑更广泛的听众视角。这是一次令人难以置信的合作,我们感谢他们在开发这一体验过程中所付出的专业知识和时间。”


(文:AI音频时代)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往