AI音频时代

捷波朗推出面向呼叫中心的AI增强实时辅助软件

2025年6月5日14时作者 AI音频时代

Jabra推出新的呼叫中心软件解决方案Engage AI Complete，增加了实时语音转文本功能和生成式AI，帮助提高对话质量和客户满意度。

2025年5月30日14时作者 AI音频时代

Waves Audio发布AI驱动声音生成软件IlluGen，可根据文本提示生成独特的单音、音乐采样及音效，支持中文使用。

2025年5月29日14时作者 AI音频时代

研究人员开发出一种新方法提高AI学习多模态信息的能力，使机器能够自动检索视频和音频内容，并有望在新闻、电影制作等领域发挥作用。该方法通过改进训练方式和技术架构提高了模型对音频与视觉数据的对应关系理解能力。

2025年5月28日19时作者 AI音频时代

在Google I/O 2025开发者大会上，谷歌发布了先进的AI视频生成模型Veo 3，它能够同时生成带有声音的视频。该模型目前仅限美国Gemini Ultra订阅者和Vertex AI的企业用户使用。

2025年5月27日19时作者 AI音频时代

Stability AI与Arm联合发布了一种名为Stable Audio Open Small的小型文本到音频模型，能够在智能手机上运行并实现约7秒生成11秒立体声音频的效果。该模型基于ARC技术开发，参数量减少至3.41亿，内存使用量降至3.6GB，适合移动设备使用。

2025年5月26日19时作者 AI音频时代

Cirrus Logic 与广达电脑合作开发人工智能技术解决笔记本电脑音频质量问题，旨在提升用户体验和生产一致性。

2025年5月24日19时作者 AI音频时代

Audioscenic与飞利浦（Philips）和恩智浦半导体（NXP Semiconductors）合作推出了首个结合AI位置感应技术的游戏音响条参考设计。这一突破性解决方案解决了玩家在游戏时同时享受沉浸式音频体验和清晰语音聊天之间的平衡问题。

2025年5月23日19时作者 AI音频时代

英国国防人工智能公司Helsing开发的Lura和SG-1 Fathom技术旨在对水下威胁进行持续监视。该系统包括一种名为Lura的人工智能软件，能够探测比其他系统安静十倍的声音，并且能在人类速度40倍的情况下区分特定船只。

2025年5月22日14时作者 AI音频时代

Sonos推出语音增强解决方案，通过AI提升听力受损人群观看电视时的对话清晰度。该功能允许用户根据需求调整对话清晰度级别，最高级别专门设计用于听力受损者。

2025年5月21日19时作者 AI音频时代

Google扩展其实验性NotebookLM产品线，使其AI摘要功能支持超过50种语言。此更新标志着谷歌在增强AI工具可访问性和拓展多语言市场方面的重要一步。