AI音频时代
Adobe新的AI Translate Audio and Video 语音翻译功能 将视频人物语言直接改变
新的 Firefly Web 应用程序提供了一套由 Firefly 系列模型支持的工具,直接集成到 Adobe 应用程序中,新增了语音和视频翻译功能。
Ambiq 推出 AI 驱动的耳戴设备语音增强平台
在2025年CES上亮相的新方案结合了Apollo510MCU和neuralSPOTAI开发平台,旨在为智能听戴设备和OTC助听器提供技术支持。通过先进的音频处理技术,实现实时、响应迅速的语音功能和始终在线聆听体验。
AudioSourceRE 更新DeMIX Pro,新AI模型重新定义语音分离
AudioSourceRE 发布了DeMIX Pro v6.1更新,引入了强大的语音分离模块和增强的残余音轨处理,为音乐、广播和电影制作带来了新的可能性,包括从歌曲中移除说唱。
一款新的(TTS) 模型支持高保真语音克隆
Zyphra 发布了具有高保真语音克隆功能的新文本转语音(TTS)模型 Zonos-v0.1 beta,该模型基于 Transformer 和混合架构进行训练,并提供对语速、情感和音频质量的灵活控制。
YuJa,Inc. 宣布推出新的 AI 生成的增强音频描述,大规模提高视频访问性
YuJa公司推出AI生成增强音频描述功能,帮助受监管行业高效满足《美国残疾人法案》(ADA)要求,大幅降低时间和成本,实现流程自动化和体验优化。该技术通过智能暂停播放机制、多语言配音适配、交互式编辑等功能,识别关键视觉元素并生成自然流畅的语音解说,已在美国多所高校试点应用。
GN 推出ReSound Vivia – 世界上最小最智能的 AI 驱动助听器
GN推出了新款AI驱动的助听器ReSound Vivia和ReSound Savi,具备蓝牙LE Audio和Auracast广播音频功能,旨在提升用户在嘈杂环境中的听觉体验,并简化连接过程。新产品的核心在于人机工程学设计、AI技术以及低功耗特性,以提高言语理解能力和用户体验。
Nvidia 最新的 AI 技巧使低端的摄像头麦克风听起来几乎专业
Nvidia发布的新版NVIDIA Broadcast应用程序增加了‘Studio Voice’和‘虚拟主光’功能,使得RTX 3070显卡上的Logitech C922网络摄像头麦克风效果提升显著,但同时存在隐私和伦理争议。