2024-12-17 - 第9页共10页

今日软荐：MSST WebUI：一个集成了音源分离训练框架和 UVR（终极人声消除器）的强大 Web 界面。

上午8时 2024/12/17 作者开源星探

MSST 是一款集成了音源分离训练框架和UVR（终极人声消除器）的强大Web界面工具，提供直观的用户界面、灵活的自定义处理流程以及多种预训练模型支持，满足音频爱好者和专业工作者的需求。

上午8时 2024/12/17 作者 AI前线

OpenAI 今日发布了 ChatGPT Search 的更新和优化功能，包括更快的搜索速度、地图体验、语音查询以及自动确定网络最新信息的功能。

上午8时 2024/12/17 作者 AI前线

作者 | Ilya Sutskever
译者 | 王强
策划 | Tina
上周五的人工智能顶级会议

上午8时 2024/12/17 作者 GitHubStore

MMAudio 是一个用于生成同步音频的项目，利用多模式联合训练从给定视频和/或文本输入中生成音频。它允许对广泛的数据集进行训练，并将生成的音频与视频帧对齐。

上午8时 2024/12/17 作者 APPSO

Google Deepmind 推出的新视频模型 Veo 2 和 Imagen 3 提供了更高分辨率的视频生成能力，并改进了指令识别和物理现象模拟功能。Veo 2 还引入了不可见的 SynthID 水印以确保其 AI 生成属性，而 Imagen 3 在多个国家推出的同时支持多种艺术风格的图像创作。

上午8时 2024/12/17 作者甲子光年

中国的人工智能产业正从拼参数转向拼应用。
作者｜王艺
2024年已接近尾声，但人工智能的热度仍未消减

上午8时 2024/12/17 作者量子位

谷歌发布Veo 2版本，其图像生成模型Imagen 3也有所改进。该模型能够根据文本或图像生成高质量视频，并能更好地理解现实世界物理现象及人类表情。

上午8时 2024/12/17 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨大猿搬砖简记
来源丨大猿搬砖简记
编辑丨极市平台
极市导读
本文