日期: 2025 年 5 月 30 日
腾讯混元开源新作!超强的音频驱动数字人生成模型,支持多角色、多风格及口型与表情同步!
腾讯混元与腾讯音乐联合开源的数字人音频驱动模型HunyuanVideo-Avatar,支持单或多角色对话和多种图像风格生成。通过一张人物图片和一段音频(最长14秒),生成高保真语音驱动动画,并引入了三项关键创新。
DeepSeek 跃居全球第二 AI 实验室,中美正式并驾齐驱!
DeepSeek R1 0528 版本在Artificial Analysis的最新排名中得分68分,几乎与闭源模型持平。这反映了开源模型与闭源模型之间差距的进一步缩小,强化学习在提升AI性能方面的效率凸显,并标志着中美两国在人工智能技术领域的齐头并进新阶段。
毕马威:企业对AI Agent智能体试点应用猛增
全球四大会计事务所毕马威发布AI应用报告显示,企业对智能体试点热情高涨,65%的企业采用购买预构建解决方案的方式。Agent应用场景广泛,包括呼叫中心、行政任务和招聘等环节。技术部门和运营部门最受益,但营销和销售等部门受益相对较少。
阿里开源自主搜索AI Agent,搜论文、网站资讯无所不能
阿里巴巴开源了自主搜索AI Agent WebAgent,具备端到端的自主信息检索与多步推理能力。它能主动搜索学术文献并进行分析总结,为用户提供全面且精准的研究报告。