腾讯混元开源新作!超强的音频驱动数字人生成模型,支持多角色、多风格及口型与表情同步!

腾讯混元与腾讯音乐联合开源的数字人音频驱动模型HunyuanVideo-Avatar,支持单或多角色对话和多种图像风格生成。通过一张人物图片和一段音频(最长14秒),生成高保真语音驱动动画,并引入了三项关键创新。

DeepSeek 跃居全球第二 AI 实验室,中美正式并驾齐驱!

DeepSeek R1 0528 版本在Artificial Analysis的最新排名中得分68分,几乎与闭源模型持平。这反映了开源模型与闭源模型之间差距的进一步缩小,强化学习在提升AI性能方面的效率凸显,并标志着中美两国在人工智能技术领域的齐头并进新阶段。

毕马威:企业对AI Agent智能体试点应用猛增

全球四大会计事务所毕马威发布AI应用报告显示,企业对智能体试点热情高涨,65%的企业采用购买预构建解决方案的方式。Agent应用场景广泛,包括呼叫中心、行政任务和招聘等环节。技术部门和运营部门最受益,但营销和销售等部门受益相对较少。