一张图片+ 一条音频,照片开口说话唱歌,多角色、情绪控制都拿捏了。

腾讯混元联合腾讯音乐发布新模型HunyuanVideo-Avatar,支持上传照片和音频生成动态视频。该模型能自动识别场景氛围和情绪,并且可以控制角色的情绪和多角色同框对话,已在多个App中应用。

又一个AI大模型的新方向,爆了…

2025年伊始,AI技术迅猛发展改变程序员职业。阿里云等企业引入大模型开发能力要求,未来企业更看重能用AI重构业务的技术人才。文章指出传统岗位缩水,而AI相关岗位需求激增,薪资上涨150%。推荐免费课程帮助掌握AI大模型原理、应用技术和项目经验,提升竞争力。

又一个开源 AI Agent 杀到!II-Agent,号称“全球最强”,击败 Genspark 和 Manus,跑分直逼人类

Intelligent Internet (II) 发布了 II-Agent,目标是“全球最强 Agent”,并承诺开源。该团队表示其设计之初就考虑了强大的能力,并且可以扩展。II-Agent 在 Meta AI 的 GAIA 基准测试中排名首位,得分75.57%接近人类水平。