南京大学
南大周志华团队获奖,AAAI 2025杰出论文奖出炉!
AAAI 2025 在美国费城举行,共有12957篇论文投稿,录取率为23.4%。南京大学团队的‘神经符号推理不一致性的高效修正’获杰出论文奖。此外还有一篇AI对社会影响特别奖得主论文入选。
南大周志华团队获奖,AAAI 2025杰出论文奖出炉
AAAI 2025 共有 12957 篇有效投稿,录用 3032 篇,录取率为 23.4%。三篇杰出论文分别由南京大学、多伦多大学和波尔多大学等机构的研究者获得。AI 对社会影响特别奖颁发给斯坦福大学等机构的 DivShift 研究。
必看!VividTalk:阿里、南大等联合打造,一张照片+音频秒变说话头像视频黑科技
VividTalk是南京大学、阿里巴巴、字节跳动和南开大学联合开发的人工智能技术项目,通过音频驱动生成逼真的说话头像视频。该项目采用先进的3D混合先验技术和双分支运动-VAE(变分自编码器)来实现高质量的视觉效果和自然同步对话。
Hallo 登场!突破传统,音频赋能视觉合成的创新先锋
音频驱动的层次化视觉合成工具Hallo通过分层音频驱动视觉合成模块和端到端扩散范式实现了高质量的肖像图像动画生成。其精细的区域划分与同步建模、端到端的特点以及多种预训练模型支持,使其在多媒体内容创作、虚拟人物互动和智能客服等领域具有广泛应用前景。
震撼!首个开源的交互式全模态大语言模型,GPT-4o realtime的开源实现。
南京大学AI团队发布的VITA-1.5开源项目是一款接近实时的多模态大型语言模型,支持中英文,显著降低交互延迟,并在语音处理和图像理解方面取得提升。
高中辍学天才、谷歌ViT三大将集体跳槽OpenAI!组队Sora决战AGI
OpenAI挖走DeepMind和Midjourney多名顶级工程师,涉及多模态人工智能研究。其中三人曾共同发表多篇顶尖论文,包括Vision Transformer (ViT),提出了一种新的图像识别方法。