突破自动驾驶视频生成极限:港中文&港科大&华为联手推出MagicDriveDiT

香港中文大学、港科大与华为联合推出MagicDriveDiT,基于DiT架构设计,提升自动驾驶视频生成质量。支持昇腾Ascend NPU及NVIDIA GPU训练和推理,实现高分辨率、长时间复杂场景的视频生成。

GPT-4o再暴露「弱智」缺陷,大模型无一幸免!港中文等发布「视觉听觉」基准AV-Odyssey:26个任务直指死角问题

顶尖多模态大模型在AV-Odyssey基准测试中表现不佳,无法正确分辨声音大小。研究团队提出DeafTest和AV-Odyssey评估基准,揭示音频感知仍是大模型的主要瓶颈。