GPT-4o再暴露「弱智」缺陷,大模型无一幸免!港中文等发布「视觉听觉」基准AV-Odyssey:26个任务直指死角问题

顶尖多模态大模型在AV-Odyssey基准测试中表现不佳,无法正确分辨声音大小。研究团队提出DeafTest和AV-Odyssey评估基准,揭示音频感知仍是大模型的主要瓶颈。

深度|AI正在重塑互动体验:从《换你来当爹》到《灵魂提取器》,爆款AI游戏的新玩法

AI技术推动下,虚拟数字人和AI养成类游戏成为新趋势。《换你来当爹》等游戏通过AI生成工具实现个性化创作,《灵魂提取器》让用户轻松创建个性化的虚拟角色。

文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了

上海科技大学硕士生徐京伟和忆生科技王晨宇等人提出的CAD-MLLM模型,支持文本、图像和点云输入生成高质量的CAD模型。该模型填补了CAD多模态数据资源的空白,并提出了四种评估CAD拓扑质量和空间封闭性的指标。