GPT-4o再暴露「弱智」缺陷,大模型无一幸免!港中文等发布「视觉听觉」基准AV-Odyssey:26个任务直指死角问题
顶尖多模态大模型在AV-Odyssey基准测试中表现不佳,无法正确分辨声音大小。研究团队提出DeafTest和AV-Odyssey评估基准,揭示音频感知仍是大模型的主要瓶颈。
顶尖多模态大模型在AV-Odyssey基准测试中表现不佳,无法正确分辨声音大小。研究团队提出DeafTest和AV-Odyssey评估基准,揭示音频感知仍是大模型的主要瓶颈。
AI技术推动下,虚拟数字人和AI养成类游戏成为新趋势。《换你来当爹》等游戏通过AI生成工具实现个性化创作,《灵魂提取器》让用户轻松创建个性化的虚拟角色。
上海科技大学硕士生徐京伟和忆生科技王晨宇等人提出的CAD-MLLM模型,支持文本、图像和点云输入生成高质量的CAD模型。该模型填补了CAD多模态数据资源的空白,并提出了四种评估CAD拓扑质量和空间封闭性的指标。
上周有学习者希望学习多模态大模型的部署与微调,Datawhale妙妙屋提供教程开源地址。同时,Qwen2.5-Coder因朋友圈刷屏引发热议,并开源了相关教程。