新智元，作者每时AI - 第103页共111页

NeurIPS 2024最佳论文开奖！北大字节NUS夺冠，Ilya连续三年获奖

2024年12月11日14时作者新智元

新智元报道
编辑：编辑部 HYZj
【新智元导读】
NeurIPS 2024最佳论文终于正式揭晓了！

2024年12月11日12时作者新智元

顶尖多模态大模型在AV-Odyssey基准测试中表现不佳，无法正确分辨声音大小。研究团队提出DeafTest和AV-Odyssey评估基准，揭示音频感知仍是大模型的主要瓶颈。

2024年12月11日12时作者新智元

OpenAI Day 4直播展示了Canvas新功能，用户可以直接使用Canvas编辑文档、运行Python代码并检查语法。此外，研究人员还演示了如何将Canvas整合进自定义GPTs中。

2024年12月11日12时作者新智元

谷歌发布的PaliGemma 2模型在多个视觉语言任务上取得领先成绩，支持多种分辨率和参数规模，并且在OCR、表格识别、乐谱识别及医学报告生成等任务中表现突出。

2024年12月11日12时作者新智元

新智元报道
编辑：编辑部 HYZ
【新智元导读】
从一家濒临破产的公司，英伟达最终走向全球市值第一。

2024年12月10日16时作者新智元

新智元报道
编辑：编辑部 HYj
【新智元导读】
谷歌团队再创量子计算里程碑！全新量子芯片Willo

2024年12月10日16时作者新智元

新智元报道
编辑：LRS
【新智元导读】
Allen Institute for AI（AI2）发布

2024年12月10日16时作者新智元

国内智源研究院推出的See3D模型从大规模无标注的互联网视频中学习，生成相机可控且几何一致的多视角图像，支持零样本和开放世界的3D生成，并开源了相关代码。

2024年12月10日16时作者新智元

新智元报道
编辑：LRST
【新智元导读】
研究人员提出首个可以渲染高动态范围（High Dynam

2024年12月10日12时作者新智元

新智元报道
编辑：桃子好困
xAI发布自研图像生成模型Aurora，集成到Grok中。耗时6个月研发完成，采用MoE架构训练的自回归混合专家模型提升了Grok的图像生成能力。