斯坦福大学教授李飞飞团队:关于 2024 年人工智能发展报告总结

斯坦福大学李飞飞团队发布的2024年人工智能发展报告指出,AI在图像分类和语言理解等特定任务上超越人类,但面临成本上升、数据用尽等问题。美国、中国和欧洲主导AI模型研究与发展,中国在专利方面领先。

视觉语言模型能否实现鲁棒的数学推理?UC伯克利发布测评基准DynaMath

本文介绍了一项新的动态生成的测评基准DynaMath,用于评估和研究视觉语言模型在处理多模态数学问题时的推理能力。通过分析当前最强的一些视觉语言模型(如GPT-4o)在简单数学题上的表现,发现它们存在漏洞和鲁棒性不足的问题。DynaMath提供了501个高质量、多主题的种子问题及其变体,评估了14个最先进的视觉语言模型的表现,揭示了其推理稳健性的局限性。

一只暹罗猫竟是论文作者!谷歌学术20岁,创始人首次公开最魔幻学术故事

谷歌学术创立20周年,两位创始人分享使用技巧和趣闻。包括AI提纲、法律资源访问、现成引用格式生成等功能,并关注特定作者获取提醒。面对AI竞争者,谷歌学术仍在积极拥抱AI提升用户体验。