2024-11-23 - 每时AI

斯坦福大学教授李飞飞团队：关于 2024 年人工智能发展报告总结

上午10时 2024/11/24 下午11时 2024/11/23 作者 Datawhale

斯坦福大学李飞飞团队发布的2024年人工智能发展报告指出，AI在图像分类和语言理解等特定任务上超越人类，但面临成本上升、数据用尽等问题。美国、中国和欧洲主导AI模型研究与发展，中国在专利方面领先。

如何建立自己的AI系统：AI工具使用流程及方法论

上午10时 2024/11/24 下午9时 2024/11/23 作者 AI寒武纪

分享一位AI实践者的工具流：通过灵活运用和组合多种AI工具建立了一个不依赖单一产品的高效工作体系。涵盖文本、研究、多媒体及编程等多个领域。

蒸馏超越原版！上交大团队o1复现新突破，警示AI研发”捷径陷阱”

上午10时 2024/11/24 下午8时 2024/11/23 作者 PaperWeekly

©作者 |
GAIR研究组
单位 |
上海交通大学
自从 OpenAI 发布展现出前所未有复杂推理能

大模型在连续学习中真的遗忘了吗？重新审视基于预训练语言模型的增量学习

下午1时 2024/12/11 下午8时 2024/11/23 作者 PaperWeekly

论文题目：
Learn or Recall? Revisiting Incremental Lear

视觉语言模型能否实现鲁棒的数学推理？UC伯克利发布测评基准DynaMath

下午1时 2024/12/11 下午8时 2024/11/23 作者 PaperWeekly

本文介绍了一项新的动态生成的测评基准DynaMath，用于评估和研究视觉语言模型在处理多模态数学问题时的推理能力。通过分析当前最强的一些视觉语言模型（如GPT-4o）在简单数学题上的表现，发现它们存在漏洞和鲁棒性不足的问题。DynaMath提供了501个高质量、多主题的种子问题及其变体，评估了14个最先进的视觉语言模型的表现，揭示了其推理稳健性的局限性。