PaperWeekly，作者每时AI - 第38页共38页

王者归来！白皮书《从头训练大模型最佳实践》开源了

下午2时 2024/11/25 作者 PaperWeekly

《Current Best Practices for Training LLMs from Scratch》是一份关于从头开始训练大型语言模型的权威指南，内容涵盖数据收集与处理、模型架构选择、训练技巧与优化策略等各个环节。

自我反思助力VLM推理！南大清华提出VLM自训练框架，支持Inference Scaling

下午2时 2024/11/25 作者 PaperWeekly

多模态大语言模型（MLLMs）在图像描述、视觉问答等场景有着良好的表现。然而，MLLMs 在需要复杂

近期必看的多模态大模型进展：从Qwen2-VL到Pixtral

下午2时 2024/11/24 作者 PaperWeekly

本文总结了近期一些备受关注得多模态大模型相关工作，包括每个模型得主要技术框架，训练数据和最终表现等。

蒸馏超越原版！上交大团队o1复现新突破，警示AI研发”捷径陷阱”

上午10时 2024/11/24 下午8时 2024/11/23 作者 PaperWeekly

©作者 |
GAIR研究组
单位 |
上海交通大学
自从 OpenAI 发布展现出前所未有复杂推理能

大模型在连续学习中真的遗忘了吗？重新审视基于预训练语言模型的增量学习

下午1时 2024/12/11 下午8时 2024/11/23 作者 PaperWeekly

论文题目：
Learn or Recall? Revisiting Incremental Lear

视觉语言模型能否实现鲁棒的数学推理？UC伯克利发布测评基准DynaMath

下午1时 2024/12/11 下午8时 2024/11/23 作者 PaperWeekly

本文介绍了一项新的动态生成的测评基准DynaMath，用于评估和研究视觉语言模型在处理多模态数学问题时的推理能力。通过分析当前最强的一些视觉语言模型（如GPT-4o）在简单数学题上的表现，发现它们存在漏洞和鲁棒性不足的问题。DynaMath提供了501个高质量、多主题的种子问题及其变体，评估了14个最先进的视觉语言模型的表现，揭示了其推理稳健性的局限性。

突发！美国或对华实施新出口禁令，涉200家中国 AI 和芯片企业｜

下午1时 2024/12/11 下午3时 2024/11/23 作者 PaperWeekly

美国商务部计划下周四公布对华半导体企业的出口限制措施，可能影响200多家芯片公司。拜登政府正推进进一步打击中国半导体准入的计划。

北大、清华等提出LLaVA-o1，视觉语言模型中的o1来了！

下午2时 2024/12/15 上午12时 2024/11/23 作者 PaperWeekly

论文标题：
LLaVA-o1: Let Vision Language Models Reason

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30