PaperWeekly，作者每时AI

模型崩溃自救指南：5行代码实现TTA鲁棒性飞跃，天大×腾讯开源COME方案

2025-05-09 作者 PaperWeekly

文章介绍了测试时适应（TTA）方法中的熵最小化（EM），并指出其存在的过度自信和模型崩溃问题。COME通过显式不确定性建模和自适应熵优化解决了这些问题，显著提升了模型在各种复杂场景下的预测能力。

2025-05-08 作者 PaperWeekly

港科大联合发布的新基准测试集BrowseComp-ZH显示，20多个主流大模型在中文网页检索任务中的准确率普遍低于10%，OpenAI的DeepResearch仅得42.9%。研究强调当前主流模型还需提升多轮搜索和信息整合能力。

2025-05-08 作者 PaperWeekly

北京理工大学、澳门大学与新加坡国立大学联合提出Filtering-WoRA范式，实现无需全量训练的高效行人检索。该方法通过两阶段数据过滤和Weighted Low-Rank Adaptation（WoRA）显著减少模型参数并提高计算速度。

2025-05-08 作者 PaperWeekly

且在一些模型上取得了优于监督微调（SFT）的成果。
RFT 利用可验证的奖励进行训练，鼓励模型在回答

2025-05-07 作者 PaperWeekly

论文提出SCoT（推测性思维链），通过小型模型快速生成多个解题草稿，大型模型审核并选择最优解或重新编写。这种协作式推理方法能显著提升速度和准确率，同时降低成本、增加灵活性，并且代码开源便于应用。

2025-05-07 作者 PaperWeekly

ion tokenization）作为视觉与语言语义对齐的关键环节，发挥着至关重要的作用。
然而，现

2025-05-07 作者 PaperWeekly

临近毕业季，论文盲审是关键。通过即有机会毕业，未过则面临延毕风险。文章推荐修改后复审和找有经验的导师帮助来提高通过率。咕泡科技提供一站式科研辅导服务，助你快速完成论文。

2025-05-06 作者 PaperWeekly

上海交通大学、北京智源研究院和特伦托大学的研究团队推出了一种新的超长视频理解大模型Video-XL-Pro，该模型通过创新的重构式令牌压缩技术实现了近一万帧视频的单卡处理，并在多个基准测试中超越了此前发布的大型模型。

2025-05-06 作者 PaperWeekly

慢思考）。但在日常的使用中，大量用户提问的问题更多是系统 1 问题（这些问题可以直觉快速回答），他们

2025-05-06 作者 PaperWeekly

文字生成图片、视频（生成任务）。
自回归模型（就是那种一个接一个预测下一个“词”的模型）在这两方面都