35%准确率蒸发!字节&华科WildDoc揭示多模态文档理解鲁棒性短板 2025年6月8日8时 作者 PaperWeekly 多模态大模型在文档理解领域的性能显著,但现有基准存在真实场景挑战。字节跳动联合华中科技大学发布首个真实世界文档理解基准数据集WildDoc,揭示了当前模型的不足,并提出改进策略。
【最新论文】多轮对话陷阱:为什么最强大模型依然在交流中“迷失方向”? 2025年5月25日14时 作者 AI技术研习社 实用户逐步表达需求的对话中,也会“走偏”、答非所问,甚至陷入逻辑混乱。这不仅是能力问题,更是“对话可