性能下降归档

35%准确率蒸发！字节&华科WildDoc揭示多模态文档理解鲁棒性短板

2025年6月8日8时作者 PaperWeekly

多模态大模型在文档理解领域的性能显著，但现有基准存在真实场景挑战。字节跳动联合华中科技大学发布首个真实世界文档理解基准数据集WildDoc，揭示了当前模型的不足，并提出改进策略。

2025年5月25日14时作者 AI技术研习社

实用户逐步表达需求的对话中，也会“走偏”、答非所问，甚至陷入逻辑混乱。这不仅是能力问题，更是“对话可