WebWalker:大语言模型在网页遍历中的基准测试 上午8时 2025/01/21 作者 NLP工程化 WebWalkerQA评估大型语言模型执行网页导航能力的基准,结合WebWalker的RAG在实际场景中有效集成横向搜索和纵向页面挖掘。