提高性能归档

探索LLM如何捕捉和表征领域特定知识

2025年4月30日8时作者 NLP工程化

本文揭示了大型语言模型在预填充阶段的隐藏状态中内在地编码了领域特定知识，并提出了一种利用这些轨迹进行查询路由的模型选择策略，显著提高了性能特别是开放式生成任务的表现。

2025年4月5日16时作者机器之心

近期研究提出的新方法三思而后行（Think Twice）通过多轮推理显著提升了大语言模型的性能，无需新的训练，仅需简单的提示工程。