TokenSkip归档 - 每时AI

港理工提出TokenSkip：让大模型在CoT中“跳”过冗余token，压缩40%，性能几乎不降！

MLNLP社区致力于促进国内外机器学习与自然语言处理领域的交流合作。近日，一篇关于LLM的论文提出TokenSkip方法，通过跳过不重要token来压缩思维链，提高推理速度和用户体验。