在长文本上比Flash Attention快10倍!清华等提出APB序列并行推理框架 下午12时 2025/03/12 作者 机器之心 线被拉升,以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。 随之