北京天气晴朗归档

大模型黑盒探秘：通过“电路追踪”（Circuit Tracing）揭示大模型内部推理机制？

2025年3月29日14时作者老刘说NLP

2025年3月29日周六，北京晴天。文章提到了创业的观点和MCP的概念，并介绍了大模型推理可解释性的电路追踪分析方法及其应用实验。通过类比神经回路来揭示语言模型内部的计算机制，研究者构建了归因图以可视化模型的中间步骤，发现大模型在处理各种任务时具有多步推理、规划及复用不同语言特征的能力。

2025年3月17日14时作者老刘说NLP

2025年3月17日文章总结：介绍了两个关于LLM和推理大模型的GitHub汇总项目。第一个涵盖数据处理、训练、部署等多个方面，第二个专注于语言模型及多模态推理技术，并提供相关论文、代码库等资源。