大模型黑盒探秘:通过“电路追踪”(Circuit Tracing)揭示大模型内部推理机制?

2025年3月29日周六,北京晴天。文章提到了创业的观点和MCP的概念,并介绍了大模型推理可解释性的电路追踪分析方法及其应用实验。通过类比神经回路来揭示语言模型内部的计算机制,研究者构建了归因图以可视化模型的中间步骤,发现大模型在处理各种任务时具有多步推理、规划及复用不同语言特征的能力。

LLM从构建到应用工具全集:推理大模型Github索引梳理

2025年3月17日文章总结:介绍了两个关于LLM和推理大模型的GitHub汇总项目。第一个涵盖数据处理、训练、部署等多个方面,第二个专注于语言模型及多模态推理技术,并提供相关论文、代码库等资源。