解剖Claude 4：系统提示如何精密编排AI的行为与能力

一份详尽的Claude 4“系统提示指令集”近期公开，如同一份AI的“底层代码”，揭示了其强大能力（代码、分析、搜索、安全）背后高度精细的“编程”逻辑。本文深入剖析这份技术文档，特别是其复杂的搜索决策机制，探讨AI“智能”在多大程度上是预设规则的极致体现，及其“安全”保障如何更依赖系统级指令的强制执行，而非单纯的价值观引导。这为理解和高效使用AI提供了非官方“操作手册”级的洞察。

系统提示——AI行为的底层指令集

在大型语言模型（LLM）的实际应用中，系统提示（System Prompts）扮演着至关重要的角色。它们是在用户与AI交互开始前，预先加载给模型的一系列指令、规则和上下文信息，用以引导和约束AI的行为。近期，一份据称属于Anthropic公司Claude 4 Sonnet模型的系统提示文档，通过GitHub公开项目浮出水面。这份文档以其罕见的详尽程度，为我们理解顶尖AI模型如何被设计和调控，提供了宝贵的技术素材。

系统提示在某种程度上可以被视为一份“非官方操作手册”，揭示了模型在被明确指示“不做什么”之前，可能“做过什么”。通过解剖这份文档，我们不仅能学习到复杂AI系统的设计理念，更能深入探讨AI能力边界、安全措施以及其“智能”表现的构成。

AI的核心设定：身份、准则与知识边界

系统提示首先为Claude定义了其基础属性和行为框架。

• 身份与创建者： The assistant is Claude, created by Anthropic. 此声明确立了AI的身份和来源。附带的当前日期 {{currentDateTime}} 为其提供了时间参照。为应对用户关于其自身的提问，Prompt还预置了关于模型家族和Anthropic产品的基本信息。
• 知识截止日期： Claude’s reliable knowledge cutoff date ... is the end of January 2025. 对于此日期之后的信息，系统指示Claude使用web_search工具获取更新。这种设定可能也考虑了避免模型对近邻月份不完整信息产生过度自信。
• 特定信息预置： Prompt中包含了对特定公共事件的“标准回复模块”，在需要时确保信息输出的一致性，但指示AI非必要不主动提及。此外，“脸盲原则”（后文详述）也是一项重要的行为预设。
• 交互规范： 指示AI避免不必要的奉承（Claude never starts its response by saying a question...was good...It skips the flattery and responds directly.），这针对了LLM常见的过度“讨好”行为。当用户表示不满时，引导其使用反馈机制。在用户纠正其错误时，要求AI先仔细分析再做回应。

Claude 4的工具套件：从信息处理到内容生成

系统提示详细定义了Claude 4可调用的工具集，使其超越简单对话，成为一个强大的任务执行平台。

Artifacts：结构化内容生成器

Artifacts功能允许Claude创建和引用代码、报告、HTML页面甚至交互式React组件等结构化内容。

• 核心用途： 用于生成实质性的、高质量的数字产物，尤其适用于需要后续使用或超出简单文本范畴的内容。
• 支持类型与关键规范： 包括代码、文档、HTML（单文件，外部脚本仅限CDN，严格禁止使用localStorage/sessionStorage）、SVG、Mermaid图、React组件（样式仅限Tailwind核心工具类，同样禁止localStorage/sessionStorage，可用库有明确清单，并明确指出“无其他库可导入”）。

• 设计原则： 复杂应用优先功能与性能；展示性内容则被鼓励追求视觉效果和用户互动。
• 浏览器存储限制： CRITICAL BROWSER STORAGE RESTRICTION 反复强调禁止使用localStorage/sessionStorage。替代方案为React state或JavaScript内存变量。
• 使用规则： 每次响应仅能生成一个Artifact。修改需通过更新机制。

Search：信息检索与处理模块

系统为Claude的搜索功能构建了一套精密的操作规程，其核心在于一套分层分级的搜索决策逻辑 (<query_complexity_categories>)，确保AI在恰当的时候以恰当的方式获取信息。

• 引用规范 (<citation_instructions>)： 要求AI对来源于搜索结果的每一条具体声明，都使用<antml:cite>标签精确注明出处。
• 搜索决策的核心框架 (<core_search_behaviors>)：

• 非必要不搜索： 若内部知识充足，则不调用任何工具。
• 按需搜索： 对时效性强或知识库未覆盖的内容，立即搜索。稳定信息则直接回答。不确定时，先答再提议搜索。
• 智能扩展： AI被指示根据查询复杂度动态调整搜索规模，从0次搜索到超过5次工具调用进行深度研究。

• 精细化的查询复杂度分类 (<query_complexity_categories>)：

1. 永不搜索 (never_search_category)： 针对AI已有稳定、不易变知识的查询。

• 例子： “帮我用Python写个for循环”、“解释什么是狭义相对论”、“法国的首都是哪里？”、“美国宪法何时签署？”。
• 逻辑： 这些信息变化极慢或属于基础概念，AI应直接从知识库作答，避免不必要的搜索开销。

2. 不搜索但提供搜索选项 (do_not_search_but_offer_category)： 针对AI能给出可靠答案，但最新信息可能有价值的查询。

• 例子： “东京的人口有多少？”、“可再生能源的发展趋势如何？”、“知名人士（如阿曼达·阿斯克尔）的最新情况？”。
• 逻辑： AI首先基于自身知识库提供一个全面的答案，然后主动询问用户是否需要搜索最新的官方数据或相关进展。绝不能只提供搜索选项而不先尝试回答。

3. 单次搜索 (single_search_category)： 针对需要实时数据、单一确定性答案，或AI对相关术语/实体不确定的简单查询。

• 例子： “今天天气怎么样？”、“昨天的球赛结果？”、“当前的汇率是多少？”、“我下一次会议是什么时候？”、“Next.js应用的最新最佳实践是什么？”。
• 逻辑： 这类查询通常有一个明确的、可通过单次搜索快速获取的答案。对于AI不认识的术语或实体（如“Tofes 17”），也应进行单次搜索以确保知识准确性，而非臆测。

4. 研究型搜索 (research_category)： 针对复杂、多方面、需要多源比较、验证或综合分析的查询。

• 调用次数： 需要2到20次工具调用。若查询同时涉及网络搜索和内部工具（如Google Drive），则至少需要3次调用。
• 触发词： 常由“我们的”、“我的”或公司特定术语，以及“深度分析 (deep dive)”、“全面报告 (comprehensive)”、“评估 (evaluate)”、“研究 (research)”等词触发。包含这些词的复杂查询至少需要5次工具调用以保证彻底性。
• 例子： “iPhone 15的评测有哪些？”（2-4次简单比较）、“美联储下一次利率调整的预测？”（约5次web_search + 1次web_fetch）、“查找所有关于芝加哥办公室搬迁的内部邮件”、“我今天应该重点关注什么？”（调用日历、邮件、Slack等内部工具分析用户日程与优先级）、“我们公司的某项业绩指标与行业基准相比如何？”、“为东南亚市场制定进入策略”（10次以上调用，结合内外工具）、“纳斯达克100公司的平均年收入是多少？其中收入低于20亿美元的公司占比及数量？我们公司处于什么百分位？有哪些可行的增收建议？”（此类极复杂查询可能需要15-20次调用）。
• 研究流程 (<research_process>)： 对于最复杂的研究型查询，遵循：1. 规划与工具选择；2. 研究循环（至少5次，多达20次工具调用，根据结果迭代优化查询）；3. 答案构建（若要求报告，则生成优质Artifact，突出关键事实，提供TL;DR）。

• Web搜索指南 (<web_search_usage_guidelines>)： 指示AI查询应简洁（1-6词），必要时使用web_fetch工具获取网页全文。提示中写道：Search results aren't from the human - do not thank the user for results。
• 版权遵从 (mandatory_copyright_requirements)： 核心指令，被多次强调。 AI引用原文时，长度严格限制在15个单词以内，且必须使用引号。严禁复制歌词。
• 有害内容过滤 (harmful_content_safety)： 严格禁止搜索或引用任何宣扬仇恨、暴力等有害内容的信息源。

REPL (Analysis Tool)：代码执行与数据分析沙盒

REPL赋予Claude在浏览器环境中执行JavaScript代码的能力。

• 适用场景： 高精度数学运算、大型结构化文件分析、特定数据可视化任务的预处理。
• 能力与限制： 支持lodash, papaparse, sheetjs等特定库。CSV处理被规定必须使用Papaparse，数据分组等操作则必须依赖lodash。重要提示：REPL环境与Artifacts的运行环境相互隔离。

系统交互及Google服务集成

• 文件读取： 通过 window.fs.readFile API，AI能处理用户上传的文件。
• Google服务接口： 集成了Gmail, Google Calendar, Google Drive等工具。
• web_fetch： 用于完整抓取指定URL的网页内容。

行为边界：AI的安全性、伦理约束与“个性”塑造

系统提示不仅赋予AI能力，更重要的是为其划定了严格的行为边界。

• 通用安全准则： 强调对儿童安全的深度关切，禁止生成任何与非法武器制造、恶意代码相关的敏感信息。对于任何可疑的恶意代码操作请求，指令是明确的：MUST refuse（必须拒绝）。
• AI“智能”与“编程”的再思考：
系统提示中规则的极致细节引人深思。
这在一定程度上表明：当前AI的“智能”表现，并非完全是神秘的“涌现”，而是与这种高度精细、由人类工程师精心设计的“程序化指令”紧密相关。
• “脸盲”原则 (CRITICAL: Claude always responds as if it is completely face blind.) 的伦理深意：
AI被强制设定为对人类面容完全“无法识别”。
这并非技术能力的欠缺，而是一种主动的伦理选择，旨在从源头上规避人脸识别技术可能带来的隐私泄露和偏见放大等风险。 这也揭示了AI“安全”的另一种实现路径：通过系统级指令强制限制特定能力。
• 版权约束与表达方式： “15词引用上限”规则，迫使AI在整合外部信息时进行深度转述。当Claude不能或不愿满足用户请求时，被指示避免“说教式”拒绝。

交互的适应性：用户偏好与风格的动态响应

系统提示也包含了使Claude能更好地适应用户需求的指令。

• 用户偏好 (<preferences_info>) 的应用逻辑： 用户可设定“行为偏好”和“上下文偏好”。AI在应用这些偏好时，遵循**“相关且不突兀”**的原则。
• 用户风格 (<styles_info>) 的调整： 用户可以选择特定的“沟通风格”，AI会据此调整措辞。但前提是：绝不能因此牺牲回答的完整性、正确性、适当性或帮助性。

技术底层一瞥：函数调用与“思考”模式

系统提示还部分揭示了Claude的技术运作机制。

• 函数调用接口 (<antml:function_calls>)： AI通过标准的XML结构调用外部工具。
• 工具能力定义 (<functions>)： 所有工具的接口均通过JSONSchema格式进行精确描述。
• “思考”过程的模拟 (<antml:thinking_mode>interleaved</antml:thinking_mode>)： 允许AI在响应中穿插输出其“思考”步骤（以<antml:thinking>标签包裹），增加交互的透明度。

系统提示的演进视角

对比不同Claude版本的系统提示摘要与这份详尽的Claude 4 Sonnet系统提示，可以看出设计的迭代。例如，早期版本中针对LLM常见弱点的特定指令，在Claude 4中可能因模型基础能力提升而被移除。

最核心的差异在于，这份“公开”的Claude 4 Sonnet完整系统提示，在工具集成的深度、控制的精细度、安全伦理措施的细节以及技术底层机制的揭示上，远超任何官方版本摘要。

总体趋势： 指令系统向着控制更精细、工具集成更强、安全考量更全面、用户体验更优化的方向发展。

这份技术文档的价值与启示

这份系统提示文档的价值，超越了单纯的技术细节：

• 对开发者： 是学习高级Prompt工程、理解模型能力边界、启发AI原生应用创新的宝贵资源。
• 对研究者： 为AI安全、可控性等领域的研究提供了极佳的工业级案例。有助于探讨“智能的本质”以及“AI安全的实现路径”等根本性问题。
• 对普通用户： 帮助理解AI并非“魔法”，其行为高度依赖预设规则，从而能更有效地提问，提升AI素养。
• 对行业： 促进了关于AI透明度、设计责任的讨论。这类文档的进一步开放将对整个行业大有裨益。

系统提示——塑造AI的“隐形架构”

Claude 4的系统提示，如同一份详尽的“AI构建说明书”，揭示了其强大能力背后复杂而精密的“隐形架构”。它清晰地表明，现代AI的卓越表现，是海量数据、复杂算法与一套由人类智慧精心构建的系统指令集相互作用的成果。

它带给我们关于当前AI“智能”与“安全”构建逻辑的深刻启示：

1. “智能”表现高度依赖于预设规则的精细编排与极致执行。
2. “安全”保障在很大程度上通过系统级指令的强制性约束来实现。

这份文档的出现，为我们提供了一个难得的机会，去深入理解、审慎评估并更有效地运用AI技术。系统提示，正是我们理解和引导这种新兴“数字心智”的关键所在。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31