18 条反模式速查卡

Claude Certified Architect — 考试高频陷阱与正确做法
Critical 必须避免(9 条) High 强烈建议避免(8 条) Medium 注意场景(1 条)

📌 考试提示

Architect 考试的情景题中,干扰项通常是真实的反模式。识别反模式是快速排除错误选项的关键技巧。每条反模式记住两部分:为什么错(一句话)和 正确做法(一个词/短语)。考试中看到选项描述类似反模式时,可以直接标记为可疑。

Domain 1 · Agentic 架构与编排(5 条)
01
解析自然语言判断循环是否终止
文本措辞不可靠——模型每次表达方式不同。依赖文本解析(如检查是否包含 "done")会导致循环误判。
检查 stop_reason 字段:tool_use = 继续,end_turn = 退出
Critical
02
用固定迭代上限作为主要停止机制
可能在任务中途强制停止,或允许无意义循环;不反映任务是否真正完成。
max_turns 仅作为安全网,主要靠 stop_reason 自然终止
Critical
03
用 Prompt 强制执行关键业务规则
Prompt 是概率性的——模型有时会忽略关键指令,尤其在边界案例或长对话中。
用 PreToolUse / PostToolUse hook 做确定性强制执行
Critical
04
基于情绪判断是否升级到人工
情绪激动但需求简单的客户不一定需要人工介入;纯情绪判断导致过度升级。
基于策略缺口、能力边界、明确请求或业务阈值触发升级
High
05
用模型自报置信度分数做决策
模型的置信度分数缺乏可靠校准,不能作为生产决策的判据。
用结构化标准和程序化检查做升级判断
High
Domain 2 · 工具设计与 MCP 集成(4 条)
06
通用错误消息("操作失败")
智能体在缺乏细节的情况下无法判断是重试、换方案还是升级。
返回结构化错误:isError、errorCategory、isRetryable、context
Critical
07
访问失败时静默返回空结果
智能体会把"无法检查"误判为"确实没有",导致错误结论。
明确区分访问失败(error)和结果为空(empty)两种情况
Critical
08
给单个智能体配备 18+ 个工具
工具数量超过 5 个后选择准确率迅速下降;相似工具造成歧义。
每个智能体保留 4–5 个工具,其余分配给专用子智能体
High
09
在 .mcp.json 中硬编码 API 密钥
配置文件一旦提交到 Git,硬编码的密钥就会泄露。
使用 ${ENV_VAR} 环境变量展开,永远不硬编码凭据
Critical
Domain 3 · Claude Code 配置与工作流(3 条)
10
把个人偏好放进项目级 CLAUDE.md
个人偏好不应强加给整个团队,会造成团队成员之间的摩擦。
个人偏好放 ~/.claude/CLAUDE.md,团队规范放 .claude/CLAUDE.md
Medium
11
用 commands 处理需要上下文隔离的复杂任务
Commands 在当前会话运行,会把探索噪音带入主上下文。
改用 skills 做上下文分叉(context forking)并限制 allowed-tools
High
12
CI/CD 流水线中同会话自我审查
审查者带着生成者的推理上下文,产生确认偏差——审查流于形式。
代码生成和代码审查使用单独的会话
Critical
Domain 4 · Prompt 工程与结构化输出(3 条)
13
模糊指令("要彻底" / "找出所有问题")
导致过度标记、误报和告警疲劳——开发者最终停止信任工具输出。
提供明确、可量化的评判标准(如"检查以下 5 类安全问题…")
Critical
14
假设 tool_use 保证语义正确性
tool_use 只保证 JSON 结构合法;字段值可能仍然语义错误(如错误的金额、日期格式等)。
tool_use 后额外做业务规则校验
High
15
通用重试消息("有错误,请重试")
没有具体错误细节,模型缺乏足够信号来修正——重试依然失败。
附上具体错误:字段名、出错原因、期望值 vs 实际值
High
Domain 5 · 上下文管理与可靠性(3 条)
16
渐进式摘要导致关键客户细节丢失
每轮摘要都会丢失具体信息——姓名、ID、金额、日期——最终造成错误决策。
在上下文开头放置不可变的 case facts 块,不参与摘要
Critical
17
只看聚合准确率指标(如"整体 95%")
聚合指标会掩盖特定类别的严重失败——某个文档类型可能只有 40% 准确率。
按文档类型/类别分层追踪准确率(stratified metrics)
Critical
18
多智能体数据无溯源追踪
子智能体数据冲突时,无法判断哪个来源更可信。
为所有数据追踪:来源 · 置信度 · 时间戳 · 智能体 ID
High

考前速查摘要

D1 · Agentic 控制流核心
  • 终止判断 → stop_reason
  • 业务规则 → Hook,不是 Prompt
  • 升级触发 → 策略缺口 / 能力边界 / 明确请求
  • 每智能体工具 → 4–5 个上限
  • 数据冲突 → 追踪溯源(来源 + 时间戳)
D2/D3 · 配置与工具核心
  • MCP 密钥 → ${ENV_VAR},不硬编码
  • 工具错误 → 结构化(isRetryable + context)
  • 空结果 ≠ 访问失败 → 明确区分
  • 个人偏好 → ~/.claude/,团队 → .claude/
  • 复杂任务隔离 → skills,不是 commands
D4 · Prompt 工程核心
  • 指令 → 明确且可量化,拒绝"要彻底"
  • tool_use 后 → 业务规则校验
  • 重试消息 → 包含具体错误字段和期望值
  • 代码生成/审查 → 分开会话
D5 · 上下文管理核心
  • 关键事实 → 不可变 case facts 块
  • 指标监控 → 分层追踪,不只看聚合
  • 多智能体数据 → 来源 + 置信度 + 时间戳
  • 上下文预算 → 控制在窗口 80% 以内

← 返回备考总览    全真模拟 #1 ↗