Skip to content

工作流总览

Spec-First 面向研发团队,不把 AI coding 当成一次性聊天,而是把代码库事实、图谱上下文、需求、计划、任务、实现、评审和知识沉淀串成一条可审计链路。

核心主轴是:

text
Codebase -> Graph -> Spec -> Plan -> Tasks -> Code -> Review -> Knowledge

这不是强制每次都跑满的线性流程。小修可以从 Code 直接进入 Review;复杂 feature 通常从 SpecPlan 开始;历史上下文、Slack、standards、sessions、release notes 会在需要时作为证据支路进入主链路。

研发闭环总图

text
+----------------------------------------------------------------------------+
| Codebase                                                                   |
| repo files / tests / package scripts / AGENTS.md / CLAUDE.md / standards   |
+----------------------------------------------------------------------------+
        |
        | mcp-setup / graph-bootstrap / standards
        v
+----------------------------------------------------------------------------+
| Graph                                                                      |
| graph facts / impact facts / provider status / bounded direct reads        |
+----------------------------------------------------------------------------+
        |
        | ideate / brainstorm / doc-review
        v
+----------------------------------------------------------------------------+
| Spec                                                                       |
| problem frame / actors / flows / requirements / acceptance examples        |
+----------------------------------------------------------------------------+
        |
        | plan / doc-review
        v
+----------------------------------------------------------------------------+
| Plan                                                                       |
| approach / boundaries / files / risks / test scenarios / sequencing        |
+----------------------------------------------------------------------------+
        |
        | write-tasks when plan is large enough
        v
+----------------------------------------------------------------------------+
| Tasks                                                                      |
| task pack / dependencies / waves / file ownership / stop_if / test_focus   |
+----------------------------------------------------------------------------+
        |
        | work / debug / optimize / polish
        v
+----------------------------------------------------------------------------+
| Code                                                                       |
| implementation diff / tests / build output / browser or CLI evidence       |
+----------------------------------------------------------------------------+
        |
        | code-review / app-consistency-audit
        v
+----------------------------------------------------------------------------+
| Review                                                                     |
| persona findings / safe fixes / residual risks / release readiness         |
+----------------------------------------------------------------------------+
        |
        | compound / compound-refresh / sessions
        v
+----------------------------------------------------------------------------+
| Knowledge                                                                  |
| docs/solutions / refreshed learnings / release notes / future context      |
+----------------------------------------------------------------------------+

每一层解决什么问题

研发层主要问题典型入口主要产物
Codebase当前 repo 到底是什么、有哪些约束、哪些文件和命令可信spec-mcp-setupspec-standardsspec-sessionsruntime capabilities、project standards、历史会话摘要
GraphAI 在改动前是否知道依赖、影响面和 degraded 状态spec-graph-bootstrap、GitNexus / code-review-graph providergraph facts、impact facts、provider status
Spec要解决什么、谁受影响、什么算成功spec-ideatespec-brainstormspec-doc-reviewdocs/brainstorms/*-requirements.md、open questions
Plan怎么做、边界在哪里、哪些文件和测试会受影响spec-planspec-doc-reviewdocs/plans/*-plan.md
Tasks大计划是否需要可交接任务包、能否并行、何时停止spec-write-tasksdocs/tasks/*-tasks.md
Code按计划实现、调试失败、优化指标或打磨 UIspec-workspec-work-betaspec-debugspec-optimizespec-polish-betadiff、测试结果、截图或运行证据
Review在合并前发现逻辑、测试、安全、性能、契约和文档问题spec-code-reviewspec-doc-reviewspec-app-consistency-auditspec-skill-auditreview findings、safe_auto fixes、residual risks
Knowledge把已解决的问题变成下次可复用的团队知识spec-compoundspec-compound-refreshspec-release-notesdocs/solutions/*、刷新后的 learning docs、版本摘要

入口治理

using-spec-first 是入口治理 meta skill。它不是公开 workflow,也不是 /spec:*$spec-* 命令。它的职责是在 substantial work 前判断当前任务应该进入哪个公开入口。

text
用户请求
  |
  v
using-spec-first 判断意图、风险和当前上下文
  |
  +-- 环境 / runtime / MCP 未就绪 -------> spec-mcp-setup
  |
  +-- graph readiness 或 impact facts ---> spec-graph-bootstrap
  |
  +-- 项目规范或 glue baseline ----------> spec-standards
  |
  +-- 需求还不清楚 ----------------------> spec-brainstorm
  |
  +-- 方向选择或想法生成 ----------------> spec-ideate
  |
  +-- HOW 不清楚 ------------------------> spec-plan
  |
  +-- 计划很大,需要任务交接 ------------> spec-write-tasks
  |
  +-- 可执行工作 ------------------------> spec-work / spec-debug
  |
  +-- 需要质量评审 ----------------------> spec-code-review / spec-doc-review
  |
  +-- 已解决问题需要沉淀 ----------------> spec-compound

入口治理的关键不是“每次从第一步开始”,而是把任务送到当前最缺的研发层:缺事实先补事实,缺需求先补需求,缺计划先计划,已有计划就执行,已有 diff 就评审。

主链路中的 skill 节点

阶段Skill 节点调用决策Agent 专家能力如何进入
Codebasespec-mcp-setup第一次接入项目、MCP 或 graph provider 缺失、host runtime 不可信主要使用 deterministic scripts 和本地检查,不默认调 persona agents
Codebasespec-standardsbrownfield 项目需要项目规范、glue capability baseline 或团队规范导入可读取 repo facts 和 graph facts,输出候选规范;专家评审通常在 spec-doc-reviewspec-code-review 中发生
Graphspec-graph-bootstrapsetup facts 可用后,需要把 provider 状态编译成下游可消费事实调用 graph provider CLI/MCP,不把 agents 当事实来源;provider degraded 会显式进入下游上下文
Specspec-ideate用户要想法、方向、改进点或外部启发可借助 web / issue / repo / best-practices research agents 做外部和代码库 grounding
Specspec-brainstormWHAT 不清楚、需求边界未定、存在多个合理产品方向可用 spec-spec-flow-analyzer、product、design、research 类 agent 辅助识别用户流和风险
Spec / Planspec-doc-reviewrequirements、plan 或 task pack 需要语义审查固定启用 coherence、feasibility;按文档信号增加 product、design、security、scope、adversarial personas
Planspec-planWHAT 已基本清楚,需要 HOW、文件边界、测试场景和顺序先读 codebase / standards / graph;需要深挖时使用 repo、history、framework docs、best practices 等研究 agents
Tasksspec-write-tasks计划足够大,直接执行会增加上下文负担或并行风险不改变计划范围;用文件边界、依赖和验证面决定 task cards / waves
Codespec-work已有计划、任务包或清晰实现目标根据任务规模选择 inline、serial 或 parallel 执行;Codex 可用 worker / explorer 子任务,但最终集成由 orchestrator 负责
Codespec-work-beta用户明确要 Codex delegation beta 或外部 delegate 支持spec-work 基础上引入更强的外部 delegate 协作,仍受文件边界和验证门约束
Codespec-debug存在失败、bug、测试错误或异常行为可用 repo、history、testing、correctness、specialist agents 辅助定位,但必须以复现和验证收口
Codespec-optimize目标可度量,需要多方案实验比较可以并行实验候选;是否保留改动由 hard gates、judge 标准和回归结果决定
Codespec-polish-beta浏览器可见 UI 需要启动页面、截图和迭代打磨可结合 design iterator、Figma sync、visual review 能力,必须用浏览器证据验证
Reviewspec-code-review已有 diff、PR 或合并前质量检查总是启用 correctness、testing、maintainability、project standards、agent-native、learnings;按 diff 文件选择 security、performance、API、migration、reliability、stack reviewers
Reviewspec-app-consistency-audit移动 App 需要 PRD、Figma、本地 source、路由、架构、analytics、i18n 一致性审查使用专项审查规则包,不替代真机、模拟器或 QA
Reviewspec-skill-audit审查 spec-first skills、runtime drift、dual-host governance 或 skill 质量使用 skill / agent-native / prompt-workflow 视角,输出 audit 报告而非直接改 source
Knowledgespec-compound最近刚解决一个问题,需要沉淀复用知识Full 模式会调 Context Analyzer、Solution Extractor、Related Docs Finder、可选 session historian
Knowledgespec-compound-refreshdocs/solutions/ 过期、重复、冲突或需要合并读取当前 codebase 验证 learning 是否漂移,更新、合并、替换或删除 stale docs
Knowledgespec-sessions需要检索过去 Claude Code / Codex 会话调 session inventory / extract internal skills,返回研究摘要,不暴露 internal-only 入口
Knowledgespec-slack-research用户明确要 Slack 组织上下文调 Slack researcher,输出解释型 digest 而不是原始消息列表
Knowledgespec-release-notes需要了解 spec-first 近期变化或某个 skill 的版本变化读取 release/changelog 事实,输出带版本依据的摘要

Agent 调度原则

Spec-First 的 agents 不是菜单式全量启动,而是由 workflow 根据证据选择:

  • spec-code-review 按 diff 文件、变更规模和风险域选择 reviewer persona。
  • spec-doc-review 按文档类型、需求数量、架构决策、安全边界和设计信号选择 reviewer persona。
  • spec-work 按任务规模、依赖关系、文件重叠和宿主隔离能力决定 inline、serial subagents 或 parallel subagents。
  • spec-compound 只在 Full 模式中并行调研究型子任务,并且只有 orchestrator 写最终文档。
  • spec-ideatespec-planspec-debug 倾向把 research agents 当作 evidence providers,而不是让它们替代最终判断。

降级与停止规则

Graph、standards、sessions、Slack 和外部研究都可能 unavailable、stale、blocked 或 degraded。Spec-First 的规则是显式降级,而不是假装证据完整:

text
fact available and trusted
  |
  v
作为硬约束或强证据使用

fact missing / stale / degraded
  |
  v
标注 limitation
  |
  v
改用 bounded direct reads、人工确认或返回上游 workflow

当缺失信息会改变产品范围、技术契约、文件边界或验证标准时,workflow 应停止并回到 spec-brainstormspec-plan 或用户确认;当信息只影响实现细节,可以作为 implementation-time unknown 进入 spec-workstop_if 或验证清单。

阅读下一步