应用 AI 流程总结

这篇文章不是工具清单，而是我在真实项目里反复迭代后沉淀下来的一套工作方法。
流程是先把约束写清楚，再让多模型并行执行，最后通过统一审查收口。

一、设计阶段

设计阶段对齐信息架构，快速产出可迭代初稿。

1) 线框草图

wiretext：快速把页面结构写成线框，适合先确认信息层级。
mockdown：用文本表达页面块级布局，适合早期讨论和需求澄清。

2) UI 套壳与变体

Pencil：通过 prompt 生成可编辑界面稿。
variant ai：先找接近风格，再用 prompt 调整；导出 .js 后继续用 Claude Code 或 Codex 做结构细化。

二、开发阶段

1) 多 Agent + Git Worktree 的基线做法

我当前面对简单需求拆分：

一个需求拆成 2-4 个相对独立子任务。
每个子任务绑定独立 worktree 和独立会话。
先合并可验证的小增量，再做跨模块收敛。

这能显著降低上下文污染和任务互扰。
但也有边界：任务耦合度过高时，过度拆分 worktree 会放大集成成本。

2) 第三方工具生态

过去我常用：

superset：并行 worktree 编排工具。
happy：远程控制 cc。

现在 Claude 官方已经覆盖了多 worktree 和部分远程能力，这类工具更适合作为其他 CLI 增强工具。

三、CCG Workflow：把多模型协作流程化

ccg-workflow 在我的体系里承担“调度层”角色：Claude Code 负责编排，前端任务优先路由给 Gemini，后端任务优先路由给 Codex，最后由 Claude 统一审核并落地 patch。

1) 安装与前置

npx ccg-workflow

需要 Node.js 20+。
可选安装 Codex CLI（偏后端）和 Gemini CLI（偏前端）。

2) 常用命令

全流程：/ccg:workflow
规划 + 执行分离：/ccg:plan + /ccg:execute
面向任务：/ccg:frontend、/ccg:backend、/ccg:debug、/ccg:optimize、/ccg:review

先计划再执行：

/ccg:plan 实现用户认证功能
/ccg:execute .claude/plan/user-auth.md

这种方式可以降低会话切换带来的损耗，并减少实现阶段的目标漂移。

3) ccg 内置能力

规范驱动（/ccg:spec-*）：
- 适合约束多、容易偏题的复杂需求。
- 价值是把“自由生成”收敛为“约束执行”。
并行实施（/ccg:team-*）：
- 适合可拆成 3 个以上独立模块的任务。
- 价值是通过 /clear + 文件状态传递减少上下文串扰。

4) 配置与避坑

在 ~/.claude/settings.json 调整超时参数（如 CODEX_TIMEOUT、BASH_DEFAULT_TIMEOUT_MS）。
MCP 工具按复杂度选配：ContextWeaver + Context7 / Playwright / DeepWiki / Exa。

四、Skills 可复用流程

常用 skills 资源：

对应定位：

superpowers：流程编排（自动计划、阶段执行、收尾校验）。
claude-mem：上下文压缩与记忆管理（适合长链路任务）。
react-best-practices：实现阶段的性能与代码质量约束。

五、MCP 能力拓展

我目前主要使用 Lighthouse MCP：

@danielsogl/lighthouse-mcp：功能完整，支持 Core Web Vitals、budget 等。

实践里有两个高频坑：

跑 Lighthouse 时要明确要求 LLM 同时测“桌面端 + 移动端”，否则很多自动化流程只测移动端。
自动化跑分和 DevTools 手动跑分会存在差异，建议以趋势和瓶颈定位为主，不要过度解读单次绝对分数。

如果站点托管在 Cloudflare 且出现爬虫/审计访问异常，先检查 robots.txt 与缓存策略，必要时清理 robots.txt 相关缓存再重试。

六、测试与评审流水线

1) 在 prompt 中明确三层测试要求

实现完成后我会直接下这种可复用指令：

请基于当前变更补齐并执行测试，要求：
1) 单元测试（unit tests）：覆盖核心函数、边界条件、异常路径。
2) 集成测试（integration tests）：覆盖模块间协作、数据流与接口契约。
3) 端到端测试（e2e tests）：覆盖关键用户路径（成功流 + 失败流）。

执行要求：
- 先写测试再修复实现，直到全部通过。
- 输出每类测试的新增用例清单、执行命令和结果摘要。
- 标注当前未覆盖风险点和建议补测项。

2) 多模型交叉 code review

测试通过后，我会让不同模型分别做 review，重点关注：

潜在 bug 与边界问题。
可读性与可维护性。
性能、复杂度与扩展性风险。
测试覆盖是否与业务风险匹配。

多模型 review 的核心收益是降低单模型盲区。

3) 人工 review

AI review 之后，我会做一轮人工 review，主要确认：

需求是否真正闭环，而不是只满足字面描述。
改动是否引入潜在回归。
命名、边界、错误处理是否符合团队约定。
测试是否覆盖最高风险路径。

人工 review 的作用不是重复 AI 结论，而是做业务上下文判断与最终风险兜底。

4) CI 后接 GitHub App 自动审查

PR 提交并通过 CI 后，我会再接一轮 GitHub App 自动审查，常用包括：

我自己也在 vibe 一个面向测试阶段的 pr-agent，目标是把“测试结果 + 风险点 + review 建议”自动汇总到 PR/Issue，提升评审与决策效率。

七、当前可复用的端到端流程

用线框工具明确信息层级和页面结构。
用 UI 生成工具快速得到可编辑初稿。
开发阶段以 MVP 为先，按 worktree 并行推进独立子任务。
复杂需求先用 /ccg:plan 或 /ccg:spec-* 锁定约束，再进入实现。
合并前执行统一 review（/ccg:review + 人工抽检），最后做稳态重构（健壮性、可维护性、边界处理）。

这套流程的核心收益是：前期速度快，中期质量稳，后期维护成本可控。