这篇文章不是工具清单,而是我在真实项目里反复迭代后沉淀下来的一套工作方法。
流程是先把约束写清楚,再让多模型并行执行,最后通过统一审查收口。
一、设计阶段
设计阶段对齐信息架构,快速产出可迭代初稿。
1) 线框草图
2) UI 套壳与变体
- Pencil:通过 prompt 生成可编辑界面稿。
- variant ai:先找接近风格,再用 prompt 调整;导出
.js后继续用 Claude Code 或 Codex 做结构细化。
二、开发阶段
1) 多 Agent + Git Worktree 的基线做法
我当前面对简单需求拆分:
- 一个需求拆成 2-4 个相对独立子任务。
- 每个子任务绑定独立 worktree 和独立会话。
- 先合并可验证的小增量,再做跨模块收敛。
这能显著降低上下文污染和任务互扰。
但也有边界:任务耦合度过高时,过度拆分 worktree 会放大集成成本。
2) 第三方工具生态
过去我常用:
现在 Claude 官方已经覆盖了多 worktree 和部分远程能力,这类工具更适合作为其他 CLI 增强工具。
三、CCG Workflow:把多模型协作流程化
ccg-workflow 在我的体系里承担“调度层”角色:Claude Code 负责编排,前端任务优先路由给 Gemini,后端任务优先路由给 Codex,最后由 Claude 统一审核并落地 patch。
1) 安装与前置
npx ccg-workflow
- 需要
Node.js 20+。 - 可选安装
Codex CLI(偏后端)和Gemini CLI(偏前端)。
2) 常用命令
- 全流程:
/ccg:workflow - 规划 + 执行分离:
/ccg:plan+/ccg:execute - 面向任务:
/ccg:frontend、/ccg:backend、/ccg:debug、/ccg:optimize、/ccg:review
先计划再执行:
/ccg:plan 实现用户认证功能
/ccg:execute .claude/plan/user-auth.md
这种方式可以降低会话切换带来的损耗,并减少实现阶段的目标漂移。
3) ccg 内置能力
- 规范驱动(
/ccg:spec-*):- 适合约束多、容易偏题的复杂需求。
- 价值是把“自由生成”收敛为“约束执行”。
- 并行实施(
/ccg:team-*):- 适合可拆成 3 个以上独立模块的任务。
- 价值是通过
/clear+ 文件状态传递减少上下文串扰。
4) 配置与避坑
- 在
~/.claude/settings.json调整超时参数(如CODEX_TIMEOUT、BASH_DEFAULT_TIMEOUT_MS)。 - MCP 工具按复杂度选配:ContextWeaver + Context7 / Playwright / DeepWiki / Exa。
四、Skills 可复用流程
常用 skills 资源:
对应定位:
superpowers:流程编排(自动计划、阶段执行、收尾校验)。claude-mem:上下文压缩与记忆管理(适合长链路任务)。react-best-practices:实现阶段的性能与代码质量约束。
五、MCP 能力拓展
我目前主要使用 Lighthouse MCP:
@danielsogl/lighthouse-mcp:功能完整,支持 Core Web Vitals、budget 等。
实践里有两个高频坑:
- 跑 Lighthouse 时要明确要求 LLM 同时测“桌面端 + 移动端”,否则很多自动化流程只测移动端。
- 自动化跑分和 DevTools 手动跑分会存在差异,建议以趋势和瓶颈定位为主,不要过度解读单次绝对分数。
如果站点托管在 Cloudflare 且出现爬虫/审计访问异常,先检查 robots.txt 与缓存策略,必要时清理 robots.txt 相关缓存再重试。
六、测试与评审流水线
1) 在 prompt 中明确三层测试要求
实现完成后我会直接下这种可复用指令:
请基于当前变更补齐并执行测试,要求:
1) 单元测试(unit tests):覆盖核心函数、边界条件、异常路径。
2) 集成测试(integration tests):覆盖模块间协作、数据流与接口契约。
3) 端到端测试(e2e tests):覆盖关键用户路径(成功流 + 失败流)。
执行要求:
- 先写测试再修复实现,直到全部通过。
- 输出每类测试的新增用例清单、执行命令和结果摘要。
- 标注当前未覆盖风险点和建议补测项。
2) 多模型交叉 code review
测试通过后,我会让不同模型分别做 review,重点关注:
- 潜在 bug 与边界问题。
- 可读性与可维护性。
- 性能、复杂度与扩展性风险。
- 测试覆盖是否与业务风险匹配。
多模型 review 的核心收益是降低单模型盲区。
3) 人工 review
AI review 之后,我会做一轮人工 review,主要确认:
- 需求是否真正闭环,而不是只满足字面描述。
- 改动是否引入潜在回归。
- 命名、边界、错误处理是否符合团队约定。
- 测试是否覆盖最高风险路径。
人工 review 的作用不是重复 AI 结论,而是做业务上下文判断与最终风险兜底。
4) CI 后接 GitHub App 自动审查
PR 提交并通过 CI 后,我会再接一轮 GitHub App 自动审查,常用包括:
我自己也在 vibe 一个面向测试阶段的 pr-agent,目标是把“测试结果 + 风险点 + review 建议”自动汇总到 PR/Issue,提升评审与决策效率。
七、当前可复用的端到端流程
- 用线框工具明确信息层级和页面结构。
- 用 UI 生成工具快速得到可编辑初稿。
- 开发阶段以 MVP 为先,按 worktree 并行推进独立子任务。
- 复杂需求先用
/ccg:plan或/ccg:spec-*锁定约束,再进入实现。 - 合并前执行统一 review(
/ccg:review+ 人工抽检),最后做稳态重构(健壮性、可维护性、边界处理)。
这套流程的核心收益是:前期速度快,中期质量稳,后期维护成本可控。