封面

我现在每天都在用 Claude Code、Gemini CLI、Cursor 这些工具写代码。但说实话,刚开始的时候,产出的东西确实很”AI”——紫色渐变、千篇一律的布局、通用模板感极强。

后来慢慢摸索,产出质量才开始上来。我发现差距不在工具本身,而在你怎么用它。

这段时间我总结了一个”六阶模型”,也算是对自己从菜鸟到现在的一个复盘。看看你卡在哪一层。


第一阶段:命令式使用

第一章配图

大部分人刚上手都是这个状态:打开工具,输入”给我做一个 XX 网站”,然后等结果。

结果出来了,能跑,但丑。而且千篇一律——因为你没给 AI 任何关于审美、目标用户,品牌调性的信息,它只能给你一个”安全但平庸”的方案。

我刚用 Claude Code 的时候就是这样,让它帮我写一个数据可视化页面,出来的东西功能上没问题,但视觉上一看就是 AI 生成的。

突破点: 从”给我做 XX”变成”我要做 XX,目标是 YY,风格是 ZZ,你觉得我还需要考虑什么?”。把 AI 从命令执行器变成合作伙伴,质量立刻不一样。


第二阶段:对话式协作

第二章配图

到了这个阶段,你开始跟 AI “聊”了。不再只是下指令,而是让它先提问、先规划。

我现在的习惯是:复杂任务开始之前,先让 AI 问我问题。”你的用户规模是多少?需要哪些功能?安全要求是什么?”它问完我回答,然后它再出方案。

还有一个技巧是让 AI 扮演”反对者”——“你觉得这个方案有什么问题?哪里可能出 bug?”。主动让它找茬,比自己复查靠谱得多。


第三阶段:上下文管理

第三章配图

这是我踩过最大坑的一层。

AI 的上下文窗口是有限的。当对话太长、塞进去的信息太多,AI 的表现会突然变差——开始”健忘”,输出质量明显下降。

我有一次用 Claude Code 做一个比较复杂的项目,聊了几十轮之后,它开始忘记前面定好的规则,生成的代码跟之前的约定矛盾。后来我才知道这叫”上下文腐败”——窗口填到 50%-60% 的时候,性能就开始下降了。

现在我的做法是:定期用 /context 命令看看窗口状态,快满的时候手动总结关键信息,复制到新窗口继续。宁可多开几个窗口,也不要在一个窗口里硬撑。

另一个原则是”少即是多”:不要把所有文件都丢给 AI,只上传真正相关的。信息过载对 AI 来说跟对人一样——越多越乱。


第四阶段:工具选型

第四章配图

当你手里有 Claude Code、Gemini CLI、Cursor、Copilot 好几个工具的时候,很容易陷入”全都要”的状态。每出一个新插件、新 MCP 服务,都想装上试试。

我也经历过这个阶段。后来发现:工具不是越多越好,是越准越好。 每个工具有自己擅长的场景,精准匹配比大而全高效得多。

现在我的原则是:优先用原生功能,只在原生解决不了的时候才加第三方工具。新工具先观望,不追首发。

还有一点容易忽略:数据安全是你的责任。把代码和数据丢给各种工具之前,想一想这些信息会不会泄露。


第五阶段:流程标准化

第五章配图

如果有一类任务你经常做——比如写 React 组件、生成 API 文档、清洗数据——那就把它变成一个可复用的 Skill 或 prompt 模板。

我现在有几个常用的 Skill:一个是论文实验代码的模板(固定了代码结构、日志格式、评估指标),一个是公众号文章的改写 prompt(固定了风格和检查要点)。

每次调用的时候不需要从零开始描述需求,直接触发 Skill 就行。省下的时间,积少成多非常可观。


第六阶段:多实例协作

第六章配图

这是目前我在探索的阶段。同时开多个终端,每个终端跑不同的任务,或者用 OpenClaw 配置多个子智能体并行工作。

实际体感是:同时管 2-3 个终端效率最高。再多就开始顾不过来,反而拖慢进度。

OpenClaw 的子代理模式可以让多个 AI 实例各干各的,完成后汇总给主控终端。这种模式适合任务可以明确拆分的场景,比如”一个搜资料、一个写大纲、一个写正文”。

但说实话,这个阶段还比较早期,工具链不太成熟,经常需要手动协调。等工具更完善了,这个阶段的效率提升空间应该是最大的。


你卡在哪一层?

第七章配图

快速自测:

如果你的 AI 产出千篇一律 → 你在第一阶段,试试把 AI 当合作伙伴而不是命令执行器。

如果 AI 开始”健忘”、产出变差 → 你在第三阶段,学会管理上下文窗口。

如果你手里工具太多不知道用哪个 → 你在第四阶段,精简工具链,精准匹配。

如果你每次都在重复相同的操作 → 你在第五阶段,把流程标准化。

工具没有变,变的是你和它的关系。


本文来自「研路炼钢」