为什么你用 AI 编程工具只能产出"AI 垃圾"？

我现在每天都在用 Claude Code、Gemini CLI、Cursor 这些工具写代码。但说实话，刚开始的时候，产出的东西确实很”AI”——紫色渐变、千篇一律的布局、通用模板感极强。

后来慢慢摸索，产出质量才开始上来。我发现差距不在工具本身，而在你怎么用它。

这段时间我总结了一个”六阶模型”，也算是对自己从菜鸟到现在的一个复盘。看看你卡在哪一层。

第一阶段：命令式使用

第一章配图

大部分人刚上手都是这个状态：打开工具，输入”给我做一个 XX 网站”，然后等结果。

结果出来了，能跑，但丑。而且千篇一律——因为你没给 AI 任何关于审美、目标用户，品牌调性的信息，它只能给你一个”安全但平庸”的方案。

我刚用 Claude Code 的时候就是这样，让它帮我写一个数据可视化页面，出来的东西功能上没问题，但视觉上一看就是 AI 生成的。

突破点： 从”给我做 XX”变成”我要做 XX，目标是 YY，风格是 ZZ，你觉得我还需要考虑什么？”。把 AI 从命令执行器变成合作伙伴，质量立刻不一样。

第二章配图

到了这个阶段，你开始跟 AI “聊”了。不再只是下指令，而是让它先提问、先规划。

我现在的习惯是：复杂任务开始之前，先让 AI 问我问题。”你的用户规模是多少？需要哪些功能？安全要求是什么？”它问完我回答，然后它再出方案。

还有一个技巧是让 AI 扮演”反对者”——“你觉得这个方案有什么问题？哪里可能出 bug？”。主动让它找茬，比自己复查靠谱得多。

第三章配图

这是我踩过最大坑的一层。

AI 的上下文窗口是有限的。当对话太长、塞进去的信息太多，AI 的表现会突然变差——开始”健忘”，输出质量明显下降。

我有一次用 Claude Code 做一个比较复杂的项目，聊了几十轮之后，它开始忘记前面定好的规则，生成的代码跟之前的约定矛盾。后来我才知道这叫”上下文腐败”——窗口填到 50%-60% 的时候，性能就开始下降了。

现在我的做法是：定期用 /context 命令看看窗口状态，快满的时候手动总结关键信息，复制到新窗口继续。宁可多开几个窗口，也不要在一个窗口里硬撑。

另一个原则是”少即是多”：不要把所有文件都丢给 AI，只上传真正相关的。信息过载对 AI 来说跟对人一样——越多越乱。

第四章配图

当你手里有 Claude Code、Gemini CLI、Cursor、Copilot 好几个工具的时候，很容易陷入”全都要”的状态。每出一个新插件、新 MCP 服务，都想装上试试。

我也经历过这个阶段。后来发现：工具不是越多越好，是越准越好。 每个工具有自己擅长的场景，精准匹配比大而全高效得多。

现在我的原则是：优先用原生功能，只在原生解决不了的时候才加第三方工具。新工具先观望，不追首发。

还有一点容易忽略：数据安全是你的责任。把代码和数据丢给各种工具之前，想一想这些信息会不会泄露。

第五章配图

如果有一类任务你经常做——比如写 React 组件、生成 API 文档、清洗数据——那就把它变成一个可复用的 Skill 或 prompt 模板。

我现在有几个常用的 Skill：一个是论文实验代码的模板（固定了代码结构、日志格式、评估指标），一个是公众号文章的改写 prompt（固定了风格和检查要点）。

每次调用的时候不需要从零开始描述需求，直接触发 Skill 就行。省下的时间，积少成多非常可观。

第六章配图

这是目前我在探索的阶段。同时开多个终端，每个终端跑不同的任务，或者用 OpenClaw 配置多个子智能体并行工作。

实际体感是：同时管 2-3 个终端效率最高。再多就开始顾不过来，反而拖慢进度。

OpenClaw 的子代理模式可以让多个 AI 实例各干各的，完成后汇总给主控终端。这种模式适合任务可以明确拆分的场景，比如”一个搜资料、一个写大纲、一个写正文”。

但说实话，这个阶段还比较早期，工具链不太成熟，经常需要手动协调。等工具更完善了，这个阶段的效率提升空间应该是最大的。

第七章配图

快速自测：

如果你的 AI 产出千篇一律 → 你在第一阶段，试试把 AI 当合作伙伴而不是命令执行器。

如果 AI 开始”健忘”、产出变差 → 你在第三阶段，学会管理上下文窗口。

如果你手里工具太多不知道用哪个 → 你在第四阶段，精简工具链，精准匹配。

如果你每次都在重复相同的操作 → 你在第五阶段，把流程标准化。

工具没有变，变的是你和它的关系。

本文来自「研路炼钢」