研路炼钢 | 从卖产品到卖技能——一顿火锅，我把 Agent 的底层逻辑又梳理了一遍

发表于2026-05-06|更新于2026-07-24|杂谈

|总字数:2.1k|阅读时长:6分钟|浏览量:

昨天和一个做产品的朋友吃饭。八两的帝王蟹端上来的那一刻,我们聊的话题已经从”他要做什么产品”转到了”他要做什么技能”。

这个转向本身就值得记一下。

一、从”卖产品”到”卖 Skill”,中间那一步是什么

从"卖产品"到"卖 Skill"

他过去一直想做一个产品出来卖。这次见面,他的方向变了——他想做一个 Skill 来卖。

这两件事看起来像同一件事,差别其实很大。

卖产品,你卖的是一个能直接被使用的东西。卖 Skill,你卖的不是 Skill 本身——Skill 没法独立存在,它必须绑定脚本,绑定 Agent,才能跑起来。所谓卖技能,本质上卖的是 API 能力包:一段被规范化、被工程化、被可调用化的能力。

为什么这个转向在这两年突然变成显学?因为 Claude Code、Codex、Kimi 这一批 Agent 产品出来之后,大家发现”能力”是可以被封装的,而封装出来的东西有人愿意付费。

但卖 Skill 有个隐含前提:你得真的把一套流程跑通过、抽象过、压缩过。否则你卖出去的就是一个空壳子。

二、95% 的时间不是在写代码

95% 的时间不是在写代码

我最近又在系统学 Agent 相关的东西,把 Kimi、Codex、Claude Code 这些产品的内部逻辑都过了一遍。结论很扎实——

它们底层都是同一套东西:SDD,规范驱动开发(Spec-Driven Development)。 差异只在细节实现,框架是一样的。

这件事的反直觉之处在于:搭一个 Agent,95% 的时间不是在编程。

那 95% 的时间在干嘛?

在做需求梳理。在把一个模糊的”我想做 X”拆解成”先做 A,再做 B,然后做 C,每一步的输入输出和约束分别是什么”。在反复确认每一个子任务的边界。

代码是最后那 5% 的事——而且很多时候那 5% 就是把已经梳理好的规范翻译成可执行的形式。

这件事说穿了不新鲜,但被 Agent 这个语境重新命名之后,它的意义变了:以前规范是给人看的文档,现在规范是给模型跑的代码。 规范本身就是开发产物。

三、子代理:手动划分,还是自动生成

子代理:手动划分,还是自动生成

需求梳理完之后,要把一个大 Agent 拆成若干个子代理(sub agent)——这是规范驱动开发的标准动作。

每个子代理只做一件事。一个负责收集信息,一个负责处理信息,一个负责部署落地。人也是一样:一个人只做一件事会很专注,做几十件事就废了。 Agent 不过是把这个常识工程化了。

这里有一个绕不过去的选择:子代理是手动创建,还是让平台自动生成?

像 Codex 这类工具,会自动帮你把子代理拆出来。看起来很爽,但代价是——它会消耗大量 Token,因为每一次自动拆分都意味着模型要重新理解上下文、重新规划路径。

更经济的做法是反过来:预设好你的子代理。把每一个角色定义清楚——它做什么、不做什么、用什么模型、走什么流程——然后跑的时候直接调用。

预设好的版本,跑起来又快又便宜。代价是你前期得花时间手动设计这些角色。

这是一个典型的”前期成本换长期效率”的工程权衡。如果一个工作流你要重复跑成百上千次,显然预设更划算;如果你只是探索性地试一次,自动拆分更省人力。

四、Token 经济学:让专业的人做专业的事

Token 经济学:让专业的人做专业的事

聊到这里,他给我抛了一个新词,叫**”Token 经济学”**。

意思也很简单:一个项目里有很多文件,但不是所有文件都需要被丢给大模型。只有那些真正需要模型推理的部分,才值得花 Token。

这件事的衍生原则是:简单的问题用便宜的模型,难的问题用贵的模型。

如果一个任务里既有简单部分又有复杂部分,正确的做法不是”全用最强的模型一把梭”,而是把它拆成五六个小问题,然后给每个小问题分配合适的模型。

这背后其实是一种很朴素的工程哲学——让专业的人做专业的事。

我前几天有个本科学弟来问我接 DeepSeek API 为什么不能生图。我第一反应是:你为什么会觉得 DeepSeek 能生图?它是文本模型,不是视觉模型。

模型本身是分类的。文本模型背后是 MoE(Mixture of Experts)架构,你启动一次推理,实际是若干个”专家”在分工处理上下文。模型选型这件事,在 Agent 时代的重要性比单纯调一个模型要高得多——因为你要为每一个子任务挑一个对的工具。

不挑,你就在用最贵的扳手拧最便宜的螺丝。

五、SOP → Skill → Agent → 独立程序

SOP → Skill → Agent → 独立程序

朋友给我讲的最有启发的一段是这个——一整套流程,你可以一层一层往上压缩。

第一层是 SOP(标准作业程序)。一个完整的、可以人工执行的流程。

第二层是 Skill。把这个 SOP 编码成一个可被模型调用的能力包,这就是技能。

第三层是 Agent。给这个 Skill 包一层”角色”:它叫什么、负责什么、配合谁、用什么模型。

第四层——也是最关键的一步——把整个 Agent 工作流压缩成一个独立的可运行程序。

到这一步之后,你不再需要每次去启动那个 Agent、不再需要每次去喂上下文,你只需要运行那个程序就行。

Skill 是 SOP 的工程化,Agent 是 Skill 的人格化,独立程序是 Agent 的产品化。

每往上压缩一层,门槛降低一级,使用频率高一级。最终交付到用户手里的,可能是一个命令行工具、一个网页按钮、一个 API 端点——但它背后是一整套被层层封装的能力。

这件事对我个人的意义在于:我现在在做的事——读论文、写专利、做实验、跑竞赛——其实都可以用这套思路重做一遍。把每一个我重复在做的流程,沉淀成 SOP,再压成 Skill,再封成可执行的工具。

六、底层和应用层,双管齐下

底层和应用层,双管齐下

聊到最后,我跟他说了一句我自己也有点意外的话:了解底层这件事,可能没我之前以为的那么重要。

更重要的是怎么用。是辩证地用。是知道在什么场景下用什么模型、什么 Skill、什么 Agent。

底层当然要懂——不懂的话你连工具书都读不下来。但底层的边际收益是递减的:你看了第一篇 Transformer 论文,认知会大涨;看到第十篇相关论文,大部分时候是在重复确认你已经知道的东西。

应用层不一样。应用层每多用一次工具、多搭一个工作流,你的”工程肌肉记忆”就厚一层。这个东西没法靠看论文获得,只能靠跑。

所以我现在双管齐下——一只手研究底层的内部逻辑,一只手疯狂搭应用、疯狂用工具。两边都不放手,但心里清楚:在当下这个阶段,应用层的产出更接近真实回报。

写在后面

写在后面

这篇东西本来是吃饭的时候随口聊的。回来之后我把对话录音过了一遍,发现里面真正有价值的内容,大概就是这六块。

帝王蟹很好吃,但帝王蟹两天之后就忘了。这套框架记下来,半年之后还能用。

下一步我打算搭一个全职的 Agent——SDD 驱动,子代理预设,模型分级,Token 经济。等我把这套东西跑通了,再写一篇详细的实操记录。

——研路炼钢

文章作者: insistgang

文章链接: https://insistgang.top/posts/agent-skill-sdd.html

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Leo的笔记本！

Agent 研路炼钢 Skill SDD Token经济学

相关推荐

研路炼钢 | 和一位延毕师兄吃了顿饭，他把读研踩过的坑全讲了（三）——AI到底能干什么篇

研路炼钢 | 和一位延毕师兄吃了顿饭，他把读研踩过的坑全讲了（三）——AI到底能干什么篇接上两篇。吃饭聊到最后，我和N师兄聊到了AI。我们俩都是高强度AI用户，都花了真金白银买会员。但聊完之后我发现，我们对AI的判断出奇地一致——好用，但没那么神。如果只用一句话概括：AI 最适合帮你加速确定性任务，不适合替你承担不确定性决策。这个边界一旦想清楚，很多焦虑会少一半。 01｜我的AI全家桶先交代一下我自己的使用情况。我现在同时在用Claude、ChatGPT、Kimi，全部付费开了会员。GitHub Copilot也在用。国内的几个模型也都试过。为什么花这么多钱？因为它是生产力。我的判断标准很简单：它能不能帮我转化出我要的结果。花一块钱做出小学生水平的东西，不值；花一万块做出博士水平的东西，值。这不是钱多钱少的问题，是效率和结果的问题。 N师兄也认同这个判断：”你花了钱，提升了效率，获得了结果，就完事了。” 说实话，有一天AI平台宕机了，我坐在电脑前都不知道该干嘛。不夸张。 02｜AI 最适合接管哪类编程任务这是我们聊得最深的一个话题。他做了快两年的商业项目...

研路炼钢 | 我把 Vercel、Supabase 和 Surge 都连上了，但这还不叫工作流

这两天，我把 Vercel、Supabase 和 Surge 依次接进了自己的工具箱。 Vercel 能看见项目，博客页面实际返回了 200；Supabase 能读到组织和两个项目；Surge 能列出五个站点，五个地址也都能正常打开。如果只看仪表盘，这已经是一片绿灯。但我很快意识到：三个工具都能用，不等于三个工具已经一起工作。登录成功，只能证明钥匙是真的；页面能开，只能证明炉子还热着。真正的工作流，必须让一块原料从入口进炉，经过加工、落库、验收，再带着证据回到我手里。 01｜三个工具都亮了绿灯先说现场。 Vercel 这边，连接器能正常读取账号下的项目，博客部署也能直接访问。我请求线上页面，拿到的是 200，页面标题也和预期一致。 Supabase 这边，组织与项目列表可以正常读取。两个现有项目分别在东京和新加坡，只是当时都处于暂停状态。这个结果至少说明：账号、权限和管理通道是通的；要进入业务链路，还需要先恢复目标项目。 Surge 更直接。命令行列出了五个站点： linkable-board.surge.sh aidatabase-squ.surge.sh aida...

MiniMax Agent 应用场景与核心竞争力

适用视角：计算机视觉方向研究生 / 多线并行工作者 / 论文产出驱动型用户一、产品定位解构 MiniMax Agent 的本质定位不是”文生图工具”或”PPT 生成器”，而是一个面向非工程用户的全模态 Agent 平台。它试图用极低的使用门槛，将 LLM 的代码执行、多模态生成、工具调用等能力封装为”一句话交付结果”的体验。与 Claude（含 Claude Code）的根本区别在于设计哲学： Claude 系列：以推理深度和工程可靠性为核心，面向需要精确控制输出的专业用户。 MiniMax Agent：以交付速度和视觉完成度为核心，面向”我不关心过程，只要结果好看能用”的场景。二、核心应用场景（按科研实用性重排序） Tier 1：对科研工作流直接有价值的场景2.1 科研配图与数据可视化论文架构图生成：网络结构图、模块示意图、流程图等，MiniMax 的审美优势在快速出图上有吸引力。数据看板与交互图表：内置沙盒可自主运行代码，处理数据后生成可交互的可视化结果（如检测精度对比、消融实验柱状图）。实际局限：科研配图对精确性和可编辑性要求极高...

研路炼钢 | 和一位延毕师兄吃了顿饭，他把读研路上的体会全讲了（二）——研究生创业篇

研路炼钢 | 和一位延毕师兄吃了顿饭，他把读研路上的体会全讲了（二）——研究生创业篇接上篇。N师兄不仅延毕了一年，还在研二的时候注册了公司，做了一款游戏，已经上线。听他讲创业的过程，我才意识到——做事和做生意之间，隔着一整套不一样的认知体系。这篇同样只保留对我有启发的部分。涉及具体公司、股权和个人身份的细节，没有必要展开到可识别程度。真正值得写的是：一个研究生从”我能做东西”走到”我要对产品和商业负责”，中间到底差了什么。 01｜”我一开始没想着要创业” N师兄说他并不是从一开始就计划开公司的。 “是机缘巧合碰到了几个朋友，大家都有想法。先把事情做起来，后面才慢慢变成公司。” 他的合伙人有游戏行业和产品经验，也有资源和资金。最初对方是想把他招进去做正式员工。但N师兄想了想—— “不如自己先拼一把。先把事情做起来，做起来之后再谈合作的形式。” 后来几个人成了合伙人。具体比例不重要，重要的是他们把权责先说清楚：谁出钱，谁拍板，谁负责技术和产品，谁负责策划和内容。产品后来也确实上线了。这件事给我的第一个提醒是：合伙不是”大家关系好，所以一起干”。合伙是先把钱、权、责、风险说...

MiniMax Agent 全新 MaxClaw 模式深度解析：开箱即用的 AI 生产力革命

原创 | 研途炼钢当 OpenClaw 还在让开发者折腾 Docker 和 API Key 的时候，MiniMax 已经把”一键部署 AI Agent”变成了现实。写在前面最近 AI Agent 赛道热闹非凡——OpenClaw 开源即火爆，各家平台纷纷跟进。就在这个节骨眼上，MiniMax 在 2026 年 2 月 25 日正式推出了 MaxClaw，直接把 OpenClaw 框架搬上云端，用自家 M2.5 大模型（229B 参数 MoE 架构）驱动，打出了”10 秒部署、开箱即用”的口号。我这几天深度体验了一番，说说真实感受。一、MaxClaw 到底是什么？先厘清一个容易混淆的概念：市面上有两个 MaxClaw。云端 MaxClaw（MiniMax 官方托管版）：你在 MiniMax Agent 平台（国际版 agent.minimax.io / 国内版 agent.minimaxi.com）上直接使用，所有计算和执行都在 MiniMax 的云端沙盒完成。这是本文的主角。开源 maxclaw（GitHub Lichas/maxcl...

研路炼钢 | 和一位延毕师兄吃了顿饭，他把读研踩过的坑全讲了（一）——导师关系篇

研路炼钢 | 和一位延毕师兄吃了顿饭，他把读研踩过的坑全讲了（一）——导师关系篇前两天和一位即将毕业的师兄吃饭，聊了整整一个小时。他讲了自己读研期间和导师、项目、论文之间的几段经历。里面有很多具体细节，我不适合也没必要展开到可识别的程度。这里更想记录的是：一个研究生在资源、署名、沟通和边界上踩过的坑。先说清楚边界：这是一段个人口述和我的个人理解，不代表所有导师，也不代表所有课题组。读研关系高度依赖具体人和具体环境，不能拿一个案例去推导全部结论。 01｜”我是奔着产学研合作来的，不是来当执行工具的” N师兄本科就做过大量商业项目，来读研的时候，心里想的是和导师建立一种合作伙伴关系。 “我不喜欢那种模式——老师拍脑门说’这个好像可以做’，然后你去做完来找他汇报。我喜欢的是大家一起去做一件事。” 他甚至直接说：”我很讨厌向人汇报事情。因为以前都是我听别人汇报的。” 这话听着有点冲，但放在他的经历里，我能理解。他入组之后参与了一个新方向的系统搭建，很多技术细节都是自己一点点摸出来的。问题在于—— 他遇到技术难题去找导师，导师说：”我不会，你自己做。” N师兄当时跟我说了一句让我...