这四个词你一定听过,但很少有人说清楚它们之间的真实关系。这一章是整本书的概念底座:搞懂这四层,后面所有章节都会豁然开朗。
在开始之前,先问你一个问题:你有没有遇到过这种情况——让 AI 帮你写了一封邮件,效果还不错,但下次让它写同样类型的邮件,结果又变了,还得重新描述一遍背景?或者你看别人演示 AI 能自动完成一整套工作流,但自己试了半天就是做不出来?这背后的原因,就是对这四层的理解没有到位。
这四层不是工具的名字,也不是复杂度的排序,而是四种不同的人机分工模式。从 Prompt 到 Agent,每往上走一层,你让渡给 AI 的决策权就多一点,AI 能独立完成的事情就多一点。
四层递进模型:从左到右是能力升级,核心差异是"谁在决定下一步"
这四层并不是互相替代的关系——它们是积木式叠加的。Skill 由 Prompt 构成,Workflow 把多个 Skill 串起来,Agent 则是有了 Memory 和决策能力之后的 Workflow 进化版。搞懂每一层的边界,才能在正确的场合用正确的工具。
Prompt 是你每次给 AI 的指令。它是最基础的交互方式,也是绝大多数人停留最久的地方。每次对话开始,你描述一遍背景,说明要求,AI 生成回复,对话结束,下次重来。
Prompt 的核心问题不是"AI 不够聪明",而是不稳定。同样的任务,你今天描述的方式和明天描述的方式稍有不同,输出结果可能差很多。你每次都在重复解释背景,时间浪费在沟通成本上,而不是在任务本身上。
另一个常见误解值得专门说明:提示词工程的门槛正在快速降低。2022—2023 年,"写好 Prompt"确实是一门学问——你需要精心设计格式、分隔符、角色描述、示例。但今天的大模型越来越擅长理解自然语言,甚至会主动追问你:"你说的'简洁'是指字数控制在多少?"现在写 Prompt,更重要的不是格式技巧,而是说清楚你的意图和判断标准。Prompt 工程从"写法的艺术"变成了"沟通的能力"——这对普通人反而是好消息。
Prompt 适合用在哪里?一次性的、不重复的任务:临时翻译一段文字、询问某个概念的解释、对一份特定文档提问。一旦某类任务开始重复出现,就应该升级到 Skill。
Skill 是这本书里最重要的概念。它解决的是 Prompt 最大的问题:不稳定、不可复用。一个 Skill 的本质是:把你对某类任务的处理方式固化成一个可以反复调用的模块——角色设定、输出格式、输入变量,一次定义,每次只需填入变量,稳定输出。
但 Skill 不只有一种形态。随着技术的发展,Skill 已经演化出三个层次,能力差异非常大:
Skill 的三个层次:能力和门槛同步递增,入门从 Level 0 开始
Level 0 的 Skill 就是在 Claude.ai 里新建一个 Project,然后写好系统提示词。所有在这个 Project 里的对话,AI 都会记住你写的设定。以"会议纪要助手"为例,操作步骤是:
第一步:打开 claude.ai → 左侧边栏点击「Projects」→「New Project」
第二步:在 Project Instructions(项目指令)里写入你的 Skill 设定(见下方模板)
第三步:每次把会议转录稿粘进对话,直接开始——不需要再解释格式要求
效果:格式稳定,每次输出结构一致,不再因为描述方式不同而得到不同结果
下面是"会议纪要 Skill"的实际设定内容,你可以直接复制使用:
这就是一个完整的 Level 0 Skill。它固化了三件事:角色设定(谁在说话)、输出格式(输出什么结构)、输入变量(需要提供什么信息)。任何人用这个 Project,都能得到格式一致的会议纪要。
Level 0 的 Skill 只能处理你喂进去的内容——你粘贴什么,它分析什么。Level 1 的本质跨越是:Skill 拥有了"手",可以主动去外部世界取数据。背后的技术是 Function Calling(工具调用)和 MCP(模型上下文协议)——AI 不再是被动接收者,而是能主动发出搜索请求、读取文件、调用 API。
以一个真实工作场景为例:销售团队每周需要追踪三家竞品的定价变化。Level 0 的做法是:你手动打开竞品官网,截图或复制价格,再粘贴给 AI 分析。Level 1 的做法是:AI 自己联网搜索最新价格,直接给你输出对比报告——你什么都不用找,只需要问一句。
在 Coze 里实现 Level 1,只需要在建 Bot 时开启对应插件权限,其余的系统提示词写法和 Level 0 完全一样:
这个 Level 1 Skill 和 Level 0 的写法几乎一样,唯一不同是 Coze Bot 后台打开了两个插件开关。但能力差距巨大:Level 0 需要你每次手动找数据,Level 1 的 Skill 自己去取。从"处理你提供的信息"到"主动获取信息"——这是 Skill 最重要的一次能力跃升。
当你开始使用 Claude Code 或 OpenClaw 时,Skill 会升级为一个独立文件——SKILL.md。这是由 Anthropic 主导制定的开放标准(agentskills.io),Claude Code 和 OpenClaw 使用完全相同的格式,可以互相迁移。
Level 2 和 Level 0/1 最本质的区别不在于"提示词写得更复杂",而是Skill 变成了一个独立的工程文件(SKILL.md),拥有自己的工具权限白名单、可以运行脚本、可以 fork 独立子 Agent 并行执行。这是由 Anthropic 主导、agentskills.io 制定的开放标准,Claude Code 和 OpenClaw 使用完全相同的格式。
用"竞品价格监控"这个场景展示三层的真实差异——同一个任务,Level 2 能做到 Level 0 和 Level 1 完全做不到的事:
看清楚三层的核心差异:Level 0 只能处理你粘贴进来的文字;Level 1 能联网搜索但每次都是"从零开始",没有历史记忆;Level 2 同时读取历史文件(Read)、联网获取新数据(WebSearch)、运行 Python 对比脚本(Bash),而且用 context: fork 独立运行不干扰主对话——这是真正的工程级能力,不只是"更复杂的提示词"。
SKILL.md 存放在固定目录下,AI 启动时只扫描每个 Skill 的 name 和 description(约 50 个 token),任务匹配时才加载完整内容。这个设计让你可以积累几十上百个 Skill,AI 按需调用,互不干扰。
Claude Code 的 SKILL.md 和 OpenClaw 的 SKILL.md 基于同一个开放标准(agentskills.io),格式完全兼容。你在 Claude Code 里写的 Skill,可以直接用在 OpenClaw 里,反之亦然。OpenClaw 的社区注册表 ClawHub 上已有超过 5400 个可直接安装的 Skill,覆盖搜索、分析、代码、内容自动化等各类场景。Claude Code 则在标准基础上扩展了更多控制字段(如子 Agent 并行、工具权限白名单、条件触发等)。
不需要一开始就学 SKILL.md。用 Claude.ai Projects 建 Level 0 Skill 就够用了,格式就是一段写清楚的系统提示词。等你开始用 Claude Code 或 OpenClaw 时,再升级到 SKILL.md——两者的思路是完全一致的,只是写法从"一段文字"变成了"一个文件"。
Workflow 是把多个 Skill 串起来,形成一条自动运行的流水线。关键特征是:流程是你提前设计好的,AI 按照预定的序列执行,不会自己改变顺序或添加步骤。
Workflow 示例:周报自动生成流水线,触发→抓取→生成→推送
Workflow 和 Agent 最大的区别是:Workflow 的路径是固定的——每次触发都走同样的步骤,AI 在其中是执行角色,不做路径决策。Workflow 适合处理结构清晰、步骤可预测的重复任务。在工具选择上,Coze 是目前对非技术用户最友好的 Workflow 平台:网页操作、拖拽搭建、支持飞书 / 钉钉 / 微信等国内常用平台,不需要安装任何软件。
Workflow 的局限性也在这里:如果任务需要根据中间结果改变方向,Workflow 就不够用了。比如"帮我研究竞品并给出市场建议"——这个任务在执行过程中,AI 可能发现某个竞品值得深入调查,需要临时增加几步搜索;或者发现某个数据缺失,需要换一个信息来源。这种动态调整,Workflow 做不到,这就是 Agent 存在的原因。
Agent 是目前 AI 能力的最高形态。你不需要设计流程,只需要给出一个目标,Agent 会自己规划路径、调用 Skill、使用工具、观察结果、调整策略,直到完成任务。这听起来和"聪明的 AI"没什么区别,但技术上的区别非常本质:Agent 是一个持续运行的系统,而不是一次性的对话。
以开源 Agent 框架 OpenClaw 为例,它的架构清晰地展示了一个 Agent 的内部组成:
OpenClaw Agent 架构:五个组件协同工作,Skill 是 Agent 能力的来源
这张图回答了一个关键问题:Skill 和 Agent 是什么关系?Skill 是 Agent 的"能力菜单"。Brain(大模型)接到任务后,从 Skill 库里选出合适的 Skill,再通过 Skill 声明的工具权限去执行。没有 Skill,Agent 就是一个只会说话的大脑;Skill 越丰富,Agent 能处理的任务范围越广。这就是 OpenClaw 的社区注册表 ClawHub 上有 5400 多个技能的原因——每一个都是在扩展 Agent 的能力边界。
同一个任务:"帮我研究一下竞品 A,给出我们进入市场的建议"
Workflow 做法(流程固定):搜索竞品官网 → 搜索用户评论 → 整理报告 → 完成。每次都走这四步,不管中间发现了什么。
Agent 做法(动态决策):搜索竞品官网 → 发现竞品最近刚融资 → 主动增加:搜索融资详情、分析新产品方向 → 发现数据不足 → 换用另一个信息来源 → 综合所有发现,给出建议。全程 AI 自己决定要不要增加步骤、换方向、追加搜索。
Agent 的另一个特征是 Memory(记忆)——它记得你上次的偏好、历史对话、工作习惯,不需要每次重新介绍自己。这让 Agent 从"每次用完就忘"的工具变成了"越用越懂你"的助手。OpenClaw 的 Heartbeat 机制则让 Agent 可以在没有你主动触发的情况下自主运行——比如每天早上自动整理行业动态推送给你,而不需要你每天手动打开对话。
Agent 不是科幻概念,OpenClaw 今天就可以下载安装。但对大多数白领来说,Agent 是"有了之后会极大提升效率"的进阶工具,而不是起步的第一选择。先把 Skill 用好,再把 Workflow 搭起来,Agent 自然是下一步。第 14 章会详细教你用 OpenClaw 搭建第一个属于自己的 Agent 助手。
有了四层概念的基础,面对一个具体任务,选哪一层并不复杂——用三个问题就能决定:
三个问题决定用哪一层:重复性 → 是否需要自动化 → 是否需要动态决策
这个决策树不是一成不变的。同一件事,你可以先用 Prompt 摸索,发现它值得固化后升级为 Skill,再发现它需要自动推送后升级为 Workflow。能力是分阶段积累的,没有必要一开始就追求 Agent。第一步,永远是把最熟悉的一件事做成 Skill。
这四层,是你和 AI 之间分工的边界
Prompt 时代,你每次都在手动操作;Skill 时代,你把经验固化成资产;Workflow 时代,你设计系统让它自动运转;Agent 时代,你给目标,AI 自主执行。这不只是工具的升级,而是你和 AI 协作模式的根本变化——你越来越像一个系统设计者,而不是一个每次手动发指令的操作员。
下一章:AI 最先能帮你做的 20 件白领工作 →