Part 2 · 第 6 章 · 概念地图

Prompt、Skill、Workflow、Agent
——四层递进关系

这四个词你一定听过,但很少有人说清楚它们之间的真实关系。这一章是整本书的概念底座:搞懂这四层,后面所有章节都会豁然开朗。

核心结论:这四层的本质区别不是复杂度,而是谁在决定流程。Prompt 和 Skill,是你告诉 AI 怎么做;Workflow,是你提前设计好流程让 AI 执行;Agent,是你给 AI 一个目标,AI 自己决定怎么一步步达到它。

四层模型总览:谁在决定流程

全景框架

在开始之前,先问你一个问题:你有没有遇到过这种情况——让 AI 帮你写了一封邮件,效果还不错,但下次让它写同样类型的邮件,结果又变了,还得重新描述一遍背景?或者你看别人演示 AI 能自动完成一整套工作流,但自己试了半天就是做不出来?这背后的原因,就是对这四层的理解没有到位。

这四层不是工具的名字,也不是复杂度的排序,而是四种不同的人机分工模式。从 Prompt 到 Agent,每往上走一层,你让渡给 AI 的决策权就多一点,AI 能独立完成的事情就多一点。

四层递进模型 · 谁在决定流程 Prompt 提示词 一次性指令 · 每次都要重新说 你写指令 → AI 响应 → 结束 你决定 Skill 技能模块 可复用行为模块 · 一次定义反复调用 固化角色+格式+变量 → AI 稳定输出 你决定 Workflow 自动化流程 预定义多步序列 · AI 按步骤执行 触发 → Skill A → Skill B → 推送输出 你设计 Agent 自主决策 自主决策系统 · AI 自己规划路径 给目标 → AI 选 Skill → 调工具 → 推进 → 完成 AI 决定 ← 你 ← AI 越往下,AI 自主决策的比重越高,能完成的任务越复杂

四层递进模型:从左到右是能力升级,核心差异是"谁在决定下一步"

这四层并不是互相替代的关系——它们是积木式叠加的。Skill 由 Prompt 构成,Workflow 把多个 Skill 串起来,Agent 则是有了 Memory 和决策能力之后的 Workflow 进化版。搞懂每一层的边界,才能在正确的场合用正确的工具。

Prompt:每次重新说的一次性指令

第一层 · 入门起点

Prompt 是你每次给 AI 的指令。它是最基础的交互方式,也是绝大多数人停留最久的地方。每次对话开始,你描述一遍背景,说明要求,AI 生成回复,对话结束,下次重来。

Prompt 的核心问题不是"AI 不够聪明",而是不稳定。同样的任务,你今天描述的方式和明天描述的方式稍有不同,输出结果可能差很多。你每次都在重复解释背景,时间浪费在沟通成本上,而不是在任务本身上。

另一个常见误解值得专门说明:提示词工程的门槛正在快速降低。2022—2023 年,"写好 Prompt"确实是一门学问——你需要精心设计格式、分隔符、角色描述、示例。但今天的大模型越来越擅长理解自然语言,甚至会主动追问你:"你说的'简洁'是指字数控制在多少?"现在写 Prompt,更重要的不是格式技巧,而是说清楚你的意图和判断标准。Prompt 工程从"写法的艺术"变成了"沟通的能力"——这对普通人反而是好消息。

Prompt 适合用在哪里?一次性的、不重复的任务:临时翻译一段文字、询问某个概念的解释、对一份特定文档提问。一旦某类任务开始重复出现,就应该升级到 Skill。

Skill:一次定义,反复复用的行为模块

第二层 · 核心能力

Skill 是这本书里最重要的概念。它解决的是 Prompt 最大的问题:不稳定、不可复用。一个 Skill 的本质是:把你对某类任务的处理方式固化成一个可以反复调用的模块——角色设定、输出格式、输入变量,一次定义,每次只需填入变量,稳定输出。

但 Skill 不只有一种形态。随着技术的发展,Skill 已经演化出三个层次,能力差异非常大:

Skill 的三个层次 Level 0 · 提示词 Skill 固定系统提示词 存储在对话设置中 工具:Claude.ai Projects 能力:生成文字 门槛:极低,打开即用 ✓ 本书入门推荐 Level 1 · 工具调用 Skill Skill + 外部工具调用 能搜索、读文件、调 API 工具:Coze + 插件 能力:处理 + 执行外部动作 门槛:中等,需配置 ✓ 第 13 章 Workflow 用 Level 2 · 工程级 Skill SKILL.md 行为模块 可 fork 子 Agent 并行执行 工具:Claude Code / OpenClaw 能力:读写文件、运行代码 门槛:较高,需安装配置 ✓ 第 14 章 Agent 用

Skill 的三个层次:能力和门槛同步递增,入门从 Level 0 开始

如何建第一个 Skill(Level 0)

Level 0 的 Skill 就是在 Claude.ai 里新建一个 Project,然后写好系统提示词。所有在这个 Project 里的对话,AI 都会记住你写的设定。以"会议纪要助手"为例,操作步骤是:

操作步骤 · Claude.ai Projects

第一步:打开 claude.ai → 左侧边栏点击「Projects」→「New Project」

第二步:在 Project Instructions(项目指令)里写入你的 Skill 设定(见下方模板)

第三步:每次把会议转录稿粘进对话,直接开始——不需要再解释格式要求

效果:格式稳定,每次输出结构一致,不再因为描述方式不同而得到不同结果

下面是"会议纪要 Skill"的实际设定内容,你可以直接复制使用:

# 会议纪要助手 · Skill 设定 ## 你的角色 你是一位专业的会议助理,专门将会议转录稿整理为结构化纪要。 风格:客观、简洁、准确,不添加会议中未提到的内容。 ## 输入格式 用户会粘贴会议转录文字,并说明: - 会议名称 - 参与人列表(可选) ## 输出格式(每次固定输出以下五个模块) **会议背景**:一句话说明会议目的和参与人 **核心决策**:本次会议做出的重要决定(每条不超过一行) **行动项清单**: 格式:- [ ] [负责人] [行动内容] [截止日期] **待跟进问题**:尚未解决、需要后续跟进的问题 **下次会议建议议题**:根据本次讨论推断

这就是一个完整的 Level 0 Skill。它固化了三件事:角色设定(谁在说话)、输出格式(输出什么结构)、输入变量(需要提供什么信息)。任何人用这个 Project,都能得到格式一致的会议纪要。

Level 1 Skill:插上工具,主动取数据

Level 0 的 Skill 只能处理你喂进去的内容——你粘贴什么,它分析什么。Level 1 的本质跨越是:Skill 拥有了"手",可以主动去外部世界取数据。背后的技术是 Function Calling(工具调用)和 MCP(模型上下文协议)——AI 不再是被动接收者,而是能主动发出搜索请求、读取文件、调用 API。

以一个真实工作场景为例:销售团队每周需要追踪三家竞品的定价变化。Level 0 的做法是:你手动打开竞品官网,截图或复制价格,再粘贴给 AI 分析。Level 1 的做法是:AI 自己联网搜索最新价格,直接给你输出对比报告——你什么都不用找,只需要问一句。

在 Coze 里实现 Level 1,只需要在建 Bot 时开启对应插件权限,其余的系统提示词写法和 Level 0 完全一样:

# 竞品价格追踪助手 · Level 1 Skill(Coze Bot 配置) ## 角色设定 你是一位市场价格分析师,专注追踪竞品的实时定价动态。 风格:客观、数据驱动,每条结论都附上具体数字。 ## ⚡ 已启用工具(这是 Level 1 与 Level 0 的核心区别) ✅ 联网搜索 — 主动搜索竞品官网获取实时价格(不需要你手动复制) ✅ 网页浏览 — 读取价格详情页完整内容,不只看摘要标题 ## 输入变量 用户提供: - [竞品名称]:如 ProductA / ProductB / ProductC - [产品类型]:如 年度订阅版 / 标准版 / 企业版 ## 输出格式(每次固定四列) | 竞品 | 套餐 | 当前价格 | 与我司对比 | 建议行动 | 自动标注:降价 🟢 / 涨价 🔴 / 新套餐 🆕

这个 Level 1 Skill 和 Level 0 的写法几乎一样,唯一不同是 Coze Bot 后台打开了两个插件开关。但能力差距巨大:Level 0 需要你每次手动找数据,Level 1 的 Skill 自己去取。从"处理你提供的信息"到"主动获取信息"——这是 Skill 最重要的一次能力跃升。

Level 2 Skill:SKILL.md 工程级格式

当你开始使用 Claude Code 或 OpenClaw 时,Skill 会升级为一个独立文件——SKILL.md。这是由 Anthropic 主导制定的开放标准(agentskills.io),Claude Code 和 OpenClaw 使用完全相同的格式,可以互相迁移。

Level 2 和 Level 0/1 最本质的区别不在于"提示词写得更复杂",而是Skill 变成了一个独立的工程文件(SKILL.md),拥有自己的工具权限白名单、可以运行脚本、可以 fork 独立子 Agent 并行执行。这是由 Anthropic 主导、agentskills.io 制定的开放标准,Claude Code 和 OpenClaw 使用完全相同的格式。

用"竞品价格监控"这个场景展示三层的真实差异——同一个任务,Level 2 能做到 Level 0 和 Level 1 完全做不到的事:

--- ← YAML 配置区:Level 2 特有,Level 0/1 没有这部分 name: price-monitor description: 实时监控竞品价格并与历史数据对比,生成变动预警。 触发词:价格监控、查竞品定价、竞品有没有降价 allowed-tools: WebSearch, Bash, Read ← 三种工具同时使用,Level 0=无,Level 1=1种 context: fork ← 开独立子 Agent,不影响主对话上下文 --- ## 你的角色 定价策略分析师,负责竞品价格监控与异常预警。 ## 执行步骤(Level 2 会自动依次执行,不需要人工干预每一步) 第一步:读取历史价格记录 用 Read 工具读取 ./data/price_history.json(上次的价格存档) 第二步:搜索最新价格 用 WebSearch 分别搜索每个竞品的当前定价页面 关键词格式:"{竞品名} 官网定价 价格 2026" 第三步:运行对比脚本 用 Bash 执行:`python scripts/compare_prices.py` 脚本自动标注:涨价 🔴 / 降价 🟢 / 新套餐 🆕 / 无变化 ⚪ 第四步:生成预警报告 输出变动表格 + 异常标记 + 建议行动,更新价格存档 ## 输出格式 | 竞品 | 套餐 | 上次价格 | 当前价格 | 变动幅度 | 建议 |

看清楚三层的核心差异:Level 0 只能处理你粘贴进来的文字;Level 1 能联网搜索但每次都是"从零开始",没有历史记忆;Level 2 同时读取历史文件(Read)、联网获取新数据(WebSearch)、运行 Python 对比脚本(Bash),而且用 context: fork 独立运行不干扰主对话——这是真正的工程级能力,不只是"更复杂的提示词"。

SKILL.md 存放在固定目录下,AI 启动时只扫描每个 Skill 的 namedescription(约 50 个 token),任务匹配时才加载完整内容。这个设计让你可以积累几十上百个 Skill,AI 按需调用,互不干扰。

Claude Code vs OpenClaw · 同一个标准

Claude Code 的 SKILL.md 和 OpenClaw 的 SKILL.md 基于同一个开放标准(agentskills.io),格式完全兼容。你在 Claude Code 里写的 Skill,可以直接用在 OpenClaw 里,反之亦然。OpenClaw 的社区注册表 ClawHub 上已有超过 5400 个可直接安装的 Skill,覆盖搜索、分析、代码、内容自动化等各类场景。Claude Code 则在标准基础上扩展了更多控制字段(如子 Agent 并行、工具权限白名单、条件触发等)。

普通人的感知

不需要一开始就学 SKILL.md。用 Claude.ai Projects 建 Level 0 Skill 就够用了,格式就是一段写清楚的系统提示词。等你开始用 Claude Code 或 OpenClaw 时,再升级到 SKILL.md——两者的思路是完全一致的,只是写法从"一段文字"变成了"一个文件"。

Workflow:你设计流程,AI 按步骤执行

第三层 · 自动化

Workflow 是把多个 Skill 串起来,形成一条自动运行的流水线。关键特征是:流程是你提前设计好的,AI 按照预定的序列执行,不会自己改变顺序或添加步骤

⏰ 触发 每周五 17:00 📥 抓取数据 飞书任务完成情况 🤖 AI 生成 周报 Skill 输出草稿 📤 推送 发送到飞书工作区 ✅ 完成 人工审核发送 流程固定,每步由你预先设计,AI 按序执行,不做额外决策

Workflow 示例:周报自动生成流水线,触发→抓取→生成→推送

Workflow 和 Agent 最大的区别是:Workflow 的路径是固定的——每次触发都走同样的步骤,AI 在其中是执行角色,不做路径决策。Workflow 适合处理结构清晰、步骤可预测的重复任务。在工具选择上,Coze 是目前对非技术用户最友好的 Workflow 平台:网页操作、拖拽搭建、支持飞书 / 钉钉 / 微信等国内常用平台,不需要安装任何软件。

Workflow 的局限性也在这里:如果任务需要根据中间结果改变方向,Workflow 就不够用了。比如"帮我研究竞品并给出市场建议"——这个任务在执行过程中,AI 可能发现某个竞品值得深入调查,需要临时增加几步搜索;或者发现某个数据缺失,需要换一个信息来源。这种动态调整,Workflow 做不到,这就是 Agent 存在的原因。

Agent:给目标,AI 自己决定怎么做

第四层 · 自主决策

Agent 是目前 AI 能力的最高形态。你不需要设计流程,只需要给出一个目标,Agent 会自己规划路径、调用 Skill、使用工具、观察结果、调整策略,直到完成任务。这听起来和"聪明的 AI"没什么区别,但技术上的区别非常本质:Agent 是一个持续运行的系统,而不是一次性的对话

以开源 Agent 框架 OpenClaw 为例,它的架构清晰地展示了一个 Agent 的内部组成:

OpenClaw Agent 架构 · 五个核心组件 🚪 Gateway 统一入口 飞书/钉钉/微信 🧠 Brain(大模型) 感知 → 决策 → 选 Skill Claude / GPT-4 💾 Memory 历史对话 / 用户偏好 跨会话长期记忆 🎯 Skills 可复用行为模块 🔍 search-skill 📊 analysis-skill 💻 coding-skill + ClawHub 5400+ 技能 🔧 Tools MCP / 执行层 🌐 联网搜索 📁 读写文件 ⚡ 运行代码 📬 推送消息 💓 Heartbeat · 持续运行机制 定时触发 / 事件监听 / 主动推送 — Agent 不需要你每次手动发消息 ↑ 持续循环

OpenClaw Agent 架构:五个组件协同工作,Skill 是 Agent 能力的来源

这张图回答了一个关键问题:Skill 和 Agent 是什么关系?Skill 是 Agent 的"能力菜单"。Brain(大模型)接到任务后,从 Skill 库里选出合适的 Skill,再通过 Skill 声明的工具权限去执行。没有 Skill,Agent 就是一个只会说话的大脑;Skill 越丰富,Agent 能处理的任务范围越广。这就是 OpenClaw 的社区注册表 ClawHub 上有 5400 多个技能的原因——每一个都是在扩展 Agent 的能力边界。

Agent vs Workflow · 关键区别实例

同一个任务:"帮我研究一下竞品 A,给出我们进入市场的建议"

Workflow 做法(流程固定):搜索竞品官网 → 搜索用户评论 → 整理报告 → 完成。每次都走这四步,不管中间发现了什么。

Agent 做法(动态决策):搜索竞品官网 → 发现竞品最近刚融资 → 主动增加:搜索融资详情、分析新产品方向 → 发现数据不足 → 换用另一个信息来源 → 综合所有发现,给出建议。全程 AI 自己决定要不要增加步骤、换方向、追加搜索。

Agent 的另一个特征是 Memory(记忆)——它记得你上次的偏好、历史对话、工作习惯,不需要每次重新介绍自己。这让 Agent 从"每次用完就忘"的工具变成了"越用越懂你"的助手。OpenClaw 的 Heartbeat 机制则让 Agent 可以在没有你主动触发的情况下自主运行——比如每天早上自动整理行业动态推送给你,而不需要你每天手动打开对话。

普通人的感知

Agent 不是科幻概念,OpenClaw 今天就可以下载安装。但对大多数白领来说,Agent 是"有了之后会极大提升效率"的进阶工具,而不是起步的第一选择。先把 Skill 用好,再把 Workflow 搭起来,Agent 自然是下一步。第 14 章会详细教你用 OpenClaw 搭建第一个属于自己的 Agent 助手。

遇到任务,用哪一层?

决策指引

有了四层概念的基础,面对一个具体任务,选哪一层并不复杂——用三个问题就能决定:

这件事会重复做吗? 每周/每月都要做类似任务 → Prompt 一次性任务,直接对话 需要自动触发或推送结果吗? 定时运行、推送到飞书/钉钉 → Skill 固化格式,手动调用 任务路径是否需要动态调整? AI 可能需要临时加步骤或换方向 → Workflow Coze 搭建,步骤固定 → Agent(OpenClaw)

三个问题决定用哪一层:重复性 → 是否需要自动化 → 是否需要动态决策

这个决策树不是一成不变的。同一件事,你可以先用 Prompt 摸索,发现它值得固化后升级为 Skill,再发现它需要自动推送后升级为 Workflow。能力是分阶段积累的,没有必要一开始就追求 Agent。第一步,永远是把最熟悉的一件事做成 Skill。

这四层,是你和 AI 之间分工的边界

Prompt 时代,你每次都在手动操作;Skill 时代,你把经验固化成资产;Workflow 时代,你设计系统让它自动运转;Agent 时代,你给目标,AI 自主执行。这不只是工具的升级,而是你和 AI 协作模式的根本变化——你越来越像一个系统设计者,而不是一个每次手动发指令的操作员。

下一章:AI 最先能帮你做的 20 件白领工作 →