Part 2 · 第 6 章 · 概念地图

Prompt、Skill、Workflow、Agent
——四层递进关系

这四个词你一定听过，但很少有人说清楚它们之间的真实关系。这一章是整本书的概念底座：搞懂这四层，后面所有章节都会豁然开朗。

核心结论：这四层的本质区别不是复杂度，而是谁在决定流程。Prompt 和 Skill，是你告诉 AI 怎么做；Workflow，是你提前设计好流程让 AI 执行；Agent，是你给 AI 一个目标，AI 自己决定怎么一步步达到它。

小节一

四层模型总览：谁在决定流程

全景框架

在开始之前，先问你一个问题：你有没有遇到过这种情况——让 AI 帮你写了一封邮件，效果还不错，但下次让它写同样类型的邮件，结果又变了，还得重新描述一遍背景？或者你看别人演示 AI 能自动完成一整套工作流，但自己试了半天就是做不出来？这背后的原因，就是对这四层的理解没有到位。

这四层不是工具的名字，也不是复杂度的排序，而是四种不同的人机分工模式。从 Prompt 到 Agent，每往上走一层，你让渡给 AI 的决策权就多一点，AI 能独立完成的事情就多一点。

四层递进模型：从左到右是能力升级，核心差异是"谁在决定下一步"

这四层并不是互相替代的关系——它们是积木式叠加的。Skill 由 Prompt 构成，Workflow 把多个 Skill 串起来，Agent 则是有了 Memory 和决策能力之后的 Workflow 进化版。搞懂每一层的边界，才能在正确的场合用正确的工具。

小节二

Prompt：每次重新说的一次性指令

第一层 · 入门起点

Prompt 是你每次给 AI 的指令。它是最基础的交互方式，也是绝大多数人停留最久的地方。每次对话开始，你描述一遍背景，说明要求，AI 生成回复，对话结束，下次重来。

Prompt 的核心问题不是"AI 不够聪明"，而是不稳定。同样的任务，你今天描述的方式和明天描述的方式稍有不同，输出结果可能差很多。你每次都在重复解释背景，时间浪费在沟通成本上，而不是在任务本身上。

另一个常见误解值得专门说明：提示词工程的门槛正在快速降低。2022—2023 年，"写好 Prompt"确实是一门学问——你需要精心设计格式、分隔符、角色描述、示例。但今天的大模型越来越擅长理解自然语言，甚至会主动追问你："你说的'简洁'是指字数控制在多少？"现在写 Prompt，更重要的不是格式技巧，而是说清楚你的意图和判断标准。Prompt 工程从"写法的艺术"变成了"沟通的能力"——这对普通人反而是好消息。

Prompt 适合用在哪里？一次性的、不重复的任务：临时翻译一段文字、询问某个概念的解释、对一份特定文档提问。一旦某类任务开始重复出现，就应该升级到 Skill。

小节三

Skill：一次定义，反复复用的行为模块

第二层 · 核心能力

Skill 是这本书里最重要的概念。它解决的是 Prompt 最大的问题：不稳定、不可复用。一个 Skill 的本质是：把你对某类任务的处理方式固化成一个可以反复调用的模块——角色设定、输出格式、输入变量，一次定义，每次只需填入变量，稳定输出。

但 Skill 不只有一种形态。随着技术的发展，Skill 已经演化出三个层次，能力差异非常大：

Skill 的三个层次：能力和门槛同步递增，入门从 Level 0 开始

如何建第一个 Skill（Level 0）

Level 0 的 Skill 就是在 Claude.ai 里新建一个 Project，然后写好系统提示词。所有在这个 Project 里的对话，AI 都会记住你写的设定。以"会议纪要助手"为例，操作步骤是：

操作步骤 · Claude.ai Projects

第一步：打开 claude.ai → 左侧边栏点击「Projects」→「New Project」

第二步：在 Project Instructions（项目指令）里写入你的 Skill 设定（见下方模板）

第三步：每次把会议转录稿粘进对话，直接开始——不需要再解释格式要求

效果：格式稳定，每次输出结构一致，不再因为描述方式不同而得到不同结果

下面是"会议纪要 Skill"的实际设定内容，你可以直接复制使用：

# 会议纪要助手 · Skill 设定

## 你的角色
你是一位专业的会议助理，专门将会议转录稿整理为结构化纪要。
风格：客观、简洁、准确，不添加会议中未提到的内容。

## 输入格式
用户会粘贴会议转录文字，并说明：
- 会议名称
- 参与人列表（可选）

## 输出格式（每次固定输出以下五个模块）

**会议背景**：一句话说明会议目的和参与人

**核心决策**：本次会议做出的重要决定（每条不超过一行）

**行动项清单**：
格式：- [ ] [负责人] [行动内容] [截止日期]

**待跟进问题**：尚未解决、需要后续跟进的问题

**下次会议建议议题**：根据本次讨论推断
    

这就是一个完整的 Level 0 Skill。它固化了三件事：角色设定（谁在说话）、输出格式（输出什么结构）、输入变量（需要提供什么信息）。任何人用这个 Project，都能得到格式一致的会议纪要。

Level 1 Skill：插上工具，主动取数据

Level 0 的 Skill 只能处理你喂进去的内容——你粘贴什么，它分析什么。Level 1 的本质跨越是：Skill 拥有了"手"，可以主动去外部世界取数据。背后的技术是 Function Calling（工具调用）和 MCP（模型上下文协议）——AI 不再是被动接收者，而是能主动发出搜索请求、读取文件、调用 API。

以一个真实工作场景为例：销售团队每周需要追踪三家竞品的定价变化。Level 0 的做法是：你手动打开竞品官网，截图或复制价格，再粘贴给 AI 分析。Level 1 的做法是：AI 自己联网搜索最新价格，直接给你输出对比报告——你什么都不用找，只需要问一句。

在 Coze 里实现 Level 1，只需要在建 Bot 时开启对应插件权限，其余的系统提示词写法和 Level 0 完全一样：

# 竞品价格追踪助手 · Level 1 Skill（Coze Bot 配置）

## 角色设定
你是一位市场价格分析师，专注追踪竞品的实时定价动态。
风格：客观、数据驱动，每条结论都附上具体数字。

## ⚡ 已启用工具（这是 Level 1 与 Level 0 的核心区别）
✅ 联网搜索 — 主动搜索竞品官网获取实时价格（不需要你手动复制）
✅ 网页浏览 — 读取价格详情页完整内容，不只看摘要标题

## 输入变量
用户提供：
- [竞品名称]：如 ProductA / ProductB / ProductC
- [产品类型]：如 年度订阅版 / 标准版 / 企业版

## 输出格式（每次固定四列）
| 竞品 | 套餐 | 当前价格 | 与我司对比 | 建议行动 |
自动标注：降价 🟢 / 涨价 🔴 / 新套餐 🆕

这个 Level 1 Skill 和 Level 0 的写法几乎一样，唯一不同是 Coze Bot 后台打开了两个插件开关。但能力差距巨大：Level 0 需要你每次手动找数据，Level 1 的 Skill 自己去取。从"处理你提供的信息"到"主动获取信息"——这是 Skill 最重要的一次能力跃升。

Level 2 Skill：SKILL.md 工程级格式

当你开始使用 Claude Code 或 OpenClaw 时，Skill 会升级为一个独立文件——SKILL.md。这是由 Anthropic 主导制定的开放标准（agentskills.io），Claude Code 和 OpenClaw 使用完全相同的格式，可以互相迁移。

Level 2 和 Level 0/1 最本质的区别不在于"提示词写得更复杂"，而是Skill 变成了一个独立的工程文件（SKILL.md），拥有自己的工具权限白名单、可以运行脚本、可以 fork 独立子 Agent 并行执行。这是由 Anthropic 主导、agentskills.io 制定的开放标准，Claude Code 和 OpenClaw 使用完全相同的格式。

用"竞品价格监控"这个场景展示三层的真实差异——同一个任务，Level 2 能做到 Level 0 和 Level 1 完全做不到的事：

---  ← YAML 配置区：Level 2 特有，Level 0/1 没有这部分
name: price-monitor
description: 实时监控竞品价格并与历史数据对比，生成变动预警。
  触发词：价格监控、查竞品定价、竞品有没有降价
allowed-tools: WebSearch, Bash, Read  ← 三种工具同时使用，Level 0=无，Level 1=1种
context: fork    ← 开独立子 Agent，不影响主对话上下文
---

## 你的角色
定价策略分析师，负责竞品价格监控与异常预警。

## 执行步骤（Level 2 会自动依次执行，不需要人工干预每一步）

第一步：读取历史价格记录
用 Read 工具读取 ./data/price_history.json（上次的价格存档）

第二步：搜索最新价格
用 WebSearch 分别搜索每个竞品的当前定价页面
关键词格式："{竞品名} 官网定价 价格 2026"

第三步：运行对比脚本
用 Bash 执行：`python scripts/compare_prices.py`
脚本自动标注：涨价 🔴 / 降价 🟢 / 新套餐 🆕 / 无变化 ⚪

第四步：生成预警报告
输出变动表格 + 异常标记 + 建议行动，更新价格存档

## 输出格式
| 竞品 | 套餐 | 上次价格 | 当前价格 | 变动幅度 | 建议 |
    

看清楚三层的核心差异：Level 0 只能处理你粘贴进来的文字；Level 1 能联网搜索但每次都是"从零开始"，没有历史记忆；Level 2 同时读取历史文件（Read）、联网获取新数据（WebSearch）、运行 Python 对比脚本（Bash），而且用 context: fork 独立运行不干扰主对话——这是真正的工程级能力，不只是"更复杂的提示词"。

SKILL.md 存放在固定目录下，AI 启动时只扫描每个 Skill 的 name 和 description（约 50 个 token），任务匹配时才加载完整内容。这个设计让你可以积累几十上百个 Skill，AI 按需调用，互不干扰。

Claude Code vs OpenClaw · 同一个标准

Claude Code 的 SKILL.md 和 OpenClaw 的 SKILL.md 基于同一个开放标准（agentskills.io），格式完全兼容。你在 Claude Code 里写的 Skill，可以直接用在 OpenClaw 里，反之亦然。OpenClaw 的社区注册表 ClawHub 上已有超过 5400 个可直接安装的 Skill，覆盖搜索、分析、代码、内容自动化等各类场景。Claude Code 则在标准基础上扩展了更多控制字段（如子 Agent 并行、工具权限白名单、条件触发等）。

普通人的感知

不需要一开始就学 SKILL.md。用 Claude.ai Projects 建 Level 0 Skill 就够用了，格式就是一段写清楚的系统提示词。等你开始用 Claude Code 或 OpenClaw 时，再升级到 SKILL.md——两者的思路是完全一致的，只是写法从"一段文字"变成了"一个文件"。

小节四

Workflow：你设计流程，AI 按步骤执行

第三层 · 自动化

Workflow 是把多个 Skill 串起来，形成一条自动运行的流水线。关键特征是：流程是你提前设计好的，AI 按照预定的序列执行，不会自己改变顺序或添加步骤。

Workflow 示例：周报自动生成流水线，触发→抓取→生成→推送

Workflow 和 Agent 最大的区别是：Workflow 的路径是固定的——每次触发都走同样的步骤，AI 在其中是执行角色，不做路径决策。Workflow 适合处理结构清晰、步骤可预测的重复任务。在工具选择上，Coze 是目前对非技术用户最友好的 Workflow 平台：网页操作、拖拽搭建、支持飞书 / 钉钉 / 微信等国内常用平台，不需要安装任何软件。

Workflow 的局限性也在这里：如果任务需要根据中间结果改变方向，Workflow 就不够用了。比如"帮我研究竞品并给出市场建议"——这个任务在执行过程中，AI 可能发现某个竞品值得深入调查，需要临时增加几步搜索；或者发现某个数据缺失，需要换一个信息来源。这种动态调整，Workflow 做不到，这就是 Agent 存在的原因。

小节五

Agent：给目标，AI 自己决定怎么做

第四层 · 自主决策

Agent 是目前 AI 能力的最高形态。你不需要设计流程，只需要给出一个目标，Agent 会自己规划路径、调用 Skill、使用工具、观察结果、调整策略，直到完成任务。这听起来和"聪明的 AI"没什么区别，但技术上的区别非常本质：Agent 是一个持续运行的系统，而不是一次性的对话。

以开源 Agent 框架 OpenClaw 为例，它的架构清晰地展示了一个 Agent 的内部组成：

OpenClaw Agent 架构：五个组件协同工作，Skill 是 Agent 能力的来源

这张图回答了一个关键问题：Skill 和 Agent 是什么关系？Skill 是 Agent 的"能力菜单"。Brain（大模型）接到任务后，从 Skill 库里选出合适的 Skill，再通过 Skill 声明的工具权限去执行。没有 Skill，Agent 就是一个只会说话的大脑；Skill 越丰富，Agent 能处理的任务范围越广。这就是 OpenClaw 的社区注册表 ClawHub 上有 5400 多个技能的原因——每一个都是在扩展 Agent 的能力边界。

Agent vs Workflow · 关键区别实例

同一个任务："帮我研究一下竞品 A，给出我们进入市场的建议"

Workflow 做法（流程固定）：搜索竞品官网 → 搜索用户评论 → 整理报告 → 完成。每次都走这四步，不管中间发现了什么。

Agent 做法（动态决策）：搜索竞品官网 → 发现竞品最近刚融资 → 主动增加：搜索融资详情、分析新产品方向 → 发现数据不足 → 换用另一个信息来源 → 综合所有发现，给出建议。全程 AI 自己决定要不要增加步骤、换方向、追加搜索。

Agent 的另一个特征是 Memory（记忆）——它记得你上次的偏好、历史对话、工作习惯，不需要每次重新介绍自己。这让 Agent 从"每次用完就忘"的工具变成了"越用越懂你"的助手。OpenClaw 的 Heartbeat 机制则让 Agent 可以在没有你主动触发的情况下自主运行——比如每天早上自动整理行业动态推送给你，而不需要你每天手动打开对话。

普通人的感知

Agent 不是科幻概念，OpenClaw 今天就可以下载安装。但对大多数白领来说，Agent 是"有了之后会极大提升效率"的进阶工具，而不是起步的第一选择。先把 Skill 用好，再把 Workflow 搭起来，Agent 自然是下一步。第 14 章会详细教你用 OpenClaw 搭建第一个属于自己的 Agent 助手。

小节六

遇到任务，用哪一层？

决策指引

有了四层概念的基础，面对一个具体任务，选哪一层并不复杂——用三个问题就能决定：

三个问题决定用哪一层：重复性 → 是否需要自动化 → 是否需要动态决策

这个决策树不是一成不变的。同一件事，你可以先用 Prompt 摸索，发现它值得固化后升级为 Skill，再发现它需要自动推送后升级为 Workflow。能力是分阶段积累的，没有必要一开始就追求 Agent。第一步，永远是把最熟悉的一件事做成 Skill。

这四层，是你和 AI 之间分工的边界

Prompt 时代，你每次都在手动操作；Skill 时代，你把经验固化成资产；Workflow 时代，你设计系统让它自动运转；Agent 时代，你给目标，AI 自主执行。这不只是工具的升级，而是你和 AI 协作模式的根本变化——你越来越像一个系统设计者，而不是一个每次手动发指令的操作员。

下一章：AI 最先能帮你做的 20 件白领工作 →

Prompt、Skill、Workflow、Agent——四层递进关系