“情况明,决心大,方法对” -- 毛泽东
查看源代码

Skills 的工程化心法

阅读导航

  • 先看「一、为什么 Skills 是核心」,建立问题意识
  • 再看「三、Skill 包的技术结构」,理解目录级能力单元
  • 最后看「五~七」,掌握分类法、治理与度量闭环

3 分钟结论

  1. Skills 的本质不是提示词增强,而是 Workflow 的迁移与工程封装。
  2. 一个成熟 Skill 至少包含:索引与路由、知识补充、模板约束、脚本执行、Hook 治理。
  3. 组织级落地必须走闭环:分类 -> 设计 -> 分发 -> 度量 -> 迭代

一、为什么 Skills 是核心

在 Agent 实践里,记忆系统和上下文工程很重要,但真正决定“任务是否可复用落地”的往往是 Skills。

原因很直接:

  • 记忆更像系统内部机制,外部可操作性弱
  • Skills 可以直接承载团队方法与执行流程
  • 同一问题能否稳定复现,取决于 Skill 质量

一句话:记忆解决“知道什么”,Skills 解决“按什么方法做”。

二、Skills 是什么

Skill 不是单个提示词文件,而是一个可维护的能力包。
它可以携带文档、模板、脚本、配置、数据与钩子,在不撑爆上下文的前提下提供渐进式能力展开。

可把它理解为:

给 Agent 使用的 SOP 包 + 约束包 + 资产包。

三、Skill 包的技术结构

典型结构:

<skill-name>/ SKILL.md + references/ + assets/ + scripts/ + hooks/config/data

其中各层职责清晰:

  • SKILL.md:入口与路由
  • references/:知识层
  • assets/:模板层
  • scripts/:确定性执行层
  • hooks:约束与埋点层

1) SKILL.md:入口页而非知识大全

SKILL.md 的核心是调度,不是堆知识。应明确四件事:

  1. 解决什么任务
  2. 什么场景触发
  3. 触发后按什么顺序展开
  4. 输出结果应长成什么样

如果把所有背景都塞进入口,反而会增加误触发与理解噪音。

2) description:触发协议

很多 Skill 失效不是内容差,而是 description 写成“产品简介”。
高质量 description 要同时回答:

  • 任务边界
  • 触发语义
  • 适用场景
  • 不适用场景

这样模型才能在“该触发时触发,不该触发时克制”。

3) references/:重知识按需加载

把低频但关键的背景知识(规则解释、历史翻车案例、字段口径)从主流程拆出,实现渐进披露。

4) assets/:稳定输出

模板、骨架、样例能显著降低“每次都写得不一样”的波动,特别适合报告、复盘、分析等固定产物场景。

5) scripts/:把确定性下沉

模型擅长规划,不擅长机械重复。
凡是“可脚本化”的步骤(校验、转换、抓取、聚合)应优先下沉到脚本,模型负责调度。

6) Hook:治理与可观测关键点

Hook 让 Skill 从“好用”进化到“可管”:

  • 危险操作前拦截
  • 工具参数前置检查
  • 结果格式后置校验
  • 调用日志自动记录

这层是组织级落地的分水岭。

四、运行机制:索引 -> 展开 -> 按需读取

Skill 不应在会话启动时全量注入,而应分层运行:

  1. 索引层:先暴露轻量目录(名称 + description)
  2. 主说明层:命中后读取 SKILL.md
  3. 按需深入层:再读取 references/assets 或执行 scripts/hooks

该机制的核心价值是:在正确时机给正确信息,降低上下文成本。

五、九类技能分类法(组织治理视角)

为便于团队治理,可按用途将 Skill 分为九类:

  1. 参考型(规则/文档/口径)
  2. 验证型(验收/回归/检查)
  3. 数据获取分析型(拉取/清洗/聚合)
  4. 团队流程型(SOP 迁移)
  5. 模板脚手架型(标准产物生成)
  6. 代码质量评审型(研发规范沉淀)
  7. 部署与运行保障型(高风险执行)
  8. Runbook 型(故障处置路径)
  9. 基础设施运维型(强权限、强审计)

分类价值不在“好看”,而在后续设计、分发、权限、测试与度量策略都可差异化。

六、设计与分发:从好用到可规模化

设计原则

  • 不写常识,优先写 gotchas(易错点/反常识/历史坑)
  • 能脚本化的动作,别让模型用语言硬做
  • 主流程短而清晰,复杂知识外置

分发治理

个人阶段可放项目目录;团队规模扩大后必须分层分发:

  • 项目专属 Skill
  • 跨项目插件 Skill
  • 组织级托管 Skill

并建立准入门槛,避免“谁写都进主目录”造成触发冲突和上下文污染。

七、可观测闭环:让 Skill 可迭代

没有度量,就无法知道 Skill 是否真的创造价值。
建议至少监控三个核心指标:

  1. 触发率:该触发时是否命中
  2. 误触发率:不该触发时是否乱触发
  3. 成功率:触发后是否完成目标

可通过 Hook(如工具调用前后埋点)建立基础观测,形成从“感觉好用”到“数据驱动优化”的转变。

结语

Skill 不是更长的提示词,而是一种新型工程单元。
它承载的不只是语言说明,而是知识、模板、脚本、约束与度量。

当团队把工作流逐步迁移进 Skills 体系后,Agent 才会从“偶尔聪明”走向“稳定交付”。
这也是 Skills 在 Agent 工程里长期成为核心的根本原因。

Skills 的工程化心法从工程视角系统拆解 Skills:它不是“更长提示词”,而是可维护、可复用、可治理、可度量的能力包。文章覆盖 Skill 包结构、触发机制、九类分类法、组织级治理与可观测闭环。 洪致知