洪致知的个人网站

查看源代码

Skills 的工程化心法

洪致知2026-04-01

阅读导航

先看「一、为什么 Skills 是核心」，建立问题意识
再看「三、Skill 包的技术结构」，理解目录级能力单元
最后看「五~七」，掌握分类法、治理与度量闭环

3 分钟结论

Skills 的本质不是提示词增强，而是 Workflow 的迁移与工程封装。
一个成熟 Skill 至少包含：索引与路由、知识补充、模板约束、脚本执行、Hook 治理。
组织级落地必须走闭环：分类 -> 设计 -> 分发 -> 度量 -> 迭代。

一、为什么 Skills 是核心

在 Agent 实践里，记忆系统和上下文工程很重要，但真正决定“任务是否可复用落地”的往往是 Skills。

原因很直接：

记忆更像系统内部机制，外部可操作性弱
Skills 可以直接承载团队方法与执行流程
同一问题能否稳定复现，取决于 Skill 质量

一句话：记忆解决“知道什么”，Skills 解决“按什么方法做”。

二、Skills 是什么

Skill 不是单个提示词文件，而是一个可维护的能力包。
它可以携带文档、模板、脚本、配置、数据与钩子，在不撑爆上下文的前提下提供渐进式能力展开。

可把它理解为：

给 Agent 使用的 SOP 包 + 约束包 + 资产包。

三、Skill 包的技术结构

典型结构：

<skill-name>/ SKILL.md + references/ + assets/ + scripts/ + hooks/config/data

其中各层职责清晰：

SKILL.md：入口与路由
references/：知识层
assets/：模板层
scripts/：确定性执行层
hooks：约束与埋点层

1) SKILL.md：入口页而非知识大全

SKILL.md 的核心是调度，不是堆知识。应明确四件事：

解决什么任务
什么场景触发
触发后按什么顺序展开
输出结果应长成什么样

如果把所有背景都塞进入口，反而会增加误触发与理解噪音。

2) description：触发协议

很多 Skill 失效不是内容差，而是 description 写成“产品简介”。
高质量 description 要同时回答：

任务边界
触发语义
适用场景
不适用场景

这样模型才能在“该触发时触发，不该触发时克制”。

3) references/：重知识按需加载

把低频但关键的背景知识（规则解释、历史翻车案例、字段口径）从主流程拆出，实现渐进披露。

4) assets/：稳定输出

模板、骨架、样例能显著降低“每次都写得不一样”的波动，特别适合报告、复盘、分析等固定产物场景。

5) scripts/：把确定性下沉

模型擅长规划，不擅长机械重复。
凡是“可脚本化”的步骤（校验、转换、抓取、聚合）应优先下沉到脚本，模型负责调度。

6) Hook：治理与可观测关键点

Hook 让 Skill 从“好用”进化到“可管”：

危险操作前拦截
工具参数前置检查
结果格式后置校验
调用日志自动记录

这层是组织级落地的分水岭。

四、运行机制：索引 -> 展开 -> 按需读取

Skill 不应在会话启动时全量注入，而应分层运行：

索引层：先暴露轻量目录（名称 + description）
主说明层：命中后读取 SKILL.md
按需深入层：再读取 references/assets 或执行 scripts/hooks

该机制的核心价值是：在正确时机给正确信息，降低上下文成本。

五、九类技能分类法（组织治理视角）

为便于团队治理，可按用途将 Skill 分为九类：

参考型（规则/文档/口径）
验证型（验收/回归/检查）
数据获取分析型（拉取/清洗/聚合）
团队流程型（SOP 迁移）
模板脚手架型（标准产物生成）
代码质量评审型（研发规范沉淀）
部署与运行保障型（高风险执行）
Runbook 型（故障处置路径）
基础设施运维型（强权限、强审计）

分类价值不在“好看”，而在后续设计、分发、权限、测试与度量策略都可差异化。

六、设计与分发：从好用到可规模化

设计原则

不写常识，优先写 gotchas（易错点/反常识/历史坑）
能脚本化的动作，别让模型用语言硬做
主流程短而清晰，复杂知识外置

分发治理

个人阶段可放项目目录；团队规模扩大后必须分层分发：

项目专属 Skill
跨项目插件 Skill
组织级托管 Skill

并建立准入门槛，避免“谁写都进主目录”造成触发冲突和上下文污染。

七、可观测闭环：让 Skill 可迭代

没有度量，就无法知道 Skill 是否真的创造价值。
建议至少监控三个核心指标：

触发率：该触发时是否命中
误触发率：不该触发时是否乱触发
成功率：触发后是否完成目标

可通过 Hook（如工具调用前后埋点）建立基础观测，形成从“感觉好用”到“数据驱动优化”的转变。

结语

Skill 不是更长的提示词，而是一种新型工程单元。
它承载的不只是语言说明，而是知识、模板、脚本、约束与度量。

当团队把工作流逐步迁移进 Skills 体系后，Agent 才会从“偶尔聪明”走向“稳定交付”。
这也是 Skills 在 Agent 工程里长期成为核心的根本原因。

Skills 的工程化心法从工程视角系统拆解 Skills：它不是“更长提示词”，而是可维护、可复用、可治理、可度量的能力包。文章覆盖 Skill 包结构、触发机制、九类分类法、组织级治理与可观测闭环。洪致知