返回博客

Skills:让 AI Agent 拥有「专业资质」的系统设计

Prompt 工程能教 agent 做一件事,Skill 能让 agent 在需要的时候自动切换到那个状态——并且知道什么时候该换回来。两者的区别,就是你告诉一个人「怎么修水管」和给他发了一张「水管工执照」的区别。


Skill 不是什么

在讨论 Skill 是什么之前,先明确它不是什么:

不是 prompt 模板。 把一段长 prompt 存起来复用叫 snippet,不是 skill。Skill 包含的不只是提示词,还有行为规则、工具权限、输出规范。

不是 workflow。 Skill 不是「先做 A 再做 B 再输出 C」的固定流程。它是在特定场景下 agent 的认知模式切换。

不是 plugin。 Plugin 扩展的是 agent 能用的工具。Skill 改变的是 agent 对已有工具的用法。


Skill 的结构:三层设计

PieBox 的每个 Skill 由三层构成:

第一层:触发机制(When)

Skill 不是用户手动激活的,是 agent 根据场景自动匹配的。每个 Skill 定义了自己的触发条件——用户说了什么关键词、当前在什么项目中、正在执行什么类型的任务。匹配上了就自动加载。

比如 data-analytics skill 的触发词是「分析数据」「付费分析」「留存分析」——只要用户说了这些,agent 就知道要用数据分析的思维方式而非通用编码模式来响应当前请求。

第二层:认知框架(How)

这是 Skill 的核心——加载后会改变 agent 的决策偏好和输出风格。一个 tdd skill 加载后,agent 会坚持「先写测试再写代码」,不是因为用户要求了,而是因为这个 skill 把它变成了 agent 的默认行为模式。

第三层:工具链配置(What)

每个 Skill 可以声明它需要的工具和权限。diagnose skill 需要日志读取、进程检查、性能 profiling 工具;presentation skill 需要 HTML 渲染和图片生成能力。加载时 agent 就知道自己当前有哪些武器可用。


三个典型 Skill,三种设计哲学

brainstorming skill — 重沟通:加载后 agent 变成「促导者」而非「执行者」。核心规则是「在得到设计方案确认之前,不做任何实现」。这和普通 agent 的「听到需求就动手」的模式完全不同。

data-analytics skill — 重流程:加载后 agent 自动选择分析管线——Regular(快速出数)还是 Ultra(深度报告)。它规定了输出格式(ECharts 图表、时间线、折叠卡片),确保分析结果不是一堆文字,而是可交付的报告。

diagnose skill — 重纪律:加载后 agent 进入「科学 debug 模式」——建立验证闭环 → 复现 → 提出假设 → 一一验证 → 修复。它的红线是「不确定根因不动手」,避免了普通 agent 看到报错就直接改代码的冲动。


为什么 Skill 比 Prompt 工程更有效

回到核心差异:prompt 是一次性的指令,skill 是持久的认知模式。

Prompt 的问题在于 agent 执行完当前任务后「忘了」你的要求。下次你再让它 debug,它又是默认的编码模式——因为你上次说的是「这次用 diagnose 模式」,不是「以后 debug 都用 diagnose 模式」。

Skill 解决了这个问题:它把特定场景的最佳实践固化成 agent 的「默认行为」。激活条件满足时自动切换,不需要用户每次都说一遍。这就是为什么 Skills 能让一个通用 agent 在不同场景下展现出专业水准——它不是被临时告知该怎么做,而是被训练成了在那种场景下自然会那样做。


PieBox 的 Skills 系统还在快速迭代中。我们的目标是让 agent 不只是「一个会写代码的 AI」,而是在不同场景下自动变成「架构师」「分析师」「UI 设计师」「Debug 专家」的复合体。

试试 PieBox 的 Skills 系统,让 agent 在不同任务中自动切换专业模式。