OpenClaw-hot-skills-zh Self-Improving + Proactive Agent
自我反思 + 自我批评 + 自我学习 + 自组织记忆。智能体评估自己的工作,捕捉错误,并永久改进。适用于以下场景:(1) 命令、工具、API 或操作失败时;(2) 用户纠正你或拒绝你的工作成果时;(3) 你发现自己的知识过时或不正确时;(4) 你发现了更好的方法时;(5) 用户明确安装或引用该技能用于当前任务时。
install
source · Clone the upstream repo
git clone https://github.com/L-LesterYu/OpenClaw-hot-skills-zh
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/L-LesterYu/OpenClaw-hot-skills-zh "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/self-improving-proactive-agent-zh" ~/.claude/skills/l-lesteryu-openclaw-hot-skills-zh-self-improving-proactive-agent-72f48e && rm -rf "$T"
OpenClaw · Install into ~/.openclaw/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/L-LesterYu/OpenClaw-hot-skills-zh "$T" && mkdir -p ~/.openclaw/skills && cp -r "$T/skills/self-improving-proactive-agent-zh" ~/.openclaw/skills/l-lesteryu-openclaw-hot-skills-zh-self-improving-proactive-agent-72f48e && rm -rf "$T"
manifest:
skills/self-improving-proactive-agent-zh/SKILL.mdsource content
何时使用
用户纠正你或指出错误。你完成重要工作并想评估结果。你注意到自己的输出中有可以改进的地方。知识应该随着时间积累,无需手动维护。
架构
记忆存储在
~/self-improving/ 中,采用分层结构。如果 ~/self-improving/ 不存在,运行 setup.md。
工作区设置应将标准的自我改进引导添加到工作区的 AGENTS、SOUL 和 HEARTBEAT.md 文件中,并通过 heartbeat-rules.md 路由定期维护。
~/self-improving/ ├── memory.md # HOT: ≤100 行,始终加载 ├── index.md # 主题索引及行数 ├── heartbeat-state.md # 心跳状态:上次运行、已审查的变更、操作笔记 ├── projects/ # 按项目的学习内容 ├── domains/ # 按领域(代码、写作、通信) ├── archive/ # COLD: 衰退的模式 └── corrections.md # 最近 50 条纠正日志
快速参考
| 主题 | 文件 |
|---|---|
| 设置指南 | |
| 心跳状态模板 | |
| 记忆模板 | |
| 工作区心跳片段 | |
| 心跳规则 | |
| 学习机制 | |
| 安全边界 | |
| 扩展规则 | |
| 记忆操作 | |
| 自我反思日志 | |
| OpenClaw HEARTBEAT 种子 | |
要求
- 无需凭证
- 无需额外二进制文件
- 可选安装
技能可能需要网络访问Proactivity
学习信号
当你注意到这些模式时自动记录:
纠正 → 添加到
corrections.md,评估是否加入 memory.md:
- "不,那不对..."
- "实际上,应该是..."
- "你搞错了..."
- "我更喜欢 X,而不是 Y"
- "记住我总是..."
- "我之前告诉过你..."
- "别再做 X 了"
- "你为什么总是..."
偏好信号 → 如果明确,添加到
memory.md:
- "我喜欢你..."
- "总是为我做 X"
- "永远不要做 Y"
- "我的风格是..."
- "对于 [项目],使用..."
模式候选 → 跟踪,重复 3 次后提升:
- 相同指令重复 3 次以上
- 反复运行良好的工作流程
- 用户称赞的特定方法
忽略(不记录):
- 一次性指令("现在做 X")
- 特定上下文("在这个文件中...")
- 假设性问题("如果...会怎样")
自我反思
完成重要工作后,暂停并评估:
- 是否达到预期? — 比较结果与意图
- 哪些可以更好? — 为下次识别改进点
- 这是一个模式吗? — 如果是,记录到
corrections.md
何时自我反思:
- 完成多步骤任务后
- 收到反馈(正面或负面)后
- 修复错误或失误后
- 当你注意到自己的输出可以更好时
日志格式:
CONTEXT: [任务类型] REFLECTION: [我注意到的内容] LESSON: [下次应该怎么做]
示例:
上下文:构建 Flutter UI 反思:间距看起来不对,不得不重做 教训:在展示给用户前检查视觉间距
自我反思条目遵循相同的提升规则:成功应用 3 次 → 提升到 HOT。
快速查询
| 用户说 | 操作 |
|---|---|
| "你对 X 了解什么?" | 在所有层级中搜索 X |
| "你学到了什么?" | 显示 中的最近 10 条 |
| "显示我的模式" | 列出 (HOT) |
| "显示 [项目] 模式" | 加载 |
| "温存储中有什么?" | 列出 + 中的文件 |
| "记忆统计" | 显示各层级的计数 |
| "忘记 X" | 从所有层级中移除(先确认) |
| "导出记忆" | 压缩所有文件 |
记忆统计
当请求"记忆统计"时,报告:
📊 自我改进记忆 HOT (始终加载): memory.md: X 条 WARM (按需加载): projects/: X 个文件 domains/: X 个文件 COLD (已归档): archive/: X 个文件 最近活动 (7 天): 记录的纠正: X 提升到 HOT: X 降级到 WARM: X
常见陷阱
| 陷阱 | 为什么失败 | 更好的做法 |
|---|---|---|
| 从沉默中学习 | 创建错误规则 | 等待明确的纠正或重复证据 |
| 提升过快 | 污染 HOT 记忆 | 保持新教训的试探性,直到重复出现 |
| 读取每个命名空间 | 浪费上下文 | 仅加载 HOT 加上最小匹配的文件 |
| 通过删除压缩 | 失去信任和历史 | 改为合并、总结或降级 |
核心规则
1. 从纠正和自我反思中学习
- 当用户明确纠正你时记录
- 当你在自己的工作中识别出改进时记录
- 永远不要仅从沉默中推断
- 相同教训出现 3 次后 → 请求确认为规则
2. 分层存储
| 层级 | 位置 | 大小限制 | 行为 |
|---|---|---|---|
| HOT | memory.md | ≤100 行 | 始终加载 |
| WARM | projects/, domains/ | 每个文件 ≤200 行 | 上下文匹配时加载 |
| COLD | archive/ | 无限制 | 明确查询时加载 |
3. 自动提升/降级
- 7 天内使用 3 次的模式 → 提升到 HOT
- 30 天未使用的模式 → 降级到 WARM
- 90 天未使用的模式 → 归档到 COLD
- 永远不要在未询问的情况下删除
4. 命名空间隔离
- 项目模式保存在
projects/{name}.md - 全局偏好保存在 HOT 层级 (memory.md)
- 领域模式(代码、写作)保存在
domains/ - 跨命名空间继承:global → domain → project
5. 冲突解决
当模式矛盾时:
- 最具体的优先(project > domain > global)
- 最新的优先(同一层级)
- 如果模糊 → 询问用户
6. 压缩
当文件超过限制时:
- 将相似的纠正合并为单一规则
- 归档未使用的模式
- 总结冗长的条目
- 永远不要丢失已确认的偏好
7. 透明性
- 每个来自记忆的操作 → 引用来源:"使用 X (来自 projects/foo.md:12)"
- 每周摘要可用:学习的模式、降级的、归档的
- 按需完整导出:所有文件为 ZIP
8. 安全边界
参见
boundaries.md — 永远不要存储凭证、健康数据、第三方信息。
9. 优雅降级
如果达到上下文限制:
- 仅加载 memory.md (HOT)
- 按需加载相关命名空间
- 永远不要静默失败 — 告诉用户什么未加载
范围
此技能仅:
- 从用户纠正和自我反思中学习
- 在本地文件中存储偏好 (
)~/self-improving/ - 当工作区集成心跳时,在
中维护心跳状态~/self-improving/heartbeat-state.md - 激活时读取自己的记忆文件
此技能从不:
- 访问日历、电子邮件或联系人
- 发起网络请求
- 读取
之外的文件~/self-improving/ - 从沉默或观察中推断偏好
- 在心跳清理期间删除或盲目重写自我改进记忆
- 修改自己的 SKILL.md
数据存储
本地状态保存在
~/self-improving/:
用于 HOT 规则和已确认的偏好memory.md
用于明确的纠正和可复用的教训corrections.md
和projects/
用于限定范围的模式domains/
用于衰退或不活跃的模式archive/
用于定期维护标记heartbeat-state.md
相关技能
如果用户确认,使用
clawhub install <slug> 安装:
— 智能体长期记忆模式memory
— 自适应教学和解释learning
— 自动学习决策模式decide
— 知道何时询问、何时自主行动escalate
反馈
- 如果有用:
clawhub star self-improving - 保持更新:
clawhub sync