install
source · Clone the upstream repo
git clone https://github.com/seaworld008/Commonly-used-high-value-skills
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/seaworld008/Commonly-used-high-value-skills "$T" && mkdir -p ~/.claude/skills && cp -r "$T/openclaw-skills/summarize" ~/.claude/skills/seaworld008-commonly-used-high-value-skills-summarize && rm -rf "$T"
OpenClaw · Install into ~/.openclaw/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/seaworld008/Commonly-used-high-value-skills "$T" && mkdir -p ~/.openclaw/skills && cp -r "$T/openclaw-skills/summarize" ~/.openclaw/skills/seaworld008-commonly-used-high-value-skills-summarize && rm -rf "$T"
manifest:
openclaw-skills/summarize/SKILL.mdtags
source content
Summarize
用于信息过载场景下的快速理解与要点抽取。Summarize 技能通过强大的语义提取算法,能够将冗长的文档、复杂的网页或散乱的邮件链条一键浓缩为结构化、可阅读性极强的摘要报告。它不仅是阅读助手,更是辅助决策的知识过滤器。
安装
npx clawhub@latest install summarize
支持内容
- 网页与长文本:支持通过 URL 抓取正文并去除广告噪音。
- Office / PDF 文档:支持
,.docx
,.xlsx
以及各种排版的 PDF 文件。.pptx - 邮件内容:支持多轮往返邮件的逻辑梳理。
- 音视频字幕:可结合 OCR(光学字符识别)或
技能进行二次提炼。transcribe - 代码库文档:快速从
或源码注释中提取核心架构信息。README.md
触发条件 / When to Use
- 快速预读 (Pre-reading):面对几十页的行业研报,先花 30 秒看一眼摘要决定是否精读。
- 会议要点归纳 (Meeting Minutes):基于转录的原始录音文字,自动生成待办事项(Action Items)。
- 竞争情报追踪:每天抓取竞争对手的官宣稿件,快速汇总其产品迭代动向。
- 邮件回复辅助:在长达 20 封的回复链条中,快速理清目前的最终共识是什么。
- 社交媒体情报提取:从 Twitter、Reddit 或知乎的长贴中提取核心论点和用户情绪趋势。
- 法律/技术协议解读:从枯燥的 EULA 或 API 说明中提取关键约束条件和资费变动。
核心能力 / Core Capabilities
1. 多层级分段摘要 (Multi-level Summarization)
- 操作步骤:
- 调用
或read
获取原文。web_fetch - 使用“分治法”(Map-Reduce)处理超长文本:先分段摘要,再进行全局融合。
- 提供
(一句话简介)、TL;DR
(3-5 个核心点) 以及Key Points
(逻辑脉络梳理)。Deep Dive
- 调用
- 最佳实践:为不同身份的用户(如高管 vs 研发)定制不同视角的摘要模板。
2. 结构化实体提取 (Entity Extraction)
- 操作步骤:
- 在摘要过程中,自动识别:人物 (Person)、机构 (Organization)、日期 (Date)、金额 (Money) 以及 技术术语 (Tech Stack)。
- 将这些实体以 JSON 或表格形式单独列出,方便导入数据库或 Notion。
- 最佳实践:结合
检查提取的实体是否已经在历史知识库中。memory_search
3. 意图与情感分析 (Sentiment & Intent)
- 操作步骤:
- 判断文本的主观性倾向(褒义/贬义/中性)。
- 提取隐藏在文字背后的显式要求(如“请在周五前回信”)。
- 最佳实践:在摘要头部用图标标出文档的“紧急程度”和“风险等级”。
4. 跨语言翻译与润色 (Cross-lingual Refining)
- 操作步骤:
- 将外文资料直接翻译为目标语言(如中英互转)。
- 调整摘要的语气(正式/幽默/学术)。
常用命令/模板 / Common Patterns
行业研报摘要模板 (Report Summary Template)
### 📄 文档概览 - **标题**: [输入标题] - **来源**: [URL/文件名] - **核心结论**: [一句话总结全文最具价值的洞察] ### 💡 核心要点 (Key Insights) - **[要点 1]**: 描述详细的事实背景及数据支持。 - **[要点 2]**: 描述详细的事实背景及数据支持。 - **[要点 3]**: 描述详细的事实背景及数据支持。 ### 📊 关键数据 (Metrics) - **增长率**: [XX%] - **市场规模**: [$XXX] - **竞争对手**: [A, B, C] ### ✅ 待办建议 (Next Steps) - [ ] 建议行动 A - [ ] 建议行动 B ### 🚩 风险提示 - [潜在风险点 1]
快速摘要命令示例
// 示例:对当前打开的网页进行深度摘要 mcp_call({ name: 'summarize_content', arguments: { source_url: "https://techcrunch.com/article/123", detail_level: "advanced", focus: "technical_innovations" } });
进阶应用场景 / Advanced Use Cases
1. 自动化每日情报墙
- 结合
技能,Agent 每天抓取 20 个相关网页。Summarize 技能将这 20 个网页融合成一张“情报大盘”,展示在用户的 Dashboard 上。tavily-search
2. 播客/视频“跳着听”
- 从 Youtube 获取字幕,Summarize 技能自动标注视频的“高光时刻”时间戳,让用户只需观看关键的 3 分钟。
边界与限制 / Boundaries
- 幻觉风险 (Hallucination):对于高度专业化的文档(如前沿数学论文),Agent 可能理解错误导致摘要失准。
- 输入长度限制:虽然支持长文本,但一次性向大模型发送超过 128k Token 的内容可能导致严重的性能下降或上下文截断。
- 格式解析失败:加密的 PDF、纯图片的扫描件(未 OCR)或复杂的嵌套表格可能导致解析不完整。
- 隐私合规:处理包含敏感个人信息(PII)的文档时,应先进行脱敏处理。
- 版权尊重:摘要内容应遵循 Fair Use 原则,不应直接复制原文大段文字以规避侵权。
最佳实践总结
- 先看目录:对于大文档,先摘要其目录,由用户指定感兴趣的章节再进行深入摘要。
- 事实核查:在摘要中遇到具体数字时,Agent 应主动通过
或see_image
技能进行二次验证。fact-checker - 记忆化存储:所有的摘要记录应存入
,实现“读过即拥有”。MEMORY.md - 视觉辅助:利用
技能,将摘要中的逻辑关系转化为流程图。mermaid-tools - 增量摘要:对于每日更新的文档(如项目日志),只摘要相比昨天的“新增变动”。