Openclaw-bestroll-skills voice-note-intake
用户发来语音、录音或音频附件时使用。先吃透转写内容,再用最少追问把真实意图挖出来。
install
source · Clone the upstream repo
git clone https://github.com/evan966890/openclaw-bestroll-skills
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/evan966890/openclaw-bestroll-skills "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/voice-note-intake" ~/.claude/skills/evan966890-openclaw-bestroll-skills-voice-note-intake && rm -rf "$T"
OpenClaw · Install into ~/.openclaw/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/evan966890/openclaw-bestroll-skills "$T" && mkdir -p ~/.openclaw/skills && cp -r "$T/skills/voice-note-intake" ~/.openclaw/skills/evan966890-openclaw-bestroll-skills-voice-note-intake && rm -rf "$T"
manifest:
skills/voice-note-intake/SKILL.mdsource content
Voice Note Intake
处理语音输入,不把“字少”误判成“信息少”。
Quick Start
- 用户发来语音、录音、会议音频、口述 memo,优先使用这个 skill。
- 如果 transcript 已经注入上下文,先基于 transcript 工作,不要求用户重复打字。
- 如果 transcript 不完整,先猜测意图并给 2-4 个短选项,让用户用数字 / 字母 / 短词确认。
适用场景
- 用户发语音消息
- 用户发音频附件
- 用户说“我懒得打字”“听我说一下”
- transcript 很长,需要先压缩成任务意图
Trigger Signals
- “我发你个语音”
- “你听一下”
- “这段录音帮我整理”
- “我口述一下”
工作流
- 先读取音频 transcript,不要求用户重述。
- 用 1 句话复述你听到的核心意思。
- 判断这是哪一类诉求:
- 要答案
- 要整理
- 要提醒/跟进
- 要归档/记录
- 如果有歧义,优先给猜测选项,不要丢开放题。
- 用户只回短词时,AI 负责补全结构并继续推进。
输出规则
- 第一轮最多 4 行
- 先说“我听到的是……”
- 再给
选项或一个最小确认问题1/2/3 - 不要要求用户“详细描述一下”
- 不要机械复述大段 transcript
输出形状
我先按语音理解成这样: - [一句话核心意思] 你更想让我做哪种: 1. 直接给结论 2. 帮你整理成清单 3. 记下来,后面再用 回 1 / 2 / 3 就行。
Deepen When Needed
- 歧义较大时,读 references/triage-patterns.md
- 需要稳定回复版式时,读 references/output-template.md