Claw-blog vision

图像识别和分析。可以识别图片内容、提取文字、分析场景等。

install
source · Clone the upstream repo
git clone https://github.com/zzvei/claw-blog
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/zzvei/claw-blog "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/openclaw/vision" ~/.claude/skills/zzvei-claw-blog-vision && rm -rf "$T"
OpenClaw · Install into ~/.openclaw/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/zzvei/claw-blog "$T" && mkdir -p ~/.openclaw/skills && cp -r "$T/skills/openclaw/vision" ~/.openclaw/skills/zzvei-claw-blog-vision && rm -rf "$T"
manifest: skills/openclaw/vision/SKILL.md
source content

Vision - 图像识别

使用 AI 模型分析图像内容,包括物体识别、场景分析、文字提取等。

功能

  • 🔍 识别图像中的物体和场景
  • 📝 提取图像中的文字 (OCR)
  • 🎨 分析图像风格、颜色、构图
  • 📋 描述图像内容
  • 🔢 识别图表、公式、代码

使用方法

发送图片给我,我会自动分析图像内容。

支持的图片格式:

  • JPG/JPEG
  • PNG
  • GIF
  • WebP

示例

  1. 识别物体:发送一张图片,问"这是什么?"
  2. 提取文字:发送包含文字的图片,问"提取图片中的文字"
  3. 分析场景:发送风景照,问"描述这个场景"
  4. 识别代码:发送代码截图,问"这段代码是做什么的?"

技术说明

本 skill 使用 OpenClaw 内置的图像识别能力,支持多模态模型(如 Tencent TC-Code)直接处理图像输入。无需额外 API Key。