Claw-blog vision

图像识别和分析。可以识别图片内容、提取文字、分析场景等。

install

source · Clone the upstream repo

git clone https://github.com/zzvei/claw-blog

Claude Code · Install into ~/.claude/skills/

T=$(mktemp -d) && git clone --depth=1 https://github.com/zzvei/claw-blog "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/openclaw/vision" ~/.claude/skills/zzvei-claw-blog-vision && rm -rf "$T"

OpenClaw · Install into ~/.openclaw/skills/

T=$(mktemp -d) && git clone --depth=1 https://github.com/zzvei/claw-blog "$T" && mkdir -p ~/.openclaw/skills && cp -r "$T/skills/openclaw/vision" ~/.openclaw/skills/zzvei-claw-blog-vision && rm -rf "$T"

manifest: skills/openclaw/vision/SKILL.md

source content

Vision - 图像识别

使用 AI 模型分析图像内容，包括物体识别、场景分析、文字提取等。

功能

🔍 识别图像中的物体和场景
📝 提取图像中的文字 (OCR)
🎨 分析图像风格、颜色、构图
📋 描述图像内容
🔢 识别图表、公式、代码

使用方法

发送图片给我，我会自动分析图像内容。

支持的图片格式：

JPG/JPEG
PNG
GIF
WebP

示例

识别物体：发送一张图片，问"这是什么？"
提取文字：发送包含文字的图片，问"提取图片中的文字"
分析场景：发送风景照，问"描述这个场景"
识别代码：发送代码截图，问"这段代码是做什么的？"

技术说明

本 skill 使用 OpenClaw 内置的图像识别能力，支持多模态模型（如 Tencent TC-Code）直接处理图像输入。无需额外 API Key。