Skills image-prompt-generator
基于五层拆解法的AI图片提示词生成器。将模糊的创意想法转化为结构严谨、可执行的图像生成规格书,支持多种风格预设和目标工具适配。
install
source · Clone the upstream repo
git clone https://github.com/openclaw/skills
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/openclaw/skills "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/349840432m-dev/image-prompt-generator" ~/.claude/skills/openclaw-skills-image-prompt-generator && rm -rf "$T"
OpenClaw · Install into ~/.openclaw/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/openclaw/skills "$T" && mkdir -p ~/.openclaw/skills && cp -r "$T/skills/349840432m-dev/image-prompt-generator" ~/.openclaw/skills/openclaw-skills-image-prompt-generator && rm -rf "$T"
manifest:
skills/349840432m-dev/image-prompt-generator/SKILL.mdsource content
Image Prompt Generator - 图片提示词生成器
基于"五层拆解法",将创意想法转化为专业的 AI 图像生成规格书,并输出可直接使用的多工具提示词。
核心功能
五层拆解法(画面先行)
- 画面介绍 → 用自然语言概括画面主题、场景、主体
- 整体基调 → 风格、氛围
- 质感材质 → 介质感、工艺、肌理
- 笔触细节 → 线条、色彩分布逻辑
- 构图规则 → 版式、布局、视觉动线
- 文字系统(按需) → 仅在画面含文字时输出
目标工具适配
- Midjourney — 结构化关键词 + 参数(--ar, --s, --v 等)
- DALL-E — 纯自然语言描述
- Stable Diffusion — 正向/反向提示词分离
风格预设
- 🖍️ 童趣涂鸦 - 儿童手绘涂鸦风格,彩色铅笔质感
- 📐 极简现代 - 极简主义,现代设计感,大量留白
- 🎞️ 复古胶片 - 复古胶片风格,1970s色调,颗粒感
- 🌸 日系插画 - 日系小清新插画,柔和色彩,扁平风
- ⚙️ 赛博朋克 - 赛博朋克风格,霓虹色彩,科技感
- 📚 学术信息图 - 专业信息图,学术风格,数据可视化
使用方法
方式1:快速生成
用户: 生成图片提示词:一张介绍深度学习的信息图,面向初学者 系统: 基于五层拆解法生成完整的提示词规格书
方式2:选择风格预设
用户: 用童趣涂鸦风格生成:一只可爱的小猫在看书 系统: 生成带有彩色铅笔质感的儿童风格提示词
方式3:自定义详细描述
用户: 生成提示词:[详细描述需求] 系统: 根据描述智能分析并生成五层规格书
输出格式
生成的提示词包含以下模块:
# 🎨 图片提示词 ## 画面介绍 [2-3句自然语言描述画面整体] ## 整体基调 - 风格:[具体风格] - 氛围:[情绪词] ## 质感材质 - 介质感:[描述] ## 笔触细节 - 线条:[特征] - 色彩:[主色调、辅助色、点缀色] ## 构图规则 - 版式:[比例] - 布局:[分布逻辑、视觉动线] ## 文字系统(仅在画面含文字时输出) - 字体感:[风格] - 层级:[视觉差异] ## 参照物 - 风格参照:[具体参照 + 参照理由] - 反向排除:[不想要的风格] --- ## 💡 可执行提示词 **通用中文提示词:** [完整中文描述,适用于国产AI绘图工具] **Midjourney:** [结构化英文关键词 + 参数] **DALL-E:** [纯自然语言英文描述] **Stable Diffusion:** prompt: [正向提示词] negative prompt: [反向提示词]
技术实现
前端界面
- React 单页应用
- 支持风格预设快速选择
- 目标生成工具选择(Midjourney / DALL-E / SD / 全部)
- 实时字数统计
- Markdown 渲染结果
- 一键复制功能
AI 模型
- 通过 OpenClaw Gateway 本地端点调用(
)/v1/chat/completions - 使用 OpenClaw 配置的默认模型,无需额外配置 API 密钥
- SYSTEM_PROMPT 包含完整的五层拆解法方法论
- 自动将模糊需求转化为具体视觉规格
触发指令
| 指令 | 说明 |
|---|---|
| 基础触发指令 |
| 简写形式 |
| 通用形式 |
| 带风格预设 |
文件位置
- 技能目录:
skills/image-prompt-generator/ - 前端代码:
skills/image-prompt-generator/app/ - 入口文件:
skills/image-prompt-generator/app/App.jsx
使用示例
示例 1:信息图
输入:一张介绍「光合作用原理」的信息图,面向中学生,风格清新易懂 输出:五层拆解法生成的完整提示词,包含日系插画风格、柔和色彩、扁平化设计等
示例 2:插画
输入:用赛博朋克风格生成:未来城市的夜景 输出:霓虹色彩、科技感、暗黑背景的详细规格书
示例 3:儿童内容
输入:用童趣涂鸦风格生成:小动物们在森林里开派对 输出:彩色铅笔质感、活泼热闹、手绘风格的提示词
注意事项
- 描述越详细,生成越精准 - 提供目标受众、使用场景、情绪基调等信息
- 善用风格预设 - 快速锁定整体方向,再微调细节
- 选择目标工具 - 不同工具的提示词语法差异很大,选对工具获得最佳结果
- 参照物很重要 - 可以提供喜欢的风格参考或不想要的风格排除
可执行提示词使用
生成结果中的"可执行提示词"根据目标工具输出对应格式:
- Midjourney — 直接复制到 /imagine 命令
- DALL-E — 直接粘贴到 ChatGPT 或 DALL-E API
- Stable Diffusion — 分别复制 prompt 和 negative prompt
External Endpoints
| 端点 | 说明 | 发送的数据 |
|---|---|---|
| OpenClaw Gateway 本地端点 | 用户输入的图片描述需求 + 系统提示词 |
所有请求仅发往本地 OpenClaw Gateway,不直接连接任何外部 API。实际的模型调用由 Gateway 根据你的
openclaw.json 配置路由。
Security & Privacy
- 所有 AI 模型调用通过本地 OpenClaw Gateway 中转,不直接暴露 API 密钥
- 用户输入的图片描述会作为 prompt 发送给 Gateway 配置的模型
- 不存储任何用户数据,所有处理在本地完成
- 无持久化操作,无文件写入,无后台进程
Trust Statement
本技能通过 OpenClaw Gateway 调用 AI 模型生成图片提示词。你的输入内容会发送到 Gateway 配置的模型提供商(取决于你的
openclaw.json 配置)。请确保你信任所配置的模型提供商后再使用。