Skills qwen-image
install
source · Clone the upstream repo
git clone https://github.com/openclaw/skills
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/openclaw/skills "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/awsl1110/aliyun-qwen-image" ~/.claude/skills/openclaw-skills-qwen-image && rm -rf "$T"
OpenClaw · Install into ~/.openclaw/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/openclaw/skills "$T" && mkdir -p ~/.openclaw/skills && cp -r "$T/skills/awsl1110/aliyun-qwen-image" ~/.openclaw/skills/openclaw-skills-qwen-image && rm -rf "$T"
manifest:
skills/awsl1110/aliyun-qwen-image/SKILL.mdsource content
Qwen Image Skill
通过运行捆绑的脚本实现所有图像功能。先检查环境,再运行命令。
第一步:确认地域(必须先问)
各地域的 API Key 与请求地址完全独立,不可混用,否则鉴权失败。
如果用户未说明地域,必须先询问:
您使用的是哪个地域的百炼服务?
- 中国大陆(北京)→
(默认,可省略)--region cn
- 弗吉尼亚(美国,仅 wan26 支持)→
--region us
确认后,在所有命令中统一加上对应的
--region 参数。
第二步:环境检查
# 检查 uv 是否可用 command -v uv # 检查 API Key echo $DASHSCOPE_API_KEY
关于 Python 依赖(dashscope、requests):
脚本顶部包含 PEP 723 内联依赖声明:
# /// script # requires-python = ">=3.9" # dependencies = [ # "dashscope>=1.25.8", # "requests>=2.31.0", # ] # ///
使用
uv run 时,uv 会自动创建隔离虚拟环境并安装上述依赖,无需手动操作。
如果
不存在,先安装 uv:uv
pip install uv --break-system-packages
如果无法使用
,可改用 pip 手动安装依赖后直接运行脚本:uv
pip install "dashscope>=1.25.8" "requests>=2.31.0" python $SKILL_SCRIPT text2img --prompt "..."
如果 API Key 为空:提示用户设置对应地域的 API Key:
- 中国大陆:
(百炼北京控制台获取)export DASHSCOPE_API_KEY="sk-xxx" - 海外:
(Model Studio 新加坡控制台获取)export DASHSCOPE_API_KEY="sk-xxx"
第三步:脚本路径
SKILL_SCRIPT="<skill安装路径>/scripts/run.py"
安装位置因环境而异,请根据实际情况替换,例如:
~/.claude/skills/qwen-image/scripts/run.py~/.codex/skills/qwen-image/scripts/run.py/path/to/skills/qwen-image/scripts/run.py
地域与功能限制
| 子命令 | 模型 | 中国大陆(cn) | 海外/新加坡(intl) | 弗吉尼亚(us) |
|---|---|---|---|---|
| qwen-image-2.0-pro(默认)/ qwen-image-2.0 / qwen-image-max / qwen-image-plus / qwen-image | ✅ | ✅ | ❌ |
| qwen-image-2.0-pro(默认)/ qwen-image-2.0 / qwen-image-edit-max / qwen-image-edit-plus / qwen-image-edit | ✅ | ✅ | ❌ |
| wan2.6-image(默认)/ wan2.6-t2i | ✅ | ✅ | ✅ |
模型选择指南
text2img 可用模型
| 模型 | 特点 | 多图输出 |
|---|---|---|
(默认) | 旗舰,文字渲染/真实质感/语义遵循最强 | 1-6 张 |
| 加速版,兼顾效果与速度 | 1-6 张 |
| Max 系列,真实感更强,AI 痕迹更低 | 固定 1 张 |
| Plus 系列,多样化艺术风格与文字渲染 | 固定 1 张 |
| 基础版(与 qwen-image-plus 能力相同) | 固定 1 张 |
edit 可用模型
| 模型 | 特点 | 多图输出 |
|---|---|---|
(默认) | 旗舰,文字渲染/真实质感/语义遵循最强 | 1-6 张 |
| 加速版,兼顾效果与速度 | 1-6 张 |
| Max 系列,工业设计/几何推理/角色一致性强 | 1-6 张 |
| Plus 系列,多图输出与自定义分辨率 | 1-6 张 |
| 基础版,单图编辑和多图融合 | 固定 1 张 |
wan26 可用模型
| 模型 | 用途 | 输入图 |
|---|---|---|
(默认) | 图像编辑(1-4张参考图)或图文混排/文生图 | 编辑:1-4 张;混排:0-1 张 |
| 纯文生图(图文混排输出) | 不支持 |
- 有
(1-4张)→ 图像编辑模式(--images
专用)wan2.6-image - 无
或--images
(最多1张图)→ 图文混排/文生图模式(流式输出文字+图片)--interleave
+ 超过1张图 → 报错(混排模式最多1张输入图)--interleave
命令速查
默认地域为中国大陆(
),可省略。海外用户需显式添加--region cn或--region intl。--region us
千问文生图
uv run $SKILL_SCRIPT text2img \ --prompt "冬日雪景中的古典中式庭院,飞檐斗拱" \ --model qwen-image-2.0-pro \ --size 2048*2048 \ --n 1 \ --region cn \ --output-dir .
千问图像编辑(1-3 张输入图)
uv run $SKILL_SCRIPT edit \ --prompt "将图中女孩的服装改为红色旗袍" \ --images "https://example.com/photo.jpg" \ --model qwen-image-2.0-pro \ --size 1024*1024 \ --n 1 \ --region cn \ --output-dir .
多图融合示例(最多3张):
uv run $SKILL_SCRIPT edit \ --prompt "使用图1的城市作为底图,将图2的卡通形象放置在建筑物周围" \ --images "https://example.com/city.jpg" "https://example.com/character.png" \ --model qwen-image-2.0-pro \ --region cn \ --output-dir .
万相2.6图像编辑(wan2.6-image,1-4张输入图)
uv run $SKILL_SCRIPT wan26 \ --prompt "参考图1的风格和图2的背景,生成番茄炒蛋" \ --images "https://example.com/style.png" "https://example.com/bg.jpg" \ --model wan2.6-image \ --n 1 \ --size 1K \ --region cn \ --output-dir .
万相2.6文生图/图文混排(wan2.6-image 无图 或 wan2.6-t2i)
uv run $SKILL_SCRIPT wan26 \ --prompt "给我一个3张图的辣椒炒肉教程" \ --model wan2.6-t2i \ --max-images 3 \ --size 1280*1280 \ --region cn \ --output-dir .
常用参数参考
| 参数 | 说明 |
|---|---|
| 中国大陆(北京,默认值) |
| 海外/新加坡 |
| 弗吉尼亚(仅 wan26) |
| 生成数量(text2img/edit: 2.0系列1-6张,其余固定1;wan26编辑模式1-4) |
| wan26 图文混排模式最多生成图片数(1-5) |
| 保存目录(默认当前目录) |
| API Key(可用环境变量代替) |
| 禁用提示词自动扩写 |
| 随机数种子(text2img / edit / wan26) |
| 添加水印(text2img: Qwen-Image;wan26: AI生成) |
常用 size 值
text2img / edit / wan26 图像编辑(总像素 512×512~2048×2048)
| size | 比例 |
|---|---|
(text2img 默认) | 1:1 |
| 16:9 横版 |
| 9:16 竖版 |
wan26 图像编辑 size 档位
| size | 说明 |
|---|---|
(默认) | 总像素约 1280×1280,比例跟随最后一张输入图 |
| 总像素约 2048×2048,比例跟随最后一张输入图 |
wan2.6-t2i 文生图(总像素 1280×1280~1440×1440)
| size | 比例 |
|---|---|
(默认) | 1:1 |
| 9:16 竖版 |
| 16:9 横版 |
| 1:1 高清 |
wan2.6-image 图文混排/文生图(无图输入,总像素 768×768~1280×1280)
| size | 比例 |
|---|---|
| 1:1 |
| 9:16 竖版 |
| 16:9 横版 |
提示词指南
基础公式
提示词 = 主体 + 场景 + 风格
示例:
25岁中国女孩,圆脸,优雅的民族服装,室外,电影级光照,半身特写,商业摄影
进阶公式
提示词 = 主体描述 + 场景描述 + 风格 + 镜头语言 + 氛围词 + 细节修饰
示例:
由羊毛毡制成的大熊猫,穿着蓝色警服马甲,大步奔跑,动物王国城市街道,夜晚明亮,摄影镜头,居中构图,毛毡风格,皮克斯风格,逆光,4K
常用词典速查
| 维度 | 常用词 |
|---|---|
| 景别 | 特写、近景、中景、远景 |
| 视角 | 平视、俯视、仰视、航拍 |
| 镜头 | 微距、超广角、长焦、鱼眼 |
| 风格 | 写实、水彩、水墨、工笔、3D卡通、粘土、折纸、超现实、废土风 |
| 光线 | 自然光、逆光、霓虹灯、氛围光、电影级光照、丁达尔效应 |
反向提示词推荐
低分辨率,低画质,肢体畸形,手指畸形,画面过饱和,蜡像感,人脸无细节,过度光滑,画面具有AI感,构图混乱,文字模糊,扭曲
注意事项
- 生成图片 URL 有效期 24 小时,脚本已自动下载保存到本地
不支持wan2.6-t2i
输入,仅用于文生图--images- wan26 图文混排模式会同时保存文字内容(
)和图片*-wan26-text.txt
故障排查
| 错误 | 解决方案 |
|---|---|
| |
| 检查模型名拼写,确认地域支持该模型 |
| API Key 无对应模型权限,或免费额度耗尽 |
| 重试或增加等待时间 |