Skills siliconflow-media
SiliconFlow 多模态服务,支持图片生成(FLUX/Qwen)、视频生成(Wan)、TTS语音合成、ASR语音识别。使用代金券支付。
install
source · Clone the upstream repo
git clone https://github.com/openclaw/skills
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/openclaw/skills "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/axdlee/siliconflow-media" ~/.claude/skills/openclaw-skills-siliconflow-media && rm -rf "$T"
OpenClaw · Install into ~/.openclaw/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/openclaw/skills "$T" && mkdir -p ~/.openclaw/skills && cp -r "$T/skills/axdlee/siliconflow-media" ~/.openclaw/skills/openclaw-skills-siliconflow-media && rm -rf "$T"
manifest:
skills/axdlee/siliconflow-media/SKILL.mdsource content
SiliconFlow 媒体服务
SiliconFlow 提供丰富的 AI 模型服务,支持代金券支付(当前余额 3000+)。
环境变量
- SiliconFlow API KeySILICONFLOW_API_KEY
🎨 图片生成
uv run {baseDir}/scripts/image_gen.py --prompt "描述" --filename "output.png" [--model MODEL]
可用模型:
| 参数 | 模型 | 说明 |
|---|---|---|
(默认) | FLUX.1-schnell | 快速高质量,约 5-10 秒 |
| FLUX.1-dev | 开发版 |
| FLUX.1-pro | 专业版 |
| Qwen/Qwen-Image | 通义图片生成 |
| Qwen/Qwen-Image-Edit | 图片编辑 |
| Qwen/Qwen-Image-Edit-2509 | 最新编辑版 |
示例:
# FLUX 快速生成 uv run {baseDir}/scripts/image_gen.py --prompt "a cute robot assistant" --filename "robot.png" # Qwen 生成 uv run {baseDir}/scripts/image_gen.py --prompt "山水画" --filename "landscape.png" --model qwen
🎬 视频生成
# 文生视频 uv run {baseDir}/scripts/video_gen.py --prompt "描述" --filename "output.mp4" # 图生视频 uv run {baseDir}/scripts/video_gen.py --prompt "描述" --image "input.png" --filename "output.mp4"
模型:
- 文生视频:
Wan-AI/Wan2.2-T2V-A14B - 图生视频:
Wan-AI/Wan2.2-I2V-A14B
⚠️ 视频生成时间较长(约 2-5 分钟)
🎤 语音合成 (TTS)
uv run {baseDir}/scripts/tts.py --text "要合成的文字" --filename "output.mp3" [--model MODEL]
可用模型:
| 参数 | 模型 | 说明 |
|---|---|---|
(默认) | fish-speech-1.5 | Fish Audio 高质量 |
| CosyVoice2-0.5B | 阿里语音克隆 |
| IndexTTS-2 | Index TTS |
| MOSS-TTSD-v0.5 | MOSS 多语言 |
示例:
uv run {baseDir}/scripts/tts.py --text "你好世界" --filename "hello.mp3"
👂 语音识别 (ASR)
uv run {baseDir}/scripts/asr.py --audio "input.mp3" [--model MODEL]
可用模型:
| 参数 | 模型 | 说明 |
|---|---|---|
(默认) | SenseVoiceSmall | 阿里语音识别 |
| TeleSpeechASR | TeleAI 识别 |
示例:
uv run {baseDir}/scripts/asr.py --audio "recording.mp3"
注意事项
- ✅ 费用从代金券扣除,无需额外付费
- ⏱️ 图片生成约 5-10 秒
- ⏱️ 视频生成约 2-5 分钟(耐心等待)
- 📝 所有脚本会打印
行用于自动附加文件MEDIA: