Skills zhuoran-video-selfie

install
source · Clone the upstream repo
git clone https://github.com/wulaosiji/skills
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/wulaosiji/skills "$T" && mkdir -p ~/.claude/skills && cp -r "$T/zhuoran-video-selfie" ~/.claude/skills/wulaosiji-skills-zhuoran-video-selfie && rm -rf "$T"
manifest: zhuoran-video-selfie/SKILL.md
source content

卓然视频自拍技能 (Zhuoran Video Selfie)

基于垫图使用 WaveSpeed AI 生成"活人感"自拍视频,支持自然微动作(呼吸、眨眼等)。

When to Use

适用于以下场景:

  • 需要生成卓然角色的动态自拍视频
  • 为照片添加生命力和动态感
  • 展示角色在场景中的自然状态
  • 需要微动作增强真实感
  • 用户索要视频或动态展示

Do NOT use this skill if:

  • 只需要静态照片(使用 zhuoran-selfie 更高效)
  • 需要大幅度动作场景(如跳舞、走路)
  • 需要多人同框视频
  • 需要复杂的镜头运动
  • 网络条件极差(视频文件较大)

触发关键词 / Trigger Phrases:

  • 卓然视频 / zhuoran video
  • AI视频生成 / AI video generation
  • 动态自拍 / dynamic selfie
  • 活人感视频 / living video
  • 视频自拍 / video selfie
  • 角色视频 / character video
  • 生成视频 / generate video
  • 自拍视频 / selfie video

Workflow

快速开始

# 生成办公室自拍视频
openclaw skill run zhuoran-video-selfie office

# 指定场景并发送
openclaw skill run zhuoran-video-selfie cafe --target ou_xxx

# 直接调用脚本
./skills/zhuoran-video-selfie/scripts/zhuoran-video-selfie.sh westlake

命令行参数

./skills/zhuoran-video-selfie/scripts/zhuoran-video-selfie.sh <scene> \
  --duration 5 \
  --target <user_id> \
  --caption "配文" \
  --output /path/to/output.mp4

垫图配置

重要: 本 skill 需要垫图文件

assets/zhuoran_portrait_base.png

首次使用前请复制垫图:

# 从中央 assets 目录复制
cp ~/.openclaw/workspace/assets/avatars/zhuoran_portrait_base.png \
   ~/.openclaw/workspace/skills/zhuoran-video-selfie/assets/

或者创建软链接:

ln -s ~/.openclaw/workspace/assets/avatars/zhuoran_portrait_base.png \
      ~/.openclaw/workspace/skills/zhuoran-video-selfie/assets/zhuoran_portrait_base.png

垫图要求:

  • 格式: PNG
  • 内容: 真人照片(非卡通形象)
  • 尺寸: 建议 512x512 或更高
  • 背景: 简洁,便于场景融合

API 调用流程

  1. 上传参考图 → WaveSpeed AI 媒体上传
  2. 提交视频生成任务
    POST /api/v3/x-ai/video/generate
    • 模型:
      bytedance/seedance-v1-pro-i2v-720p
    • 输入: 垫图 URL + 提示词
    • 参数: duration=5, aspect_ratio="1:1"
  3. 轮询结果
    GET /api/v3/predictions/{task_id}/result
  4. 下载视频 → 保存到临时目录
  5. 飞书发送(如指定 target)→ 上传获取 file_key → 发送消息

Python API

from skills.zhuoran_video_selfie.zhuoran_video_selfie import generate_video

# 生成视频
video_path = generate_video("office", duration=5)

# 生成并发送
video_path = generate_video("cafe", duration=5, target="ou_xxx")

Available Scenes

场景代码推荐时长提示词重点
办公室
office
5秒自然工作姿态、微动作
咖啡厅
cafe
5秒轻松氛围、微笑
西湖
westlake
5秒风景互动、微风
健身房
gym
3秒运动姿态、呼吸感

Guardrails

禁用场景

以下场景已被禁用(高风险):

  • mirror_selfie
    - 镜子反射,逻辑破绽明显
  • dancing
    - 大幅度动作,肢体一致性难保证
  • walking
    - 移动场景,背景与人物同步难
  • group
    - 多人入镜,复杂度太高
  • swimming
    - 水下场景,物理逻辑复杂

风险控制原则

  • 时长限制: 最长5秒,避免暴露不自然动作
  • 场景限制: 仅使用预定义的安全场景
  • 动作限制: 微动作优先(呼吸、眨眼),避免大幅度运动
  • 频率限制: 视频比照片使用频率更低
  • 垫图质量: 确保垫图清晰,面部特征明确

"活人感"提示词系统

核心原则:

  1. 自然微动 - 呼吸、眨眼、头发飘动
  2. 避免完美 - 保留皮肤纹理、自然瑕疵
  3. 场景真实 - 自拍角度、环境互动

基础模板

{scene_description}, subtle breathing motion and natural posture shift, 
gentle hair swaying in {environment} breeze, soft smile with micro-expressions, 
occasional natural blink and eye movement, {interaction}, 
authentic selfie perspective with slight arm visible, 
natural skin texture with realistic details, 4k cinematic quality, 
shallow depth of field, lifelike atmosphere

场景变体:

office:

young professional woman at modern office desk, subtle breathing motion...
working on laptop, occasional glance up from screen, natural office lighting...

cafe:

young woman at cozy cafe, subtle breathing motion...
holding coffee cup, gentle steam rising, warm ambient lighting...

备用模型方案(A/B 机制)

优先级模型端点状态说明
A方案Seedance v1 pro 720p
/bytedance/seedance-v1-pro-i2v-720p
✅ 可用首选,质量好
B方案VidU Q3 Turbo
/vidu/q3-turbo/image-to-video
✅ 可用备用,稳定

飞书视频发送

⚠️ 重要: 视频不能直接通过 OpenClaw

message
工具的
filePath
发送,否则会显示为文件附件无法播放。

正确方式

python3 skills/feishu-video-sender/feishu_video_sender.py \
  /tmp/zhuoran_office_video.mp4 \
  ou_5f3a4a920dc39a8d1835fd0085afef50

技术要点

  • 必须使用
    msg_type: "media"
    而非
    "file"
  • 必须同时提供
    file_key
    (视频)和
    image_key
    (封面)

Environment Requirements

  • WAVESPEED_KEY
    : WaveSpeed AI API 密钥
  • FEISHU_APP_ID
    : 飞书 App ID(用于发送)
  • FEISHU_APP_SECRET
    : 飞书 App Secret
  • Python 3.8+
  • 依赖: requests

Output

  • 格式: MP4 (H.264)
  • 分辨率: 720p
  • 比例: 1:1 (正方形,适合自拍)
  • 时长: 3-5 秒
  • 默认保存:
    /tmp/zhuoran_{场景}_video.mp4

File Structure

skills/zhuoran-video-selfie/
├── SKILL.md                    # 本文档
├── zhuoran_video_selfie.py     # 核心逻辑
└── scripts/
    ├── zhuoran-video-selfie.py # Python CLI 入口
    └── zhuoran-video-selfie.sh # Bash 包装脚本(OpenClaw 入口)

Related Skills

技能关系说明
zhuoran-selfie照片版同一角色的静态照片生成
clawra-video-selfie对应角色Clawra角色的视频生成
video-generation通用视频更通用的视频生成和超分功能
voice-clone配套可为视频添加克隆语音

About UniqueClub

Part of UniqueClub toolkit - AI-powered creative tools for dynamic video generation. Learn more: https://uniqueclub.ai


注意:本技能仅供非凡产研内部使用