install
source · Clone the upstream repo
git clone https://github.com/chatfire-AI/huobao-drama
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/chatfire-AI/huobao-drama "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/storyboard_breaker" ~/.claude/skills/chatfire-ai-huobao-drama-storyboard-breaker && rm -rf "$T"
manifest:
skills/storyboard_breaker/SKILL.mdsource content
分镜拆解指南
拆解原则
每个镜头聚焦单一动作,描述要详尽具体。每个镜头时长 10-15 秒。
镜头要素
- 镜头标题:3-5字概括核心内容(如"噩梦惊醒")
- 时间:具体时分 + 光线描述
- 地点:场景完整描述 + 空间布局 + 环境细节
- 景别:远景/全景/中景/近景/特写
- 角度:平视/仰视/俯视/侧面/背面
- 运镜:固定/推镜/拉镜/摇镜/跟镜/移镜
- 动作:谁 + 具体怎么做 + 肢体细节 + 表情
- 对话:该镜头的完整对话
- 画面结果:动作的即时后果 + 视觉细节
- 氛围:光线 + 色调 + 声音 + 整体氛围
- 时长:每个镜头 10-15 秒
- 静态画面提示词:
,用于首帧/尾帧/镜头图片生成image_prompt - 视频提示词:
,按 3 秒分段的视频生成描述(必填)video_prompt - 配乐提示词:
,描述该镜头适合的配乐风格bgm_prompt - 音效提示词:
,描述该镜头关键环境音/动作音sound_effect - 场景关联:若能匹配已有场景,必须填写
scene_id - 角色关联:填写
,绑定当前镜头涉及的 0 到多个角色character_ids
视频提示词格式
每个镜头必须包含
video_prompt 字段,用于驱动 AI 视频生成:
0-3秒:<location>咖啡厅</location>,近景,<role>小明</role>低头看手机,表情焦虑。 <n>3-6秒:<location>咖啡厅</location>,全景,门铃响,<role>小红</role>推门走入。 <n>6-9秒:<location>咖啡厅</location>,中景,<role>小红</role>微笑走向小明,坐下。
标签说明:
— 场景标记<location>地点</location>
— 角色标记<role>角色名</role>
— 画外音/旁白标记<voice>角色名</voice>
— 时间段分隔符<n>
使用步骤
- 调用
读取剧本、角色、场景、已有分镜摘要read_storyboard_context - 先基于剧本完成镜头拆解,确保总时长和叙事连续性合理
- 为每个镜头补全完整字段:
title / shot_type / angle / movement / location / time / character_ids / action / dialogue / description / result / atmosphere / image_prompt / video_prompt / bgm_prompt / sound_effect / duration / scene_id - 调用
一次性保存完整分镜save_storyboards - 如需调整,调用
修改具体镜头update_storyboard
场景关联规则
- 优先使用
返回的read_storyboard_contextscenes
可明确匹配时,必须回填正确location + timescene_id- 不要凭空生成不存在的场景 ID
- 如果剧本内容明显落在已有场景中,不要重复创造新场景描述
角色绑定规则
必须从character_ids
返回的角色列表中选择read_storyboard_context- 一个镜头可以没有角色,也可以绑定多个角色
- 只要镜头里有明确出场、被看见、发生动作或说话的角色,都应绑定进去
- 纯环境镜头、空镜头、物件镜头可以传空数组
质量要求
要适合人读,description
要适合模型生成,二者不要互相替代video_prompt
要突出单帧构图、角色外观、环境和光线image_prompt
要突出时间推进、动作变化、镜头语言video_prompt
和bgm_prompt
用简洁短语即可,但不能空泛到只有“紧张”“悲伤”sound_effect- 若存在旁白,统一写入
,格式为dialogue旁白:内容