OpenClaw-hot-skills-zh browser-use-zh
自动化浏览器交互,用于网页测试、表单填写、截图和数据提取。当用户需要导航网站、与网页交互、填写表单、截图或从网页提取信息时使用此技能。
install
source · Clone the upstream repo
git clone https://github.com/L-LesterYu/OpenClaw-hot-skills-zh
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/L-LesterYu/OpenClaw-hot-skills-zh "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/browser-use-zh" ~/.claude/skills/l-lesteryu-openclaw-hot-skills-zh-browser-use-zh && rm -rf "$T"
OpenClaw · Install into ~/.openclaw/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/L-LesterYu/OpenClaw-hot-skills-zh "$T" && mkdir -p ~/.openclaw/skills && cp -r "$T/skills/browser-use-zh" ~/.openclaw/skills/l-lesteryu-openclaw-hot-skills-zh-browser-use-zh && rm -rf "$T"
manifest:
skills/browser-use-zh/SKILL.mdsource content
使用 browser-use CLI 进行浏览器自动化
browser-use 命令提供快速、持久的浏览器自动化功能。后台守护进程在命令之间保持浏览器打开,每次调用的延迟约为 50ms。
前置条件
browser-use doctor # 验证安装
安装详情请参见 https://github.com/browser-use/browser-use/blob/main/browser_use/skill_cli/README.md
核心工作流程
- 导航:
— 如需要则启动浏览器browser-use open <url> - 检查:
— 返回可点击元素及其索引browser-use state - 交互: 使用 state 返回的索引(
、browser-use click 5
)browser-use input 3 "text" - 验证:
或browser-use state
确认结果browser-use screenshot - 重复: 浏览器在命令之间保持打开
- 清理: 完成后使用
browser-use close
浏览器模式
browser-use open <url> # 默认:无头 Chromium browser-use --headed open <url> # 可见窗口 browser-use --profile "Default" open <url> # 使用真实 Chrome 的 Default 配置文件(已有登录/Cookie) browser-use --profile "Profile 1" open <url> # 使用指定名称的 Chrome 配置文件 browser-use --connect open <url> # 通过 CDP 自动发现运行中的 Chrome browser-use --cdp-url ws://localhost:9222/... open <url> # 通过 CDP URL 连接
--connect、--cdp-url 和 --profile 互斥。
命令
# 导航 browser-use open <url> # 导航到 URL browser-use back # 后退 browser-use scroll down # 向下滚动(--amount N 指定像素数) browser-use scroll up # 向上滚动 browser-use switch <tab> # 按索引切换标签页 browser-use close-tab [tab] # 关闭标签页(不指定则关闭当前标签页) # 页面状态 — 始终先运行 state 获取元素索引 browser-use state # URL、标题、可点击元素及索引 browser-use screenshot [path.png] # 截图(不指定路径返回 base64,--full 截取整页) # 交互 — 使用 state 返回的索引 browser-use click <index> # 按索引点击元素 browser-use click <x> <y> # 按像素坐标点击 browser-use type "text" # 在聚焦元素中输入文本 browser-use input <index> "text" # 点击元素后输入文本 browser-use keys "Enter" # 发送键盘按键(也支持 "Control+a" 等) browser-use select <index> "option" # 选择下拉菜单选项 browser-use upload <index> <path> # 上传文件到文件输入框 browser-use hover <index> # 悬停在元素上 browser-use dblclick <index> # 双击元素 browser-use rightclick <index> # 右键点击元素 # 数据提取 browser-use eval "js code" # 执行 JavaScript,返回结果 browser-use get title # 页面标题 browser-use get html [--selector "h1"] # 页面 HTML(或限定到选择器范围) browser-use get text <index> # 元素文本内容 browser-use get value <index> # 输入框/文本域的值 browser-use get attributes <index> # 元素属性 browser-use get bbox <index> # 边界框(x, y, width, height) # 等待 browser-use wait selector "css" # 等待元素(--state visible|hidden|attached|detached,--timeout 毫秒) browser-use wait text "text" # 等待文本出现 # Cookie 管理 browser-use cookies get [--url <url>] # 获取 Cookie(可按 URL 过滤) browser-use cookies set <name> <value> # 设置 Cookie(--domain, --secure, --http-only, --same-site, --expires) browser-use cookies clear [--url <url>] # 清除 Cookie browser-use cookies export <file> # 导出为 JSON browser-use cookies import <file> # 从 JSON 导入 # Python — 持久会话,可访问浏览器 browser-use python "code" # 执行 Python(变量在调用之间持久保存) browser-use python --file script.py # 运行文件 browser-use python --vars # 显示已定义的变量 browser-use python --reset # 清除命名空间 # 会话管理 browser-use close # 关闭浏览器并停止守护进程 browser-use sessions # 列出活跃会话 browser-use close --all # 关闭所有会话
Python 的
browser 对象提供:browser.url、browser.title、browser.html、browser.goto(url)、browser.back()、browser.click(index)、browser.type(text)、browser.input(index, text)、browser.keys(keys)、browser.upload(index, path)、browser.screenshot(path)、browser.scroll(direction, amount)、browser.wait(seconds)。
云 API
browser-use cloud connect # 配置云浏览器并连接 browser-use cloud connect --timeout 120 --proxy-country US # 带选项 browser-use cloud login <api-key> # 保存 API Key(或设置 BROWSER_USE_API_KEY) browser-use cloud logout # 移除 API Key browser-use cloud v2 GET /browsers # REST 透传(v2 或 v3) browser-use cloud v2 POST /tasks '{"task":"...","url":"..."}' browser-use cloud v2 poll <task-id> # 轮询任务直到完成 browser-use cloud v2 --help # 显示 API 端点
cloud connect 会配置一个云浏览器,通过 CDP 连接,并打印实时 URL。browser-use close 会断开连接并停止云浏览器。
隧道
browser-use tunnel <port> # 启动 Cloudflare 隧道(幂等操作) browser-use tunnel list # 显示活跃隧道 browser-use tunnel stop <port> # 停止隧道 browser-use tunnel stop --all # 停止所有隧道
配置文件管理
browser-use profile list # 列出检测到的浏览器和配置文件 browser-use profile sync --all # 同步配置文件到云端 browser-use profile update # 下载/更新 profile-use 二进制文件
命令链接
命令可以使用
&& 链接。浏览器通过守护进程持久存在,因此链接是安全高效的。
browser-use open https://example.com && browser-use state browser-use input 5 "user@example.com" && browser-use input 6 "password" && browser-use click 7
当不需要中间输出时可以链接命令。当需要解析
state 来发现索引时,应分别运行。
常见工作流程
需要登录的浏览
当任务需要访问需要认证的网站(Gmail、GitHub、内部工具)时,使用 Chrome 配置文件:
browser-use profile list # 查看可用配置文件 # 询问用户要使用哪个配置文件,然后: browser-use --profile "Default" open https://github.com # 已登录状态
连接到已有的 Chrome
browser-use --connect open https://example.com # 自动发现 Chrome 的 CDP 端点
需要启用了远程调试的 Chrome。默认探测 9222/9229 端口。
暴露本地开发服务器
browser-use tunnel 3000 # → https://abc.trycloudflare.com browser-use open https://abc.trycloudflare.com # 浏览隧道
全局选项
| 选项 | 说明 |
|---|---|
| 显示浏览器窗口 |
| 使用真实 Chrome(单独 使用 "Default") |
| 通过 CDP 自动发现运行中的 Chrome |
| 通过 CDP URL 连接( 或 ) |
| 指定命名会话(默认:"default") |
| 输出为 JSON 格式 |
| 通过 stdin/stdout 作为 MCP 服务器运行 |
提示
- 始终先运行
以查看可用元素及其索引state - 使用
调试 以查看浏览器在做什么--headed - 会话持久存在 — 浏览器在命令之间保持打开
- CLI 别名:
、bu
和browser
都可以使用browseruse
故障排除
- 浏览器无法启动? 先
再browser-use closebrowser-use --headed open <url> - 找不到元素? 先
再browser-use scroll downbrowser-use state - 运行诊断:
browser-use doctor
清理
browser-use close # 关闭浏览器会话 browser-use tunnel stop --all # 停止隧道(如果有)