OpenClaw-hot-skills-zh browser-use-zh

自动化浏览器交互,用于网页测试、表单填写、截图和数据提取。当用户需要导航网站、与网页交互、填写表单、截图或从网页提取信息时使用此技能。

install
source · Clone the upstream repo
git clone https://github.com/L-LesterYu/OpenClaw-hot-skills-zh
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/L-LesterYu/OpenClaw-hot-skills-zh "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/browser-use-zh" ~/.claude/skills/l-lesteryu-openclaw-hot-skills-zh-browser-use-zh && rm -rf "$T"
OpenClaw · Install into ~/.openclaw/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/L-LesterYu/OpenClaw-hot-skills-zh "$T" && mkdir -p ~/.openclaw/skills && cp -r "$T/skills/browser-use-zh" ~/.openclaw/skills/l-lesteryu-openclaw-hot-skills-zh-browser-use-zh && rm -rf "$T"
manifest: skills/browser-use-zh/SKILL.md
source content

使用 browser-use CLI 进行浏览器自动化

browser-use
命令提供快速、持久的浏览器自动化功能。后台守护进程在命令之间保持浏览器打开,每次调用的延迟约为 50ms。

前置条件

browser-use doctor    # 验证安装

安装详情请参见 https://github.com/browser-use/browser-use/blob/main/browser_use/skill_cli/README.md

核心工作流程

  1. 导航:
    browser-use open <url>
    — 如需要则启动浏览器
  2. 检查:
    browser-use state
    — 返回可点击元素及其索引
  3. 交互: 使用 state 返回的索引(
    browser-use click 5
    browser-use input 3 "text"
  4. 验证:
    browser-use state
    browser-use screenshot
    确认结果
  5. 重复: 浏览器在命令之间保持打开
  6. 清理: 完成后使用
    browser-use close

浏览器模式

browser-use open <url>                         # 默认:无头 Chromium
browser-use --headed open <url>                # 可见窗口
browser-use --profile "Default" open <url>      # 使用真实 Chrome 的 Default 配置文件(已有登录/Cookie)
browser-use --profile "Profile 1" open <url>   # 使用指定名称的 Chrome 配置文件
browser-use --connect open <url>               # 通过 CDP 自动发现运行中的 Chrome
browser-use --cdp-url ws://localhost:9222/... open <url>  # 通过 CDP URL 连接

--connect
--cdp-url
--profile
互斥。

命令

# 导航
browser-use open <url>                    # 导航到 URL
browser-use back                          # 后退
browser-use scroll down                   # 向下滚动(--amount N 指定像素数)
browser-use scroll up                     # 向上滚动
browser-use switch <tab>                  # 按索引切换标签页
browser-use close-tab [tab]              # 关闭标签页(不指定则关闭当前标签页)

# 页面状态 — 始终先运行 state 获取元素索引
browser-use state                         # URL、标题、可点击元素及索引
browser-use screenshot [path.png]         # 截图(不指定路径返回 base64,--full 截取整页)

# 交互 — 使用 state 返回的索引
browser-use click <index>                 # 按索引点击元素
browser-use click <x> <y>                 # 按像素坐标点击
browser-use type "text"                   # 在聚焦元素中输入文本
browser-use input <index> "text"          # 点击元素后输入文本
browser-use keys "Enter"                  # 发送键盘按键(也支持 "Control+a" 等)
browser-use select <index> "option"       # 选择下拉菜单选项
browser-use upload <index> <path>         # 上传文件到文件输入框
browser-use hover <index>                 # 悬停在元素上
browser-use dblclick <index>              # 双击元素
browser-use rightclick <index>            # 右键点击元素

# 数据提取
browser-use eval "js code"                # 执行 JavaScript,返回结果
browser-use get title                     # 页面标题
browser-use get html [--selector "h1"]    # 页面 HTML(或限定到选择器范围)
browser-use get text <index>              # 元素文本内容
browser-use get value <index>             # 输入框/文本域的值
browser-use get attributes <index>        # 元素属性
browser-use get bbox <index>              # 边界框(x, y, width, height)

# 等待
browser-use wait selector "css"           # 等待元素(--state visible|hidden|attached|detached,--timeout 毫秒)
browser-use wait text "text"              # 等待文本出现

# Cookie 管理
browser-use cookies get [--url <url>]     # 获取 Cookie(可按 URL 过滤)
browser-use cookies set <name> <value>    # 设置 Cookie(--domain, --secure, --http-only, --same-site, --expires)
browser-use cookies clear [--url <url>]   # 清除 Cookie
browser-use cookies export <file>         # 导出为 JSON
browser-use cookies import <file>         # 从 JSON 导入

# Python — 持久会话,可访问浏览器
browser-use python "code"                 # 执行 Python(变量在调用之间持久保存)
browser-use python --file script.py       # 运行文件
browser-use python --vars                 # 显示已定义的变量
browser-use python --reset                # 清除命名空间

# 会话管理
browser-use close                         # 关闭浏览器并停止守护进程
browser-use sessions                      # 列出活跃会话
browser-use close --all                   # 关闭所有会话

Python 的

browser
对象提供:
browser.url
browser.title
browser.html
browser.goto(url)
browser.back()
browser.click(index)
browser.type(text)
browser.input(index, text)
browser.keys(keys)
browser.upload(index, path)
browser.screenshot(path)
browser.scroll(direction, amount)
browser.wait(seconds)

云 API

browser-use cloud connect                 # 配置云浏览器并连接
browser-use cloud connect --timeout 120 --proxy-country US  # 带选项
browser-use cloud login <api-key>         # 保存 API Key(或设置 BROWSER_USE_API_KEY)
browser-use cloud logout                  # 移除 API Key
browser-use cloud v2 GET /browsers        # REST 透传(v2 或 v3)
browser-use cloud v2 POST /tasks '{"task":"...","url":"..."}'
browser-use cloud v2 poll <task-id>       # 轮询任务直到完成
browser-use cloud v2 --help               # 显示 API 端点

cloud connect
会配置一个云浏览器,通过 CDP 连接,并打印实时 URL。
browser-use close
会断开连接并停止云浏览器。

隧道

browser-use tunnel <port>                 # 启动 Cloudflare 隧道(幂等操作)
browser-use tunnel list                   # 显示活跃隧道
browser-use tunnel stop <port>            # 停止隧道
browser-use tunnel stop --all             # 停止所有隧道

配置文件管理

browser-use profile list                  # 列出检测到的浏览器和配置文件
browser-use profile sync --all            # 同步配置文件到云端
browser-use profile update                # 下载/更新 profile-use 二进制文件

命令链接

命令可以使用

&&
链接。浏览器通过守护进程持久存在,因此链接是安全高效的。

browser-use open https://example.com && browser-use state
browser-use input 5 "user@example.com" && browser-use input 6 "password" && browser-use click 7

当不需要中间输出时可以链接命令。当需要解析

state
来发现索引时,应分别运行。

常见工作流程

需要登录的浏览

当任务需要访问需要认证的网站(Gmail、GitHub、内部工具)时,使用 Chrome 配置文件:

browser-use profile list                           # 查看可用配置文件
# 询问用户要使用哪个配置文件,然后:
browser-use --profile "Default" open https://github.com  # 已登录状态

连接到已有的 Chrome

browser-use --connect open https://example.com     # 自动发现 Chrome 的 CDP 端点

需要启用了远程调试的 Chrome。默认探测 9222/9229 端口。

暴露本地开发服务器

browser-use tunnel 3000                            # → https://abc.trycloudflare.com
browser-use open https://abc.trycloudflare.com     # 浏览隧道

全局选项

选项说明
--headed
显示浏览器窗口
--profile [NAME]
使用真实 Chrome(单独
--profile
使用 "Default")
--connect
通过 CDP 自动发现运行中的 Chrome
--cdp-url <url>
通过 CDP URL 连接(
http://
ws://
--session NAME
指定命名会话(默认:"default")
--json
输出为 JSON 格式
--mcp
通过 stdin/stdout 作为 MCP 服务器运行

提示

  1. 始终先运行
    state
    以查看可用元素及其索引
  2. 使用
    --headed
    调试
    以查看浏览器在做什么
  3. 会话持久存在 — 浏览器在命令之间保持打开
  4. CLI 别名
    bu
    browser
    browseruse
    都可以使用

故障排除

  • 浏览器无法启动?
    browser-use close
    browser-use --headed open <url>
  • 找不到元素?
    browser-use scroll down
    browser-use state
  • 运行诊断
    browser-use doctor

清理

browser-use close                         # 关闭浏览器会话
browser-use tunnel stop --all             # 停止隧道(如果有)