浏览器 (OpenClaw 托管)
浏览器(openclaw 托管)
Section titled “浏览器(openclaw 托管)”OpenClaw 可以运行一个由代理控制的专用 Chrome/Brave/Edge/Chromium 配置文件。 它与您的个人浏览器隔离,并通过 Gateway(网关) 网关 内部的一个小型本地 控制服务进行管理(仅限回环)。
初学者视图:
- 您可以将其视为一个独立的、仅限代理使用的浏览器。
openclaw配置文件不会触及您的个人浏览器配置文件。- 代理可以在安全通道中打开标签页、阅读页面、点击和输入。
- 内置的
user配置文件通过 Chrome MCP 附加到您真实登录的 Chrome 会话。
- 一个名为 openclaw 的独立浏览器配置文件(默认为橙色强调)。
- 确定性标签页控制(列表/打开/聚焦/关闭)。
- 代理操作(点击/输入/拖动/选择)、快照、屏幕截图、PDF。
- 可选的多配置文件支持 (
openclaw、work、remote等)。
此浏览器不是您的日常主力浏览器。它是一个用于代理自动化和验证的安全、隔离环境。
openclaw browser --browser-profile openclaw statusopenclaw browser --browser-profile openclaw startopenclaw browser --browser-profile openclaw open https://example.comopenclaw browser --browser-profile openclaw snapshot如果看到“Browser disabled”,请在配置中启用它(见下文)并重启 Gateway(网关)。
如果 openclaw browser 完全缺失,或者代理表示浏览器工具不可用,请跳转至 Missing browser command or 工具。
默认的 browser 工具现在是一个随附的插件,默认情况下处于启用状态。这意味着您可以禁用或替换它,而无需移除 OpenClaw 插件系统的其余部分:
{ plugins: { entries: { browser: { enabled: false, }, }, },}在安装另一个提供相同 browser 工具名称的插件之前,请禁用随附的插件。默认的浏览器体验需要两者:
plugins.entries.browser.enabled未禁用browser.enabled=true
如果您仅关闭该插件,随附的浏览器 CLI (openclaw browser)、网关方法 (browser.request)、代理工具和默认浏览器控制服务将一起消失。您的 browser.* 配置将保持完好,供替换插件重用。
随附的浏览器插件现在还拥有浏览器运行时实现。核心仅保留共享的插件 SDK 助手以及针对旧版内部导入路径的兼容性重新导出。实际上,移除或替换浏览器插件包会移除浏览器功能集,而不是留下第二个核心拥有的运行时。
浏览器配置更改仍需要重启 Gateway(网关),以便随附的插件可以使用新设置重新注册其浏览器服务。
缺少浏览器命令或工具
Section titled “缺少浏览器命令或工具”如果 openclaw browser 在升级后突然变成未知命令,或者
代理报告缺少浏览器工具,最常见的原因是受限的 plugins.allow 列表未包含 browser。
损坏的配置示例:
{ plugins: { allow: ["telegram"], },}通过将 browser 添加到插件允许列表中来修复此问题:
{ plugins: { allow: ["telegram", "browser"], },}重要注意事项:
- 当设置
plugins.allow时,仅靠browser.enabled=true本身是不够的。 - 当设置
plugins.allow时,仅靠plugins.entries.browser.enabled=true本身也是不够的。 tools.alsoAllow: ["browser"]不会加载捆绑的浏览器插件。它仅在插件加载后调整工具策略。- 如果您不需要受限的插件允许列表,删除
plugins.allow也能恢复默认的捆绑浏览器行为。
典型症状:
openclaw browser是未知命令。- 缺少
browser.request。 - 代理报告浏览器工具不可用或缺失。
配置文件:openclaw vs user
Section titled “配置文件:openclaw vs user”openclaw:受管的、隔离的浏览器(无需扩展)。user:用于您的 真实已登录 Chrome 会话的内置 Chrome MCP 附加配置文件。
对于代理浏览器工具调用:
- 默认:使用隔离的
openclaw浏览器。 - 当现有的登录会话很重要且用户在计算机前以点击/批准任何附加提示时,首选
profile="user"。 profile是在您想要特定浏览器模式时的显式覆盖。
如果您默认希望使用受管模式,请设置 browser.defaultProfile: "openclaw"。
浏览器设置位于 ~/.openclaw/openclaw.json 中。
{ browser: { enabled: true, // default: true ssrfPolicy: { dangerouslyAllowPrivateNetwork: true, // default trusted-network mode // allowPrivateNetwork: true, // legacy alias // hostnameAllowlist: ["*.example.com", "example.com"], // allowedHostnames: ["localhost"], }, // cdpUrl: "http://127.0.0.1:18792", // legacy single-profile override remoteCdpTimeoutMs: 1500, // remote CDP HTTP timeout (ms) remoteCdpHandshakeTimeoutMs: 3000, // remote CDP WebSocket handshake timeout (ms) defaultProfile: "openclaw", color: "#FF4500", headless: false, noSandbox: false, attachOnly: false, executablePath: "/Applications/Brave Browser.app/Contents/MacOS/Brave Browser", profiles: { openclaw: { cdpPort: 18800, color: "#FF4500" }, work: { cdpPort: 18801, color: "#0066CC" }, user: { driver: "existing-session", attachOnly: true, color: "#00AA00", }, brave: { driver: "existing-session", attachOnly: true, userDataDir: "~/Library/Application Support/BraveSoftware/Brave-Browser", color: "#FB542B", }, remote: { cdpUrl: "http://10.0.0.42:9222", color: "#00AA00" }, }, },}注:
- 浏览器控制服务绑定到从
gateway.port派生的端口的回环地址上 (默认值:18791,即 gateway + 2)。 - 如果您覆盖 Gateway(网关) 端口(
gateway.port或OPENCLAW_GATEWAY_PORT), 派生的浏览器端口会移动以保持在同一“系列”中。 - 如果未设置,
cdpUrl默认为受管的本地 CDP 端口。 remoteCdpTimeoutMs适用于远程(非环回)CDP 可达性检查。remoteCdpHandshakeTimeoutMs适用于远程 CDP WebSocket 可达性检查。- 浏览器导航/打开标签页在导航前受 SSRF 保护,并在导航后对最终的
http(s)URL 进行尽力而为的重新检查。 - 在严格 SSRF 模式下,也会检查远程 CDP 端点发现/探测(
cdpUrl,包括/json/version查找)。 browser.ssrfPolicy.dangerouslyAllowPrivateNetwork默认为true(受信任网络模型)。将其设置为false以进行仅限公共网络的严格浏览。browser.ssrfPolicy.allowPrivateNetwork作为传统别名仍受支持,以确保兼容性。attachOnly: true意味着“绝不启动本地浏览器;仅当它已在运行时附加。”color+ 每个配置文件的color会对浏览器 UI 进行着色,以便您可以看到哪个配置文件处于活动状态。- 默认配置文件是
openclaw(OpenClaw 管理的独立浏览器)。使用defaultProfile: "user"以选择加入已登录用户的浏览器。 - 自动检测顺序:如果系统默认浏览器基于 Chromium,则为系统默认浏览器;否则为 Chrome → Brave → Edge → Chromium → Chrome Canary。
- 本地
openclaw配置文件会自动分配cdpPort/cdpUrl— 仅为远程 CDP 设置这些。 driver: "existing-session"使用 Chrome DevTools MCP 而不是原始 CDP。不要 为该驱动程序设置cdpUrl。- 当现有会话配置文件
应附加到非默认 Chromium 用户配置文件(如 Brave 或 Edge)时,设置
browser.profiles.<name>.userDataDir。
使用 Brave(或其他基于 Chromium 的浏览器)
Section titled “使用 Brave(或其他基于 Chromium 的浏览器)”如果您的系统默认浏览器基于 Chromium(Chrome/Brave/Edge 等),
OpenClaw 会自动使用它。设置 browser.executablePath 以覆盖
自动检测:
CLI 示例:
openclaw config set browser.executablePath "/usr/bin/google-chrome"// macOS{ browser: { executablePath: "/Applications/Brave Browser.app/Contents/MacOS/Brave Browser" }}
// Windows{ browser: { executablePath: "C:\\Program Files\\BraveSoftware\\Brave-Browser\\Application\\brave.exe" }}
// Linux{ browser: { executablePath: "/usr/bin/brave-browser" }}本地控制与远程控制
Section titled “本地控制与远程控制”- 本地控制(默认): Gateway(网关) 启动环回控制服务并可以启动本地浏览器。
- 远程控制(节点主机): 在拥有浏览器的机器上运行节点主机;Gateway(网关) 将浏览器操作代理到该主机。
- Remote CDP(远程 CDP): 设置
browser.profiles.<name>.cdpUrl(或browser.cdpUrl) 以 连接到远程基于 Chromium 的浏览器。在这种情况下,OpenClaw 不会启动本地浏览器。
远程 CDP URL 可以包含身份验证信息:
- 查询令牌(例如
https://provider.example?token=<token>) - HTTP Basic 认证(例如
https://user:[email protected])
OpenClaw 在调用 /json/* 端点和连接到
CDP WebSocket 时会保留身份验证信息。对于令牌,建议使用环境变量或密钥管理器,
而不是将其提交到配置文件中。
节点浏览器代理(零配置默认值)
Section titled “节点浏览器代理(零配置默认值)”如果您在运行浏览器的机器上运行节点主机(node host),OpenClaw 可以 自动将浏览器工具调用路由到该节点,而无需任何额外的浏览器配置。 这是远程网关的默认路径。
注意事项:
- 节点主机通过代理命令公开其本地浏览器控制服务器。
- 配置文件来自节点自己的
browser.profiles配置(与本地相同)。 nodeHost.browserProxy.allowProfiles是可选的。将其留空以使用传统/默认行为:所有配置的配置文件均可通过代理访问,包括配置文件创建/删除路由。- 如果您设置了
nodeHost.browserProxy.allowProfiles,OpenClaw 会将其视为最小权限边界:只有列入白名单的配置文件才能被定位,并且在代理表面阻止持久配置文件的创建/删除路由。 - 如果您不希望使用它,请禁用:
- 在节点上:
nodeHost.browserProxy.enabled=false - 在网关上:
gateway.nodes.browser.mode="off"
- 在节点上:
Browserless(托管远程 CDP)
Section titled “Browserless(托管远程 CDP)”Browserless 是一项托管的 Chromium 服务,通过 HTTPS 和 WebSocket 公开 CDP 连接 URL。OpenClaw 可以使用任何一种形式,但对于 远程浏览器配置文件,最简单的选项是 Browserless 连接文档中提供的直接 WebSocket URL。
示例:
{ browser: { enabled: true, defaultProfile: "browserless", remoteCdpTimeoutMs: 2000, remoteCdpHandshakeTimeoutMs: 4000, profiles: { browserless: { cdpUrl: "wss://production-sfo.browserless.io?token=<BROWSERLESS_API_KEY>", color: "#00AA00", }, }, },}注意事项:
- 将
<BROWSERLESS_API_KEY>替换为您真实的 Browserless 令牌。 - 选择与您的 Browserless 账户匹配的区域端点(请参阅其文档)。
- 如果 Browserless 为您提供了 HTTPS 基础 URL,您可以将其转换为
wss://以进行直接的 CDP 连接,或者保留 HTTPS URL 并让 OpenClaw 发现/json/version。
直接 WebSocket CDP 提供商
Section titled “直接 WebSocket CDP 提供商”一些托管浏览器服务公开 直接的 WebSocket 端点,而不是标准的基于 HTTP 的 CDP 发现 (/json/version)。OpenClaw 支持这两种方式:
- HTTP(S) 端点 — OpenClaw 调用
/json/version来发现 WebSocket 调试器 URL,然后进行连接。 - WebSocket 端点 (
ws:///wss://) — OpenClaw 直接连接,跳过/json/version。将此用于诸如 Browserless、Browserbase 或任何向您提供 WebSocket URL 的提供商。
Browserbase
Section titled “Browserbase”Browserbase 是一个用于运行无头浏览器的云平台,具有内置的 CAPTCHA 解决、隐身模式和住宅代理功能。
{ browser: { enabled: true, defaultProfile: "browserbase", remoteCdpTimeoutMs: 3000, remoteCdpHandshakeTimeoutMs: 5000, profiles: { browserbase: { cdpUrl: "wss://connect.browserbase.com?apiKey=<BROWSERBASE_API_KEY>", color: "#F97316", }, }, },}注意:
- 注册 并从 概览仪表板 复制您的 API Key。
- 将
<BROWSERBASE_API_KEY>替换为您的真实 Browserbase API 密钥。 - Browserbase 在 WebSocket 连接时自动创建浏览器会话,因此无需手动创建会话的步骤。
- 免费层级允许每月一个并发会话和一个浏览器小时。有关付费计划限制,请参阅 定价。
- 有关完整的 API 参考、SDK 指南和集成示例,请参阅 Browserbase 文档。
主要观点:
- 浏览器控制仅限本地回环;访问通过 Gateway(网关) 的身份验证或节点配对进行。
- 如果启用了浏览器控制且未配置身份验证,OpenClaw 会在启动时自动生成
gateway.auth.token并将其持久化到配置中。 - 将 Gateway(网关) 和任何节点主机保持在专用网络 (Tailscale) 上;避免公开暴露。
- 将远程 CDP URL/令牌视为机密;优先使用环境变量或机密管理器。
远程 CDP 提示:
- 尽可能使用加密端点 (HTTPS 或 WSS) 和短期令牌。
- 避免将长期令牌直接嵌入配置文件中。
配置文件 (多浏览器)
Section titled “配置文件 (多浏览器)”OpenClaw 支持多个命名配置文件(路由配置)。配置文件可以是:
- openclaw-managed:一个专用的基于 Chromium 的浏览器实例,拥有自己的用户数据目录 + CDP 端口
- remote:一个明确的 CDP URL(在别处运行的基于 Chromium 的浏览器)
- existing 会话:你现有的 Chrome 配置文件,通过 Chrome DevTools MCP 自动连接
默认设置:
- 如果缺失,
openclaw配置文件会被自动创建。 user配置文件是内置的,用于附加 Chrome MCP 现有会话。- 除了
user之外,现有会话配置文件是可选加入(opt-in)的;使用--driver existing-session创建它们。 - 本地 CDP 端口默认从 18800–18899 分配。
- 删除配置文件会将其本地数据目录移至回收站。
所有控制端点都接受 ?profile=<name>;CLI 使用 --browser-profile。
通过 Chrome DevTools MCP 连接现有会话
Section titled “通过 Chrome DevTools MCP 连接现有会话”OpenClaw 也可以通过官方 Chrome DevTools MCP 服务器附加到正在运行的基于 Chromium 的浏览器配置文件。这将重用该浏览器配置文件中已打开的标签页和登录状态。
官方背景和设置参考:
内置配置文件:
user
可选:如果你想要不同的名称、颜色或浏览器数据目录,可以创建你自己的自定义现有会话配置文件。
默认行为:
- 内置的
user配置文件使用 Chrome MCP 自动连接,它针对 默认的本地 Google Chrome 配置文件。
对于 Brave、Edge、Chromium 或非默认 Chrome 配置文件,使用 userDataDir:
{ browser: { profiles: { brave: { driver: "existing-session", attachOnly: true, userDataDir: "~/Library/Application Support/BraveSoftware/Brave-Browser", color: "#FB542B", }, }, },}然后在匹配的浏览器中:
- 打开该浏览器的检查页面以进行远程调试。
- 启用远程调试。
- 保持浏览器运行,并在 OpenClaw 附加时批准连接提示。
常用检查页面:
- Chrome:
chrome://inspect/#remote-debugging - Brave:
brave://inspect/#remote-debugging - Edge:
edge://inspect/#remote-debugging
实时附加冒烟测试:
openclaw browser --browser-profile user startopenclaw browser --browser-profile user statusopenclaw browser --browser-profile user tabsopenclaw browser --browser-profile user snapshot --format ai成功的样子:
status显示driver: existing-sessionstatus显示transport: chrome-mcpstatus显示running: truetabs列出您已打开的浏览器标签页snapshot从选定的实时标签页返回引用
如果附加不起作用,请检查:
- 目标基于 Chromium 的浏览器版本为
144+ - 在该浏览器的检查页面中启用了远程调试
- 浏览器已显示附加同意提示,且您已接受
openclaw doctor迁移旧的基于扩展的浏览器配置,并检查是否 本地安装了 Chrome 以用于默认自动连接配置文件,但它无法 为您启用浏览器端的远程调试
代理用途:
- 当您需要用户的登录浏览器状态时,请使用
profile="user"。 - 如果您使用自定义现有会话配置文件,请传递该显式配置文件名称。
- 仅当用户在计算机旁以批准附加 提示时,才选择此模式。
- Gateway(网关) 或节点主机可以生成
npx chrome-devtools-mcp@latest --autoConnect
注意:
- 此路径比隔离的
openclaw配置文件风险更高,因为它可以 在您已登录的浏览器会话中操作。 - OpenClaw 不会为此驱动程序启动浏览器;它仅附加到 现有会话。
- OpenClaw 在此处使用官方 Chrome DevTools MCP
--autoConnect流程。如果 设置了userDataDir,OpenClaw 会将其传递以定位该显式 Chromium 用户数据目录。 - 现有会话截图支持从快照进行页面捕获和
--ref元素 捕获,但不支持 CSS--element选择器。 - 现有会话
wait --url支持与其他浏览器驱动程序类似的精确、子字符串和 glob 模式。 尚不支持wait --load networkidle。 - 某些功能仍需要托管浏览器路径,例如 PDF 导出和 下载拦截。
- 现有会话是主机本地的。如果 Chrome 位于不同的机器或 不同的网络命名空间上,请改用远程 CDP 或节点主机。
- 专用用户数据目录:绝不接触您的个人浏览器配置文件。
- 专用端口:避免
9222以防止与开发工作流发生冲突。 - 确定性标签页控制:通过
targetId定位标签页,而非“最后一个标签页”。
在本地启动时,OpenClaw 会选择第一个可用的浏览器:
- Chrome
- Brave
- Edge
- Chromium
- Chrome Canary
您可以使用 browser.executablePath 进行覆盖。
平台:
- macOS:检查
/Applications和~/Applications。 - Linux:查找
google-chrome、brave、microsoft-edge、chromium等。 - Windows:检查常见的安装位置。
控制 API(可选)
Section titled “控制 API(可选)”仅对于本地集成,Gateway(网关) 会公开一个小型回环 HTTP API:
- 状态/启动/停止:
GET /、POST /start、POST /stop - 标签页:
GET /tabs、POST /tabs/open、POST /tabs/focus、DELETE /tabs/:targetId - 快照/截图:
GET /snapshot、POST /screenshot - 操作:
POST /navigate、POST /act - 钩子:
POST /hooks/file-chooser、POST /hooks/dialog - 下载:
POST /download、POST /wait/download - 调试:
GET /console、POST /pdf - 调试:
GET /errors、GET /requests、POST /trace/start、POST /trace/stop、POST /highlight - 网络:
POST /response/body - 状态:
GET /cookies、POST /cookies/set、POST /cookies/clear - 状态:
GET /storage/:kind、POST /storage/:kind/set、POST /storage/:kind/clear - 设置:
POST /set/offline、POST /set/headers、POST /set/credentials、POST /set/geolocation、POST /set/media、POST /set/timezone、POST /set/locale、POST /set/device
所有端点都接受 ?profile=<name>。
如果配置了 Gateway(网关) 身份验证,浏览器 HTTP 路由也需要身份验证:
Authorization: Bearer <gateway token>x-openclaw-password: <gateway password>或使用该密码进行 HTTP Basic auth
Playwright 要求
Section titled “Playwright 要求”某些功能(导航/操作/AI 快照/角色快照、元素截图、PDF)需要 Playwright。如果未安装 Playwright,这些端点将返回明确的 501 错误。ARIA 快照和基本截图在 OpenClaw 管理的 Chrome 上仍然可用。
如果您看到 Playwright is not available in this gateway build,请安装完整的
Playwright 软件包(而不是 playwright-core)并重启 Gateway(网关),或重新安装
带有浏览器支持的 OpenClaw。
Docker Playwright 安装
Section titled “Docker Playwright 安装”如果您的 Gateway(网关) 在 Docker 中运行,请避免 npx playwright(npm 覆盖冲突)。
请改用捆绑的 CLI:
docker compose run --rm openclaw-cli \ node /app/node_modules/playwright-core/cli.js install chromium要持久化浏览器下载,请设置 PLAYWRIGHT_BROWSERS_PATH(例如,
/home/node/.cache/ms-playwright)并确保 /home/node 通过
OPENCLAW_HOME_VOLUME 或绑定挂载进行持久化。请参阅 Docker。
工作原理(内部)
Section titled “工作原理(内部)”高级流程:
- 一个小型的 控制服务器 接受 HTTP 请求。
- 它通过 CDP 连接到基于 Chromium 的浏览器(Chrome/Brave/Edge/Chromium)。
- 对于高级操作(点击/输入/快照/PDF),它在 CDP 之上使用 Playwright。
- 当缺少 Playwright 时,仅提供非 Playwright 操作。
此设计使代理保持在稳定的确定性接口上,同时允许 您交换本地/远程浏览器和配置文件。
CLI 快速参考
Section titled “CLI 快速参考”所有命令都接受 --browser-profile <name> 以定位特定配置文件。
所有命令也接受 --json 以获得机器可读的输出(稳定负载)。
基础知识:
openclaw browser statusopenclaw browser startopenclaw browser stopopenclaw browser tabsopenclaw browser tabopenclaw browser tab newopenclaw browser tab select 2openclaw browser tab close 2openclaw browser open https://example.comopenclaw browser focus abcd1234openclaw browser close abcd1234
检查:
openclaw browser screenshotopenclaw browser screenshot --full-pageopenclaw browser screenshot --ref 12openclaw browser screenshot --ref e12openclaw browser snapshotopenclaw browser snapshot --format aria --limit 200openclaw browser snapshot --interactive --compact --depth 6openclaw browser snapshot --efficientopenclaw browser snapshot --labelsopenclaw browser snapshot --selector "#main" --interactiveopenclaw browser snapshot --frame "iframe#main" --interactiveopenclaw browser console --level erroropenclaw browser errors --clearopenclaw browser requests --filter api --clearopenclaw browser pdfopenclaw browser responsebody "**/api" --max-chars 5000
Actions:
openclaw browser navigate https://example.comopenclaw browser resize 1280 720openclaw browser click 12 --doubleopenclaw browser click e12 --doubleopenclaw browser type 23 "hello" --submitopenclaw browser press Enteropenclaw browser hover 44openclaw browser scrollintoview e12openclaw browser drag 10 11openclaw browser select 9 OptionA OptionBopenclaw browser download e12 report.pdfopenclaw browser waitfordownload report.pdfopenclaw browser upload /tmp/openclaw/uploads/file.pdfopenclaw browser fill --fields '[{"ref":"1","type":"text","value":"Ada"}]'openclaw browser dialog --acceptopenclaw browser wait --text "Done"openclaw browser wait "#main" --url "**/dash" --load networkidle --fn "window.ready===true"openclaw browser evaluate --fn '(el) => el.textContent' --ref 7openclaw browser highlight e12openclaw browser trace startopenclaw browser trace stop
State:
openclaw browser cookiesopenclaw browser cookies set session abc123 --url "https://example.com"openclaw browser cookies clearopenclaw browser storage local getopenclaw browser storage local set theme darkopenclaw browser storage session clearopenclaw browser set offline onopenclaw browser set headers --headers-json '{"X-Debug":"1"}'openclaw browser set credentials user passopenclaw browser set credentials --clearopenclaw browser set geo 37.7749 -122.4194 --origin "https://example.com"openclaw browser set geo --clearopenclaw browser set media darkopenclaw browser set timezone America/New_Yorkopenclaw browser set locale en-USopenclaw browser set device "iPhone 14"
Notes:
upload和dialog是 预置(arming) 调用;在触发选择器/对话框的点击/按键操作之前运行它们。- 下载和跟踪输出路径限制在 OpenClaw 临时根目录:
- traces:
/tmp/openclaw(fallback:${os.tmpdir()}/openclaw) - downloads:
/tmp/openclaw/downloads(fallback:${os.tmpdir()}/openclaw/downloads)
- traces:
- 上传路径被限制在 OpenClaw 临时上传根目录:
- uploads:
/tmp/openclaw/uploads(fallback:${os.tmpdir()}/openclaw/uploads)
- uploads:
upload也可以通过--input-ref或--element直接设置文件输入。snapshot:--format ai(安装 Playwright 时的默认值):返回带有数字引用 (aria-ref="<n>") 的 AI 快照。--format aria:返回无障碍树(无引用;仅限检查)。--efficient(或--mode efficient):紧凑的角色快照预设(interactive + compact + depth + lower maxChars)。- 配置默认值(仅限工具/CLI):设置
browser.snapshotDefaults.mode: "efficient"以在调用方未传递模式时使用高效快照(参见 Gateway(网关) configuration)。 - 角色快照选项(
--interactive、--compact、--depth、--selector)强制生成带有如ref=e12引用的基于角色的快照。 --frame "<iframe selector>"将角色快照的作用域限定为一个 iframe(与如e12的角色引用配对)。--interactive输出一个扁平、易于选择的交互元素列表(最适合驱动操作)。--labels添加仅视口的屏幕截图,并覆盖引用标签(打印MEDIA:<path>)。
click/type/等需要一个来自snapshot的ref(数字12或角色引用e12)。 有意不支持用于操作的 CSS 选择器。
OpenClaw 支持两种“快照”样式:
-
AI 快照(数字引用):
openclaw browser snapshot(默认值;--format ai)- 输出:包含数字引用的文本快照。
- 操作:
openclaw browser click 12、openclaw browser type 23 "hello"。 - 在内部,ref 通过 Playwright 的
aria-ref解析。
-
角色快照(如
e12的角色引用):openclaw browser snapshot --interactive(或--compact、--depth、--selector、--frame)- 输出:一个带有
[ref=e12](以及可选的[nth=1])的基于角色的列表/树。 - 操作:
openclaw browser click e12、openclaw browser highlight e12。 - 在内部,ref 通过
getByRole(...)解析(对于重复项则加上nth())。 - 添加
--labels以包含带有叠加e12标签的视口截图。
- 输出:一个带有
引用行为:
- 引用在导航之间不稳定;如果出现故障,请重新运行
snapshot并使用新的引用。 - 如果使用
--frame拍摄了角色快照,则角色引用将限定在该 iframe 内,直到下一次角色快照。
等待增强功能
Section titled “等待增强功能”您可以等待的内容不止是时间/文本:
- 等待 URL(支持 Playwright 支持的 glob 模式):
openclaw browser wait --url "**/dash"
- 等待加载状态:
openclaw browser wait --load networkidle
- 等待 JS 谓词:
openclaw browser wait --fn "window.ready===true"
- 等待选择器可见:
openclaw browser wait "#main"
这些可以组合使用:
openclaw browser wait "#main" \ --url "**/dash" \ --load networkidle \ --fn "window.ready===true" \ --timeout-ms 15000当操作失败时(例如“不可见”、“严格模式违规”、“被覆盖”):
openclaw browser snapshot --interactive- 使用
click <ref>/type <ref>(在交互模式下优先使用角色引用) - 如果仍然失败:
openclaw browser highlight <ref>以查看 Playwright 正在以什么为目标 - 如果页面行为异常:
openclaw browser errors --clearopenclaw browser requests --filter api --clear
- 用于深度调试:记录跟踪:
openclaw browser trace start- 重现问题
openclaw browser trace stop(打印TRACE:<path>)
JSON 输出
Section titled “JSON 输出”--json 用于脚本和结构化工具。
示例:
openclaw browser status --jsonopenclaw browser snapshot --interactive --jsonopenclaw browser requests --filter api --jsonopenclaw browser cookies --jsonJSON 中的角色快照包含 refs 以及一个小型的 stats 块(行/字符/引用/交互),以便工具可以推断负载大小和密度。
状态与环境控制项
Section titled “状态与环境控制项”这些对于“让网站像 X 一样运行”的工作流非常有用:
- Cookies:
cookies、cookies set、cookies clear - 存储:
storage local|session get|set|clear - 离线:
set offline on|off - 请求头:
set headers --headers-json '{"X-Debug":"1"}'(遗留的set headers --json '{"X-Debug":"1"}'仍然受支持) - HTTP 基本身份验证:
set credentials user pass(或--clear) - 地理位置:
set geo <lat> <lon> --origin "https://example.com"(或--clear) - 媒体:
set media dark|light|no-preference|none - 时区 / 区域设置:
set timezone ...、set locale ... - 设备 / 视口:
set device "iPhone 14"(Playwright 设备预设)set viewport 1280 720
- OpenClaw 浏览器配置文件可能包含已登录的会话;请将其视为敏感信息。
browser act kind=evaluate/openclaw browser evaluate和wait --fn在页面上下文中执行任意 JavaScript。提示注入可能会控制 此操作。如果不需要,请使用browser.evaluateEnabled=false将其禁用。- 有关登录和反机器人检测说明(X/Twitter 等),请参阅 浏览器登录 + X/Twitter 发布。
- 保持 Gateway(网关)/节点主机私密(仅限本地回环或 tailnet)。
- 远程 CDP 端点功能强大;请对其进行隧道传输和保护。
严格模式示例(默认阻止私有/内部目标):
{ browser: { ssrfPolicy: { dangerouslyAllowPrivateNetwork: false, hostnameAllowlist: ["*.example.com", "example.com"], allowedHostnames: ["localhost"], // optional exact allow }, },}有关 Linux 特定的问题(尤其是 snap Chromium),请参阅 浏览器故障排除。
有关 WSL2 Gateway(网关) + Windows Chrome 分宿主设置,请参阅 WSL2 + Windows + 远程 Chrome CDP 故障排除。
Agent 工具 + 控制工作原理
Section titled “Agent 工具 + 控制工作原理”Agent 获得一个工具用于浏览器自动化:
browser— status/start/stop/tabs/open/focus/close/snapshot/screenshot/navigate/act
映射方式:
browser snapshot返回一个稳定的 UI 树(AI 或 ARIA)。browser act使用快照refID 来点击/输入/拖动/选择。browser screenshot捕获像素(整个页面或元素)。browser接受:profile用于选择命名的浏览器配置文件(openclaw、chrome 或远程 CDP)。target(sandbox|host|node) 用于选择浏览器的所在位置。- 在沙箱隔离会话中,
target: "host"需要agents.defaults.sandbox.browser.allowHostControl=true。 - 如果省略了
target:沙箱隔离会话默认为sandbox,非沙箱会话默认为host。 - 如果连接了具有浏览器功能的节点,该工具可能会自动路由到该节点,除非您固定了
target="host"或target="node"。
这使 Agent 保持确定性,并避免使用脆弱的选择器。