API de control del navegador
Para la configuración, resolución de problemas y solución de problemas, consulte Browser.
Esta página es la referencia para la API HTTP de control local, la línea de comandos openclaw browser
y los patrones de scripting (snapshots, refs, waits, debug flows).
API de control (opcional)
Sección titulada «API de control (opcional)»Solo para integraciones locales, el Gateway expone una pequeña API HTTP de bucle invertido:
- Estado/inicio/detención:
GET /,POST /start,POST /stop - Pestañas:
GET /tabs,POST /tabs/open,POST /tabs/focus,DELETE /tabs/:targetId - Snapshot/captura de pantalla:
GET /snapshot,POST /screenshot - Acciones:
POST /navigate,POST /act - Ganchos:
POST /hooks/file-chooser,POST /hooks/dialog - Descargas:
POST /download,POST /wait/download - Permisos:
POST /permissions/grant - Depuración:
GET /console,POST /pdf - Depuración:
GET /errors,GET /requests,POST /trace/start,POST /trace/stop,POST /highlight - Red:
POST /response/body - Estado:
GET /cookies,POST /cookies/set,POST /cookies/clear - Estado:
GET /storage/:kind,POST /storage/:kind/set,POST /storage/:kind/clear - Configuración:
POST /set/offline,POST /set/headers,POST /set/credentials,POST /set/geolocation,POST /set/media,POST /set/timezone,POST /set/locale,POST /set/device
Todos los endpoints aceptan ?profile=<name>. POST /start?headless=true solicita
un inicio headless de un solo tiro para perfiles administrados localmente sin cambiar la
configuración del navegador persistente; los perfiles de solo conexión, CDP remoto y sesión existente rechazan
esa anulación porque OpenClaw no inicia esos procesos del navegador.
Si se configura la autenticación de la puerta de enlace con secreto compartido, las rutas HTTP del navegador también requieren autenticación:
Authorization: Bearer <gateway token>x-openclaw-password: <gateway password>o autenticación HTTP Basic con esa contraseña
Notas:
- Esta API de navegador de bucle local (loopback) independiente no consume encabezados de identidad de proxy confiable (trusted-proxy) ni de Tailscale Serve.
- Si
gateway.auth.modeesnoneotrusted-proxy, estas rutas de navegador de bucle local no heredan esos modos que portan identidad; manténgalas solo de bucle local.
Contrato de error de /act
Sección titulada «Contrato de error de /act»POST /act utiliza una respuesta de error estructurada para la validación a nivel de ruta y
fallos de política:
{ "error": "<message>", "code": "ACT_*" }Valores actuales de code:
ACT_KIND_REQUIRED(HTTP 400):kindfalta o no se reconoce.ACT_INVALID_REQUEST(HTTP 400): la carga útil de la acción falló la normalización o validación.ACT_SELECTOR_UNSUPPORTED(HTTP 400):selectorse usó con un tipo de acción no admitido.ACT_EVALUATE_DISABLED(HTTP 403):evaluate(owait --fn) está deshabilitado por la configuración.ACT_TARGET_ID_MISMATCH(HTTP 403):targetIdde nivel superior o por lotes entra en conflicto con el objetivo de la solicitud.ACT_EXISTING_SESSION_UNSUPPORTED(HTTP 501): la acción no es compatible con perfiles de sesión existente.
Otros fallos de tiempo de ejecución aún pueden devolver { "error": "<message>" } sin un
campo code.
Requisito de Playwright
Sección titulada «Requisito de Playwright»Algunas funciones (navegar/actuar/snapshot de IA/snapshot de rol, capturas de pantalla de elementos, PDF) requieren Playwright. Si Playwright no está instalado, esos endpoints devuelven un error 501 claro.
Lo que todavía funciona sin Playwright:
- Snapshots de ARIA
- Instantáneas de accesibilidad de estilo de función (
--interactive,--compact,--depth,--efficient) cuando hay un WebSocket CDP por pestaña disponible. Esto es una alternativa para la inspección y el descubrimiento de referencias; Playwright sigue siendo el motor de acción principal. - Capturas de pantalla de página para el navegador gestionado
openclawcuando hay un WebSocket CDP por pestaña disponible - Capturas de pantalla de página para perfiles
existing-session/ Chrome MCP existing-sessioncapturas de pantalla basadas en referencias (--ref) desde la salida de la instantánea
Lo que todavía necesita Playwright:
navigateact- Instantáneas de IA que dependen del formato de instantánea de IA nativo de Playwright
- Capturas de pantalla de elementos con selector CSS (
--element) - Exportación de PDF completa del navegador
Las capturas de pantalla de elementos también rechazan --full-page; la ruta devuelve fullPage is not supported for element screenshots.
Si ve Playwright is not available in this gateway build, al Gateway
empaquetado le falta la dependencia principal del tiempo de ejecución del navegador. Reinstale o actualice
OpenClaw y luego reinicie el gateway. Para Docker, también instale los binarios
del navegador Chromium como se muestra a continuación.
Instalación de Playwright en Docker
Sección titulada «Instalación de Playwright en Docker»Si su Gateway se ejecuta en Docker, evite npx playwright (conflictos de anulaciones de npm).
Para imágenes personalizadas, incorpore Chromium en la imagen:
OPENCLAW_INSTALL_BROWSER=1 ./scripts/docker/setup.shPara una imagen existente, instálela a través de la CLI incluida en su lugar:
docker compose run --rm openclaw-cli \ node /app/node_modules/playwright-core/cli.js install chromiumPara conservar las descargas del navegador, configure PLAYWRIGHT_BROWSERS_PATH (por ejemplo,
/home/node/.cache/ms-playwright) y asegúrese de que /home/node se conserve mediante
OPENCLAW_HOME_VOLUME o un montaje de enlace (bind mount). OpenClaw detecta automáticamente el
Chromium conservado en Linux. Consulte Docker.
Cómo funciona (interno)
Sección titulada «Cómo funciona (interno)»Un pequeño servidor de control de bucle de retorno (loopback) acepta solicitudes HTTP y se conecta a navegadores basados en Chromium a través de CDP. Las acciones avanzadas (clic/escribir/snapshot/PDF) pasan por Playwright sobre CDP; cuando falta Playwright, solo están disponibles las operaciones que no son de Playwright. El agente ve una interfaz estable mientras los navegadores y perfiles locales/remotos se intercambian libremente en segundo plano.
Referencia rápida de la CLI
Sección titulada «Referencia rápida de la CLI»Todos los comandos aceptan --browser-profile <name> para apuntar a un perfil específico y --json para una salida legible por máquina.
Lo básico: estado, pestañas, abrir/enfocar/cerrar
openclaw browser statusopenclaw browser startopenclaw browser start --headless # one-shot local managed headless launchopenclaw browser stop # also clears emulation on attach-only/remote CDPopenclaw browser tabsopenclaw browser tab # shortcut for current tabopenclaw browser tab newopenclaw browser tab select 2openclaw browser tab close 2openclaw browser open https://example.comopenclaw browser focus abcd1234openclaw browser close abcd1234Inspección: captura de pantalla, instantánea, consola, errores, solicitudes
openclaw browser screenshotopenclaw browser screenshot --full-pageopenclaw browser screenshot --ref 12 # or --ref e12openclaw browser screenshot --labelsopenclaw browser snapshotopenclaw browser snapshot --format aria --limit 200openclaw browser snapshot --interactive --compact --depth 6openclaw browser snapshot --efficientopenclaw browser snapshot --labelsopenclaw browser snapshot --urlsopenclaw browser snapshot --selector "#main" --interactiveopenclaw browser snapshot --frame "iframe#main" --interactiveopenclaw browser console --level erroropenclaw browser errors --clearopenclaw browser requests --filter api --clearopenclaw browser pdfopenclaw browser responsebody "**/api" --max-chars 5000Acciones: navegar, hacer clic, escribir, arrastrar, esperar, evaluar
openclaw browser navigate https://example.comopenclaw browser resize 1280 720openclaw browser click 12 --double # or e12 for role refsopenclaw browser click-coords 120 340 # viewport coordinatesopenclaw browser type 23 "hello" --submitopenclaw browser press Enteropenclaw browser hover 44openclaw browser scrollintoview e12openclaw browser drag 10 11openclaw browser select 9 OptionA OptionBopenclaw browser download e12 report.pdfopenclaw browser waitfordownload report.pdfopenclaw browser upload /tmp/openclaw/uploads/file.pdfopenclaw browser fill --fields '[{"ref":"1","type":"text","value":"Ada"}]'openclaw browser dialog --acceptopenclaw browser dialog --dismiss --dialog-id d1openclaw browser wait --text "Done"openclaw browser wait "#main" --url "**/dash" --load networkidle --fn "window.ready===true"openclaw browser evaluate --fn '(el) => el.textContent' --ref 7openclaw browser evaluate --timeout-ms 30000 --fn 'async () => { await window.ready; return true; }'openclaw browser highlight e12openclaw browser trace startopenclaw browser trace stopEstado: cookies, almacenamiento, sin conexión, encabezados, geolocalización, dispositivo
openclaw browser cookiesopenclaw browser cookies set session abc123 --url "https://example.com"openclaw browser cookies clearopenclaw browser storage local getopenclaw browser storage local set theme darkopenclaw browser storage session clearopenclaw browser set offline onopenclaw browser set headers --headers-json '{"X-Debug":"1"}'openclaw browser set credentials user pass # --clear to removeopenclaw browser set geo 37.7749 -122.4194 --origin "https://example.com"openclaw browser set media darkopenclaw browser set timezone America/New_Yorkopenclaw browser set locale en-USopenclaw browser set device "iPhone 14"Notas:
uploadydialogson llamadas de preparación; ejecútelas antes del clic/presión que activa el selector/cuadro de diálogo. Si una acción abre un modal, la respuesta de la acción incluyeblockedByDialogybrowserState.dialogs.pending; pase esedialogIdpara responder directamente. Los cuadros de diálogo manejados fuera de OpenClaw aparecen bajobrowserState.dialogs.recent.click/type/etc. requieren unrefdesnapshot(12numérico, referencia de role12, o referencia de ARIA accionableax12). Los selectores CSS no son compatibles intencionalmente para las acciones. Useclick-coordscuando la posición visible de la ventana gráfica sea el único objetivo confiable.- Las rutas de descarga, seguimiento y carga están restringidas a las raíces temporales de OpenClaw:
/tmp/openclaw{,/downloads,/uploads}(alternativa:${os.tmpdir()}/openclaw/...). uploadtambién puede establecer entradas de archivos directamente a través de--input-refo--element.
Los ids y etiquetas de pestañas estables sobreviven al reemplazo de destino sin procesar (raw-target) de Chromium cuando OpenClaw puede probar la pestaña de reemplazo, como la misma URL o una sola pestaña antigua que se convierte en una sola pestaña nueva después del envío del formulario. Los ids de destino sin procesar siguen siendo volátiles; prefiera suggestedTargetId de tabs en los scripts.
Marcas de instantánea a un vistazo:
--format ai(predeterminado con Playwright): instantánea de IA con referencias numéricas (aria-ref="<n>").--format aria: árbol de accesibilidad con referenciasaxN. Cuando Playwright está disponible, OpenClaw vincula las referencias con los IDs del DOM del backend a la página en vivo para que las acciones de seguimiento puedan usarlas; de lo contrario, trate la salida solo como inspección.--efficient(o--mode efficient): preajuste de snapshot de rol compacto. Establezcabrowser.snapshotDefaults.mode: "efficient"para convertir esto en el predeterminado (consulte Gateway configuration).--interactive,--compact,--depth,--selectorfuerzan una instantánea de rol con referenciasref=e12.--frame "<iframe>"limita las instantáneas de rol a un iframe.--labelsañade una captura de pantalla solo del viewport con etiquetas de referencia superpuestas (imprimeMEDIA:<path>).--urlsañade los destinos de enlace descubiertos a las instantáneas de IA.
Instantáneas y referencias
Sección titulada «Instantáneas y referencias»OpenClaw admite dos estilos de “instantánea”:
-
Instantánea de IA (referencias numéricas):
openclaw browser snapshot(predeterminado;--format ai)- Salida: una instantánea de texto que incluye referencias numéricas.
- Acciones:
openclaw browser click 12,openclaw browser type 23 "hello". - Internamente, la referencia se resuelve mediante el
aria-refde Playwright.
-
Instantánea de rol (referencias de rol como
e12):openclaw browser snapshot --interactive(o--compact,--depth,--selector,--frame)- Salida: una lista/árbol basado en roles con
[ref=e12](y[nth=1]opcional). - Acciones:
openclaw browser click e12,openclaw browser highlight e12. - Internamente, la referencia se resuelve mediante
getByRole(...)(másnth()para duplicados). - Añada
--labelspara incluir una captura de pantalla del viewport con etiquetase12superpuestas. - Añada
--urlscuando el texto del enlace sea ambiguo y el agente necesite objetivos de navegación concretos.
- Salida: una lista/árbol basado en roles con
-
Instantánea ARIA (referencias ARIA como
ax12):openclaw browser snapshot --format aria- Salida: el árbol de accesibilidad como nodos estructurados.
- Acciones:
openclaw browser click ax12funciona cuando la ruta de la instantánea puede vincular la referencia a través de los IDs del DOM de Playwright y del backend de Chrome.
-
Si Playwright no está disponible, las instantáneas ARIA aún pueden ser útiles para la inspección, pero las referencias pueden no ser accionables. Vuelva a tomar una instantánea con
--format aio--interactivecuando necesite referencias de acción. -
Prueba de Docker para la ruta de reserva de raw-CDP:
pnpm test:docker:browser-cdp-snapshotinicia Chromium con CDP, ejecutabrowser doctor --deepy verifica que las instantáneas de roles incluyan URLs de enlaces, elementos en los que se puede hacer clic promovidos por el cursor y metadatos de iframe.
Comportamiento de las referencias:
- Las referencias no son estables entre navegaciones; si algo falla, vuelva a ejecutar
snapshoty use una referencia nueva. /actdevuelve eltargetIdactual sin procesar después del reemplazo activado por la acción cuando puede probar la pestaña de reemplazo. Siga usando IDs/etiquetas de pestaña estables para comandos de seguimiento.- Si la instantánea de roles se tomó con
--frame, las referencias de roles están limitadas a ese iframe hasta la siguiente instantánea de roles. - Las referencias
axNdesconocidas o obsoletas fallan rápidamente en lugar de recurrir al selectoraria-refde Playwright. Ejecute una instantánea nueva en la misma pestaña cuando eso ocurra.
Mejoras de espera
Sección titulada «Mejoras de espera»Puedes esperar más que solo tiempo/texto:
- Esperar a la URL (los globos son compatibles con Playwright):
openclaw browser wait --url "**/dash"
- Esperar el estado de carga:
openclaw browser wait --load networkidle
- Esperar un predicado JS:
openclaw browser wait --fn "window.ready===true"
- Esperar a que un selector sea visible:
openclaw browser wait "#main"
Estos se pueden combinar:
openclaw browser wait "#main" \ --url "**/dash" \ --load networkidle \ --fn "window.ready===true" \ --timeout-ms 15000Flujos de trabajo de depuración
Sección titulada «Flujos de trabajo de depuración»Cuando falla una acción (p. ej., “no visible”, “violación del modo estricto”, “cubierto”):
openclaw browser snapshot --interactive- Use
click <ref>/type <ref>(se prefieren referencias de rol en modo interactivo) - Si aún falla:
openclaw browser highlight <ref>para ver qué está apuntando Playwright - Si la página se comporta de forma extraña:
openclaw browser errors --clearopenclaw browser requests --filter api --clear
- Para una depuración profunda: graba un rastro:
openclaw browser trace start- reproducir el problema
openclaw browser trace stop(imprimeTRACE:<path>)
Salida JSON
Sección titulada «Salida JSON»--json es para scripts y herramientas estructuradas.
Ejemplos:
openclaw browser status --jsonopenclaw browser snapshot --interactive --jsonopenclaw browser requests --filter api --jsonopenclaw browser cookies --jsonLas instantáneas de roles en JSON incluyen refs más un pequeño bloque stats (líneas/caracteres/referencias/interactivo) para que las herramientas puedan razonar sobre el tamaño y la densidad de la carga útil.
Perillas de estado y entorno
Sección titulada «Perillas de estado y entorno»Estos son útiles para flujos de trabajo de “hacer que el sitio se comporte como X”:
- Cookies:
cookies,cookies set,cookies clear - Almacenamiento:
storage local|session get|set|clear - Sin conexión:
set offline on|off - Encabezados:
set headers --headers-json '{"X-Debug":"1"}'(elset headers --json '{"X-Debug":"1"}'heredado sigue siendo compatible) - Autenticación básica HTTP:
set credentials user pass(o--clear) - Geolocalización:
set geo <lat> <lon> --origin "https://example.com"(o--clear) - Medios:
set media dark|light|no-preference|none - Zona horaria / configuración regional:
set timezone ...,set locale ... - Dispositivo / puerto de visualización:
set device "iPhone 14"(ajustes predefinidos de dispositivos de Playwright)set viewport 1280 720
Seguridad y privacidad
Sección titulada «Seguridad y privacidad»- El perfil de navegador de openclaw puede contener sesiones iniciadas; trátelo como confidencial.
browser act kind=evaluate/openclaw browser evaluateywait --fnejecutan JavaScript arbitrario en el contexto de la página. La inyección de indicaciones puede dirigir esto. Desactívelo conbrowser.evaluateEnabled=falsesi no lo necesita.- Use
openclaw browser evaluate --timeout-ms <ms>cuando la función del lado de la página pueda necesitar más tiempo que el tiempo de espera de evaluación predeterminado. - Para notas sobre inicios de sesión y anti-bot (X/Twitter, etc.), consulte Browser login + X/Twitter posting.
- Mantenga el host Gateway/node privado (solo loopback o tailnet).
- Los puntos de conexión CDP remotos son potentes; utilice túneles y protéjalos.
Ejemplo en modo estricto (bloquear destinos privados/internos de forma predeterminada):
{ browser: { ssrfPolicy: { dangerouslyAllowPrivateNetwork: false, hostnameAllowlist: ["*.example.com", "example.com"], allowedHostnames: ["localhost"], // optional exact allow }, },}Relacionado
Sección titulada «Relacionado»- Browser - descripción general, configuración, perfiles, seguridad
- Browser login - iniciar sesión en sitios
- Browser Linux troubleshooting
- Browser WSL2 troubleshooting