APIAPI de contrôle de navigateur
Pour la configuration, le dépannage, consultez Navigateur.
Cette page est la référence pour l’API HTTP de contrôle local, la ligne de commande openclaw browserCLI
CLI, et les modèles de script (instantanés, références, attentes, flux de débogage).
API de contrôle (facultatif)
Section intitulée « API de contrôle (facultatif) »Pour les intégrations locales uniquement, la Gateway expose une petite API HTTP de bouclage :
- Statut/démarrage/arrêt :
GET /,POST /start,POST /stop - Onglets :
GET /tabs,POST /tabs/open,POST /tabs/focus,DELETE /tabs/:targetId - Instantané/capture d’écran :
GET /snapshot,POST /screenshot - Actions :
POST /navigate,POST /act - Crochets (hooks) :
POST /hooks/file-chooser,POST /hooks/dialog - Téléchargements :
POST /download,POST /wait/download - Autorisations :
POST /permissions/grant - Débogage :
GET /console,POST /pdf - Débogage :
GET /errors,GET /requests,POST /trace/start,POST /trace/stop,POST /highlight - Réseau :
POST /response/body - État :
GET /cookies,POST /cookies/set,POST /cookies/clear - État :
GET /storage/:kind,POST /storage/:kind/set,POST /storage/:kind/clear - Paramètres :
POST /set/offline,POST /set/headers,POST /set/credentials,POST /set/geolocation,POST /set/media,POST /set/timezone,POST /set/locale,POST /set/device
Tous les points de terminaison acceptent ?profile=<name>. POST /start?headless=true demande un
lancement headless ponctuel pour les profils gérés localement sans modifier la
configuration persistante du navigateur ; les profils attach-only, CDP distant et de session existante rejettent ce remplacement car OpenClaw ne lance pas ces processus de navigateur.
Si l’authentification de passerelle par secret partagé est configurée, les routes HTTP du navigateur nécessitent également une authentification :
Authorization: Bearer <gateway token>x-openclaw-password: <gateway password>ou authentification HTTP Basic avec ce mot de passe
Notes :
- Cette API de navigateur en boucle locale autonome ne consomme pas les en-têtes d’identité de proxy approuvé ou API Serve.
- Si
gateway.auth.modeestnoneoutrusted-proxy, ces routes de bouclage de navigateur n’héritent pas de ces modes porteurs d’identité ; gardez-les en bouclage uniquement.
Contrat d’erreur /act
Section intitulée « Contrat d’erreur /act »POST /act utilise une réponse d’erreur structurée pour la validation au niveau de la route et
les échecs de stratégie :
{ "error": "<message>", "code": "ACT_*" }Valeurs code actuelles :
ACT_KIND_REQUIRED(HTTP 400) :kindest manquant ou non reconnu.ACT_INVALID_REQUEST(HTTP 400) : la charge utile de l’action a échoué à la normalisation ou à la validation.ACT_SELECTOR_UNSUPPORTED(HTTP 400) :selectora été utilisé avec un type d’action non pris en charge.ACT_EVALUATE_DISABLED(HTTP 403) :evaluate(ouwait --fn) est désactivé par la configuration.ACT_TARGET_ID_MISMATCH(HTTP 403) : letargetIdde niveau supérieur ou par lot est en conflit avec la cible de la requête.ACT_EXISTING_SESSION_UNSUPPORTED(HTTP 501) : l’action n’est pas prise en charge pour les profils de session existante.
D’autres échecs d’exécution peuvent toujours renvoyer { "error": "<message>" } sans champ
code.
Configuration requise pour Playwright
Section intitulée « Configuration requise pour Playwright »Certaines fonctionnalités (navigation/action/AI snapshot/role snapshot, captures d’écran d’éléments, PDF) nécessitent Playwright. Si Playwright n’est pas installé, ces points de terminaison renvoient une erreur 501 claire.
Ce qui fonctionne toujours sans Playwright :
- Snapshots ARIA
- Instantanés d’accessibilité de style rôle (
--interactive,--compact,--depth,--efficient) lorsqu’un WebSocket CDP par onglet est disponible. Il s’agit d’un repli pour l’inspection et la découverte de références ; Playwright reste le moteur d’action principal. - Captures d’écran de page pour le navigateur
openclawgéré lorsqu’un WebSocket CDP par onglet est disponible - Captures d’écran de page pour les profils
existing-session/ Chrome MCP existing-sessioncaptures d’écran basés sur des références (--ref) à partir de la sortie de l’instantané
Ce qui nécessite encore Playwright :
navigateact- Snapshots AI qui dépendent du format de snapshot natif de Playwright
- Captures d’écran d’éléments par sélecteur CSS (
--element) - Exportation PDF complète du navigateur
Les captures d’écran d’éléments rejettent également --full-page ; la route renvoie fullPage is not supported for element screenshots.
Si vous voyez Playwright is not available in this gateway build, il manque une dépendance d’exécution du navigateur principale au Gateway empaqueté. Réinstallez ou mettez à jour
OpenClaw, puis redémarrez la passerelle. Pour Docker, installez également les binaires
du navigateur Chromium comme indiqué ci-dessous.
Installation de Docker Playwright
Section intitulée « Installation de Docker Playwright »Si votre Gateway s’exécute dans Docker, évitez npx playwright (conflits de substitution npm).
Pour les images personnalisées, intégrez Chromium à l’image :
OPENCLAW_INSTALL_BROWSER=1 ./scripts/docker/setup.shPour une image existante, installez via le CLI inclus à la place :
docker compose run --rm openclaw-cli \ node /app/node_modules/playwright-core/cli.js install chromiumPour conserver les téléchargements du navigateur, définissez PLAYWRIGHT_BROWSERS_PATH (par exemple,
/home/node/.cache/ms-playwright) et assurez-vous que /home/node est conservé via
OPENCLAW_HOME_VOLUME ou un montage de liaison. OpenClaw détecte automatiquement le
Chromium conservé sur Linux. Voir Docker.
Fonctionnement (interne)
Section intitulée « Fonctionnement (interne) »Un petit serveur de contrôle de boucle locale accepte les requêtes HTTP et se connecte aux navigateurs basés sur Chromium via CDP. Les actions avancées (clic/taper/instantané/PDF) passent par Playwright au-dessus de CDP ; lorsque Playwright est manquant, seules les opérations non Playwright sont disponibles. L’agent voit une interface stable tandis que les navigateurs et profils locaux/distants s’échangent librement en dessous.
Référence rapide CLI
Section intitulée « Référence rapide CLI »Toutes les commandes acceptent --browser-profile <name> pour cibler un profil spécifique, et --json pour une sortie lisible par machine.
Bases : statut, onglets, ouvrir/focus/fermer
openclaw browser statusopenclaw browser startopenclaw browser start --headless # one-shot local managed headless launchopenclaw browser stop # also clears emulation on attach-only/remote CDPopenclaw browser tabsopenclaw browser tab # shortcut for current tabopenclaw browser tab newopenclaw browser tab select 2openclaw browser tab close 2openclaw browser open https://example.comopenclaw browser focus abcd1234openclaw browser close abcd1234Inspection : capture d'écran, instantané, console, erreurs, requêtes
openclaw browser screenshotopenclaw browser screenshot --full-pageopenclaw browser screenshot --ref 12 # or --ref e12openclaw browser screenshot --labelsopenclaw browser snapshotopenclaw browser snapshot --format aria --limit 200openclaw browser snapshot --interactive --compact --depth 6openclaw browser snapshot --efficientopenclaw browser snapshot --labelsopenclaw browser snapshot --urlsopenclaw browser snapshot --selector "#main" --interactiveopenclaw browser snapshot --frame "iframe#main" --interactiveopenclaw browser console --level erroropenclaw browser errors --clearopenclaw browser requests --filter api --clearopenclaw browser pdfopenclaw browser responsebody "**/api" --max-chars 5000Actions : naviguer, cliquer, taper, faire glisser, attendre, évaluer
openclaw browser navigate https://example.comopenclaw browser resize 1280 720openclaw browser click 12 --double # or e12 for role refsopenclaw browser click-coords 120 340 # viewport coordinatesopenclaw browser type 23 "hello" --submitopenclaw browser press Enteropenclaw browser hover 44openclaw browser scrollintoview e12openclaw browser drag 10 11openclaw browser select 9 OptionA OptionBopenclaw browser download e12 report.pdfopenclaw browser waitfordownload report.pdfopenclaw browser upload /tmp/openclaw/uploads/file.pdfopenclaw browser fill --fields '[{"ref":"1","type":"text","value":"Ada"}]'openclaw browser dialog --acceptopenclaw browser dialog --dismiss --dialog-id d1openclaw browser wait --text "Done"openclaw browser wait "#main" --url "**/dash" --load networkidle --fn "window.ready===true"openclaw browser evaluate --fn '(el) => el.textContent' --ref 7openclaw browser evaluate --timeout-ms 30000 --fn 'async () => { await window.ready; return true; }'openclaw browser highlight e12openclaw browser trace startopenclaw browser trace stopÉtat : cookies, stockage, hors ligne, en-têtes, géo, appareil
openclaw browser cookiesopenclaw browser cookies set session abc123 --url "https://example.com"openclaw browser cookies clearopenclaw browser storage local getopenclaw browser storage local set theme darkopenclaw browser storage session clearopenclaw browser set offline onopenclaw browser set headers --headers-json '{"X-Debug":"1"}'openclaw browser set credentials user pass # --clear to removeopenclaw browser set geo 37.7749 -122.4194 --origin "https://example.com"openclaw browser set media darkopenclaw browser set timezone America/New_Yorkopenclaw browser set locale en-USopenclaw browser set device "iPhone 14"Notes :
uploadetdialogsont des appels d’armement ; exécutez-les avant le clic/appui qui déclenche le sélecteur/la boîte de dialogue. Si une action ouvre une fenêtre modale, la réponse de l’action inclutblockedByDialogetbrowserState.dialogs.pending; transmettez cedialogIdpour répondre directement. Les boîtes de dialogue gérées en dehors de OpenClaw apparaissent sousbrowserState.dialogs.recent.click/type/etc nécessitent unrefdesnapshot(référence numérique12, référence de rôlee12, ou référence ARIA actionnableax12). Les sélecteurs CSS ne sont intentionnellement pas pris en charge pour les actions. Utilisezclick-coordslorsque la position dans la fenêtre d’affichage visible est la seule cible fiable.- Les chemins de téléchargement, de trace et de téléversement sont limités aux racines temporaires de OpenClaw :
/tmp/openclaw{,/downloads,/uploads}(secours :${os.tmpdir()}/openclaw/...). uploadpeut également définir directement les entrées de fichiers via--input-refou--element.
Les ID et étiquettes d’onglets stables survivent au remplacement de la cible brute de Chromium lorsque OpenClaw peut prouver l’onglet de remplacement, par exemple la même URL ou un seul vieil onglet devenant un seul nouvel onglet après l’envoi du formulaire. Les ID de cibles brutes restent volatiles ; privilégiez suggestedTargetId depuis tabs dans les scripts.
Aperçu des indicateurs de snapshot :
--format ai(par défaut avec Playwright) : capture instantanée IA avec références numériques (aria-ref="<n>").--format aria: arborescence d’accessibilité avec référencesaxN. Lorsque Playwright est disponible, OpenClaw lie les références avec les ID DOM du backend à la page active pour que les actions de suivi puissent les utiliser ; sinon, traitez la sortie comme une inspection uniquement.--efficient(ou--mode efficient) : préréglage d’instantané de rôle compact. Définissezbrowser.snapshotDefaults.mode: "efficient"pour en faire la valeur par défaut (voir configuration du Gateway).--interactive,--compact,--depth,--selectorforcent une capture instantanée de rôle avec des référencesref=e12.--frame "<iframe>"limite la portée des captures instantanées de rôle à une iframe.--labelsajoute une capture d’écran de la fenêtre d’affichage uniquement avec des étiquettes de référence superposées (imprimeMEDIA:<path>).--urlsajoute les destinations de lien découvertes aux captures instantanées IA.
Instantanés et refs
Section intitulée « Instantanés et refs »OpenClaw prend en charge deux styles d‘“instantané” :
-
Capture instantanée IA (références numériques) :
openclaw browser snapshot(par défaut ;--format ai)- Sortie : un instantané texte incluant des réfs numériques.
- Actions :
openclaw browser click 12,openclaw browser type 23 "hello". - En interne, la référence est résolue via
aria-refde Playwright.
-
Capture instantanée de rôle (références de rôle comme
e12) :openclaw browser snapshot --interactive(ou--compact,--depth,--selector,--frame)- Sortie : une liste/arborescence basée sur les rôles avec
[ref=e12](et[nth=1]en option). - Actions :
openclaw browser click e12,openclaw browser highlight e12. - En interne, la référence est résolue via
getByRole(...)(plusnth()pour les doublons). - Ajoutez
--labelspour inclure une capture d’écran de la fenêtre d’affichage avec des étiquettese12superposées. - Ajoutez
--urlslorsque le texte du lien est ambigu et que l’agent a besoin de cibles de navigation concrètes.
- Sortie : une liste/arborescence basée sur les rôles avec
-
Instantané ARIA (références ARIA comme
ax12) :openclaw browser snapshot --format aria- Sortie : l’arbre d’accessibilité sous forme de nœuds structurés.
- Actions :
openclaw browser click ax12fonctionne lorsque le chemin de l’instantané peut lier la référence via Playwright et les identifiants DOM du backend Chrome.
-
Si Playwright n’est pas disponible, les instantanés ARIA peuvent toujours être utiles pour l’inspection, mais les références peuvent ne pas être actionnables. Reprenez un instantané avec
--format aiou--interactivelorsque vous avez besoin de références d’action. -
Preuve Docker pour le chemin de repli raw-CDP :
pnpm test:docker:browser-cdp-snapshotdémarre Chromium avec CDP, exécutebrowser doctor --deepet vérifie que les instantanés de rôle incluent les URLs des liens, les éléments cliquables promus par le curseur et les métadonnées iframe.
Comportement des références :
- Les références ne sont pas stables lors des navigations ; si quelque chose échoue, relancez
snapshotet utilisez une référence fraîche. /actrenvoie l’targetIdbrut actuel après remplacement déclenché par une action lorsqu’il peut prouver l’onglet de remplacement. Continuez à utiliser des identifiants/étiquettes d’onglet stables pour les commandes de suivi.- Si l’instantané de rôle a été pris avec
--frame, les références de rôle sont limitées à cet iframe jusqu’au prochain instantané de rôle. - Les références
axNinconnues ou périmées échouent rapidement au lieu de passer par défaut au sélecteuraria-refde Playwright. Lancez un nouvel instantané sur le même onglet lorsque cela se produit.
Améliorations d’attente
Section intitulée « Améliorations d’attente »Vous pouvez attendre plus que le temps/le texte :
- Attendre une URL (les globs pris en charge par Playwright) :
openclaw browser wait --url "**/dash"
- Attendre l’état de chargement :
openclaw browser wait --load networkidle
- Attendre un prédicat JS :
openclaw browser wait --fn "window.ready===true"
- Attendre qu’un sélecteur devienne visible :
openclaw browser wait "#main"
Ces éléments peuvent être combinés :
openclaw browser wait "#main" \ --url "**/dash" \ --load networkidle \ --fn "window.ready===true" \ --timeout-ms 15000Flux de travail de débogage
Section intitulée « Flux de travail de débogage »Lorsqu’une action échoue (par exemple, « non visible », « violation du mode strict », « couvert ») :
openclaw browser snapshot --interactive- Utilisez
click <ref>/type <ref>(préférez les références de rôle en mode interactif) - Si cela échoue toujours :
openclaw browser highlight <ref>pour voir ce que Playwright cible - Si la page se comporte bizarrement :
openclaw browser errors --clearopenclaw browser requests --filter api --clear
- Pour un débogage approfondi : enregistrez une trace :
openclaw browser trace start- reproduire le problème
openclaw browser trace stop(afficheTRACE:<path>)
Sortie JSON
Section intitulée « Sortie JSON »--json est destiné aux scripts et aux outils structurés.
Exemples :
openclaw browser status --jsonopenclaw browser snapshot --interactive --jsonopenclaw browser requests --filter api --jsonopenclaw browser cookies --jsonLes instantanés de rôles au format JSON incluent refs ainsi qu’un petit bloc stats (lignes/caractères/réfs/interactif) afin que les outils puissent évaluer la taille et la densité de la charge utile.
Contrôles d’état et d’environnement
Section intitulée « Contrôles d’état et d’environnement »Ceux-ci sont utiles pour les workflows « faire se comporter le site comme X » :
- Cookies :
cookies,cookies set,cookies clear - Stockage :
storage local|session get|set|clear - Hors ligne :
set offline on|off - En-têtes :
set headers --headers-json '{"X-Debug":"1"}'(l’ancienset headers --json '{"X-Debug":"1"}'reste pris en charge) - Authentification HTTP basique :
set credentials user pass(ou--clear) - Géolocalisation :
set geo <lat> <lon> --origin "https://example.com"(ou--clear) - Média :
set media dark|light|no-preference|none - Fuseau horaire / langue :
set timezone ...,set locale ... - Appareil / fenêtre d’affichage :
set device "iPhone 14"(préréglages d’appareils Playwright)set viewport 1280 720
Sécurité et confidentialité
Section intitulée « Sécurité et confidentialité »- Le profil de navigateur openclaw peut contenir des sessions connectées ; traitez-le comme sensible.
browser act kind=evaluate/openclaw browser evaluateetwait --fnexécutent du JavaScript arbitraire dans le contexte de la page. L’instruction (prompt injection) peut influencer ce comportement. Désactivez-le avecbrowser.evaluateEnabled=falsesi vous n’en avez pas besoin.- Utilisez
openclaw browser evaluate --timeout-ms <ms>lorsque la fonction côté page peut avoir besoin de plus de temps que le délai d’évaluation par défaut. - Pour les notes de connexion et anti-bot (X/Twitter, etc.), voir Connexion au navigateur + publication sur X/Twitter.
- Gardez l’hôte du Gateway/nœud privé (boucle locale ou tailnet uniquement).
- Les points de terminaison CDP distants sont puissants ; placez-les dans un tunnel et protégez-les.
Exemple en mode strict (bloquer les destinations privées/internal par défaut) :
{ browser: { ssrfPolicy: { dangerouslyAllowPrivateNetwork: false, hostnameAllowlist: ["*.example.com", "example.com"], allowedHostnames: ["localhost"], // optional exact allow }, },}Connexes
Section intitulée « Connexes »- Navigateur - aperçu, configuration, profils, sécurité
- Connexion au navigateur - connexion aux sites
- Dépannage du navigateur sur Linux
- Dépannage du navigateur sur WSL2