Tests : suites en direct

Pour un démarrage rapide, les runners QA, les suites de tests unitaires/d’intégration et les flux Docker, consultez Testing. Cette page couvre les suites de tests en direct (avec accès réseau) : matrice de modèles, backends CLI, ACP et tests en direct des fournisseurs de médias, ainsi que la gestion des identifiants.

En direct : commandes de fumée locales

Exportez la clé provider nécessaire dans l’environnement de processus avant les vérifications en direct ad hoc.

Smoke de média sécurisé :

pnpm openclaw infer tts convert --local --json \
  --text "OpenClaw live smoke." \
  --output /tmp/openclaw-live-smoke.mp3

Smoke de préparation à l’appel vocal sécurisé :

pnpm openclaw voicecall setup --json
pnpm openclaw voicecall smoke --to "+15555550123"

voicecall smoke est un essai à blanc (dry run) sauf si --yes est également présent. Utilisez --yes uniquement lorsque vous souhaitez intentionnellement passer un appel de notification réel. Pour Twilio, Telnyx et Plivo, une vérification de disponibilité réussie nécessite une URL de webhook publique ; les secours de boucle locale/privée sont rejetés par conception.

En direct : balayage des capacités de nœud Android

Test : src/gateway/android-node.capabilities.live.test.ts
Script : pnpm android:test:integration
Objectif : invoquer toutes les commandes actuellement annoncées par un nœud Android connecté et vérifier le comportement du contrat de commande.
Portée :
- Configuration préconditionnée/manuelle (la suite n’installe pas/n’exécute pas/n’apparie pas l’application).
- Validation commande par commande de la passerelle node.invokeAndroid pour le nœud Android sélectionné.
Configuration préalable requise :
- Application Android déjà connectée et appariée à la passerelle.
- Application gardée au premier plan.
- Autorisations/consentement de capture accordés pour les capacités que vous vous attendez à réussir.
Remplacements de cibles optionnels :
- OPENCLAW_ANDROID_NODE_ID ou OPENCLAW_ANDROID_NODE_NAME.
- OPENCLAW_ANDROID_GATEWAY_URL / OPENCLAW_ANDROID_GATEWAY_TOKEN / OPENCLAW_ANDROID_GATEWAY_PASSWORD.
Détails complets de la configuration Android : Android App

En direct : smoke de modèle (clés de profil)

Les tests en direct sont divisés en deux couches afin que nous puissions isoler les échecs :

“Direct model” nous indique si le provider/model peut répondre du tout avec la clé donnée.
“Gateway smoke” nous indique si le pipeline complet gateway+agent fonctionne pour ce modèle (sessions, historique, outils, stratégie de sandbox, etc.).

Couche 1 : Achèvement direct du model (sans passerelle)

Test : src/agents/models.profiles.live.test.ts
Objectif :
- Énumérer les models découverts
- Utilisez getApiKeyForModel pour sélectionner les modèles pour lesquels vous avez des identifiants
- Exécuter un petit achèvement par model (et régressions ciblées si nécessaire)
Comment activer :
- pnpm test:live (ou OPENCLAW_LIVE_TEST=1 si vous appelez Vitest directement)
Définissez OPENCLAW_LIVE_MODELS=modern, small ou all (alias pour moderne) pour exécuter réellement cette suite ; sinon, elle est ignorée pour garder pnpm test:live concentré sur le smoke de la passerelle
Comment sélectionner les models :
- OPENCLAW_LIVE_MODELS=modern pour exécuter la liste d’autorisation moderne (Opus/Sonnet 4.6+, GPT-5.2 + Codex, Gemini 3, DeepSeek V4, GLM 4.7, MiniMax M3, Grok 4.3)
- OPENCLAW_LIVE_MODELS=small pour exécuter la liste d’autorisation restreinte aux petits modèles (routes compatibles locales Qwen 8B/9B, Ollama Gemma, OpenRouter Qwen/GLM, et Z.AI GLM)
- OPENCLAW_LIVE_MODELS=all est un alias pour la liste d’autorisation moderne
- ou OPENCLAW_LIVE_MODELS="openai/gpt-5.5,anthropic/claude-opus-4-6,..." (liste d’autorisation par virgule)
- Les exécutions de petits modèles Ollama locaux utilisent par défaut http://127.0.0.1:11434 ; ne définissez OPENCLAW_LIVE_OLLAMA_BASE_URL que pour les points de terminaison LAN, personnalisés ou Ollama Cloud.
- Les balayages modernes/tous et ceux des petits modèles utilisent par défaut leurs plafonds triés sur le volet ; définissez OPENCLAW_LIVE_MAX_MODELS=0 pour un balayage exhaustif des profils sélectionnés ou un nombre positif pour un plafond plus petit.
- Les balayages exhaustifs utilisent OPENCLAW_LIVE_TEST_TIMEOUT_MS pour le délai d’expiration global du test de modèle direct. Par défaut : 60 minutes.
- Les sondes de modèle direct s’exécutent avec un parallélisme de 20 voies par défaut ; définissez OPENCLAW_LIVE_MODEL_CONCURRENCY pour remplacer.
Comment sélectionner les fournisseurs :
- OPENCLAW_LIVE_PROVIDERS="google,google-antigravity,google-gemini-cli" (liste d’autorisation séparée par des virgules)
D’où viennent les clés :
- Par défaut : magasin de profils et replis sur l’environnement (env)
- Définissez OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1 pour appliquer uniquement le magasin de profils
Pourquoi cela existe :
- Sépare « l’API du fournisseur est en panne / la clé n’est pas valide » de « le pipeline de l’agent Gateway est en panne »
- Contient de petites régressions isolées (exemple : flux de rejeu de raisonnement OpenAI Responses/Codex Responses + appels d’outils)

Couche 2 : Smoke test Gateway + agent de développement (ce que fait réellement « @openclaw »)

Test : src/gateway/gateway-models.profiles.live.test.ts
Objectif :
- Lancer une Gateway en cours de processus
- Créer/patcher une session agent:dev:* (remplacement de model par exécution)
- Itérer sur les models-with-keys et vérifier :
  - réponse « significative » (sans tools)
  - une invocation de tool réelle fonctionne (sonde de lecture)
  - sondes de tool supplémentaires optionnelles (sonde exec+read)
  - les chemins de régression OpenAI (tool-call-only → follow-up) continuent de fonctionner
Détails des sondes (pour que vous puissiez expliquer rapidement les échecs) :
- sonde read : le test écrit un fichier nonce dans l’espace de travail et demande à l’agent de read et de renvoyer le nonce.
- sonde exec+read : le test demande à l’agent de exec-écrire un nonce dans un fichier temporaire, puis de read.
- sonde image : le test joint un PNG généré (chat + code aléatoire) et s’attend à ce que le model renvoie cat <CODE>.
- Référence de l’implémentation : src/gateway/gateway-models.profiles.live.test.ts et test/helpers/live-image-probe.ts.
Comment activer :
- pnpm test:live (ou OPENCLAW_LIVE_TEST=1 si vous invoquez Vitest directement)
Comment sélectionner les models :
- Par défaut : liste d’autorisation moderne (Opus/Sonnet 4.6+, GPT-5.2 + Codex, Gemini 3, DeepSeek V4, GLM 4.7, MiniMax M3, Grok 4.3)
- OPENCLAW_LIVE_GATEWAY_MODELS=all est un alias pour la liste d’autorisation moderne
- Ou définissez OPENCLAW_LIVE_GATEWAY_MODELS="provider/model" (ou une liste séparée par des virgules) pour restreindre
- Les scans modernes/tous les gateway utilisent par défaut une plafond de signal élevé sélectionné ; définissez OPENCLAW_LIVE_GATEWAY_MAX_MODELS=0 pour un scan moderne exhaustif ou un nombre positif pour une plafond plus petit.
Comment sélectionner les fournisseurs (éviter « OpenRouter tout ») :
- OPENCLAW_LIVE_GATEWAY_PROVIDERS="google,google-antigravity,google-gemini-cli,openai,anthropic,zai,minimax" (liste d’autorisation séparée par des virgules)
Les sondes Tool + image sont toujours activées dans ce test en direct :
- sonde read + sonde exec+read (stress du tool)
- la sonde image s’exécute lorsque le model annonce la prise en charge des entrées d’image
- Flux (haut niveau) :
  - Le test génère un minuscule PNG avec « CAT » + code aléatoire (test/helpers/live-image-probe.ts)
  - L’envoie via agent attachments: [{ mimeType: "image/png", content: "<base64>" }]
  - Le Gateway analyse les pièces jointes en images[] (src/gateway/server-methods/agent.ts + src/gateway/chat-attachments.ts)
  - L’agent intégré transmet un message utilisateur multimodal au modèle
  - Assertion : la réponse contient cat + le code (tolérance OCR : erreurs mineures autorisées)

Live : CLI backend smoke (Claude, Gemini, ou autres CLIs locaux)

Test : src/gateway/gateway-cli-backend.live.test.ts
Objectif : valider le pipeline Gateway + agent en utilisant un backend CLI local, sans toucher à votre configuration par défaut.
Les valeurs par défaut de smoke spécifiques au backend se trouvent dans la définition cli-backend.ts de l’extension propriétaire.
Activer :
- pnpm test:live (ou OPENCLAW_LIVE_TEST=1 si vous invoquez Vitest directement)
- OPENCLAW_LIVE_CLI_BACKEND=1
Valeurs par défaut :
- Provider/modèle par défaut : claude-cli/claude-sonnet-4-6
- Le comportement de commande/args/image provient des métadonnées du plugin backend CLI propriétaire.
Remplacements (optionnel) :
- OPENCLAW_LIVE_CLI_BACKEND_MODEL="claude-cli/claude-sonnet-4-6"
- OPENCLAW_LIVE_CLI_BACKEND_COMMAND="/full/path/to/claude"
- OPENCLAW_LIVE_CLI_BACKEND_ARGS='["-p","--output-format","json"]'
- OPENCLAW_LIVE_CLI_BACKEND_IMAGE_PROBE=1 pour envoyer une vraie pièce jointe image (les chemins sont injectés dans le prompt). Les recettes Docker désactivent cela par défaut sauf demande explicite.
- OPENCLAW_LIVE_CLI_BACKEND_IMAGE_ARG="--image" pour passer les chemins des fichiers image en tant qu’args CLI au lieu de l’injection dans le prompt.
- OPENCLAW_LIVE_CLI_BACKEND_IMAGE_MODE="repeat" (ou "list") pour contrôler comment les args d’image sont passés quand IMAGE_ARG est défini.
- OPENCLAW_LIVE_CLI_BACKEND_RESUME_PROBE=1 pour envoyer un deuxième tour et valider le flux de reprise.
- OPENCLAW_LIVE_CLI_BACKEND_MODEL_SWITCH_PROBE=1 pour activer la sonde de continuité de même session Claude Sonnet -> Opus quand le modèle sélectionné prend en charge une cible de changement. Les recettes Docker désactivent cela par défaut pour une fiabilité agrégée.
- OPENCLAW_LIVE_CLI_BACKEND_MCP_PROBE=1 pour activer la sonde de boucle MCP/tool. Les recettes Docker désactivent cela par défaut sauf demande explicite.

Exemple :

  OPENCLAW_LIVE_CLI_BACKEND=1 \
  OPENCLAW_LIVE_CLI_BACKEND_MODEL="claude-cli/claude-sonnet-4-6" \
  pnpm test:live src/gateway/gateway-cli-backend.live.test.ts

Smoke de config MCP Gemini pas cher :

OPENCLAW_LIVE_TEST=1 \
  pnpm test:live src/agents/cli-runner/bundle-mcp.gemini.live.test.ts

Cela ne demande pas à Gemini de générer une réponse. Il écrit les mêmes paramètres système qu’OpenClaw fournit à Gemini, puis exécute gemini --debug mcp list pour prouver qu’un serveur transport: "streamable-http" enregistré est normalisé selon la forme HTTP MCP de Gemini et peut se connecter à un serveur MCP HTTP diffusable en local.

Recette Docker :

pnpm test:docker:live-cli-backend

Recettes Docker à fournisseur unique :

pnpm test:docker:live-cli-backend:claude
pnpm test:docker:live-cli-backend:claude-subscription
pnpm test:docker:live-cli-backend:gemini

Notes :

Le lanceur Docker se trouve à scripts/test-live-cli-backend-docker.sh.
Il exécute le test de fumée du backend CLI en direct dans l’image Docker du dépôt en tant qu’utilisateur node non root.
Il résout les métadonnées de test de fumée CLI à partir de l’extension propriétaire, puis installe le package Linux CLI correspondant (@anthropic-ai/claude-code ou @google/gemini-cli) dans un préfixe accessible en écriture mis en cache à OPENCLAW_DOCKER_CLI_TOOLS_DIR (par défaut : ~/.cache/openclaw/docker-cli-tools).
pnpm test:docker:live-cli-backend:claude-subscription nécessite un abonnement OAuth portable à Claude Code via ~/.claude/.credentials.json avec claudeAiOauth.subscriptionType ou CLAUDE_CODE_OAUTH_TOKEN de claude setup-token. Il prouve d’abord le claude -p direct dans Docker, puis exécute deux tours backend Gateway CLI sans préserver les variables d’environnement de clé API Anthropic API. Cet abonnement désactive les sondes MCP/tool et d’image de Claude par défaut, car Claude achemine actuellement l’utilisation des applications tierces via une facturation supplémentaire au lieu des limites normales du plan d’abonnement.
Le test de fumée du backend CLI en direct exerce désormais le même flux de bout en bout pour Claude et Gemini : tour de texte, tour de classification d’image, puis appel d’outil MCP cron vérifié via le CLI de passerelle.
Le test de fumée par défaut de Claude modifie également la session de Sonnet à Opus et vérifie que la session reprise se souvient encore d’une note antérieure.

Live : Accessibilité du proxy HTTP/2 APNs

Test : src/infra/push-apns-http2.live.test.ts
Objectif : établir un tunnel via un proxy HTTP CONNECT local vers le point de terminaison APNs de bac à sable (sandbox) d’Apple, envoyer la requête de validation HTTP/2 APNs et vérifier que la véritable réponse 403 InvalidProviderToken d’Apple est renvoyée via le chemin du proxy.
Activer :
- OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_APNS_REACHABILITY=1 pnpm test:live src/infra/push-apns-http2.live.test.ts
Délai d’expiration (timeout) optionnel :
- OPENCLAW_LIVE_APNS_TIMEOUT_MS=30000

Live : test de fumace ACP bind (`/acp spawn ... --bind here`)

Test : src/gateway/gateway-acp-bind.live.test.ts
Objectif : valider le flux réel de conversation-bind ACP avec un agent ACP en direct :
- envoyer /acp spawn <agent> --bind here
- lier (bind) une conversation synthétique de message-channel en place
- envoyer un suivi normal sur cette même conversation
- vérifier que le suivi arrive dans la transcription de la session ACP liée
Activer :
- pnpm test:live src/gateway/gateway-acp-bind.live.test.ts
- OPENCLAW_LIVE_ACP_BIND=1
Valeurs par défaut :
- Agents ACP dans Docker : claude,codex,gemini
- Agent ACP pour pnpm test:live ... direct : claude
- Canal synthétique : contexte de conversation style DM Slack
- Backend ACP : acpx
Remplacements :
- OPENCLAW_LIVE_ACP_BIND_AGENT=claude
- OPENCLAW_LIVE_ACP_BIND_AGENT=codex
- OPENCLAW_LIVE_ACP_BIND_AGENT=droid
- OPENCLAW_LIVE_ACP_BIND_AGENT=gemini
- OPENCLAW_LIVE_ACP_BIND_AGENT=opencode
- OPENCLAW_LIVE_ACP_BIND_AGENTS=claude,codex,gemini
- OPENCLAW_LIVE_ACP_BIND_AGENT_COMMAND='npx -y @agentclientprotocol/claude-agent-acp@<version>'
- OPENCLAW_LIVE_ACP_BIND_CODEX_MODEL=gpt-5.5
- OPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL=opencode/kimi-k2.6
- OPENCLAW_LIVE_ACP_BIND_REQUIRE_TRANSCRIPT=1
- OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1
- OPENCLAW_LIVE_ACP_BIND_PARENT_MODEL=openai/gpt-5.5
Notes :
- Ce parcours utilise la surface chat.send de la passerelle avec des champs de route d’origine (originating-route) synthétiques réservés aux administrateurs, afin que les tests puissent attacher du contexte de message-channel sans prétendre livrer le message à l’extérieur.
- Lorsque OPENCLAW_LIVE_ACP_BIND_AGENT_COMMAND n’est pas défini, le test utilise le registre d’agents intégré du plugin acpx pour l’agent de harnais ACP sélectionné.
- La création de MCP cron pour la session liée (bound-session) est au mieux possible (best-effort) par défaut, car les harnais ACP externes peuvent annuler les appels MCP une fois la liaison/preuve d’image (bind/image proof) réussie ; définissez OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1 pour rendre cette sonde cron post-liaison stricte.

Exemple :

OPENCLAW_LIVE_ACP_BIND=1 \
  OPENCLAW_LIVE_ACP_BIND_AGENT=claude \
  pnpm test:live src/gateway/gateway-acp-bind.live.test.ts

Recette Docker :

pnpm test:docker:live-acp-bind

Recettes Docker à agent unique :

pnpm test:docker:live-acp-bind:claude
pnpm test:docker:live-acp-bind:codex
pnpm test:docker:live-acp-bind:droid
pnpm test:docker:live-acp-bind:gemini
pnpm test:docker:live-acp-bind:opencode

Notes Docker :

Le lanceur Docker réside dans Dockerscripts/test-live-acp-bind-docker.sh.
Par défaut, il exécute le test de fumée de liaison ACP (ACP bind smoke) contre les agents CLI live agrégés en séquence : CLIclaude, codex, puis gemini.
Utilisez OPENCLAW_LIVE_ACP_BIND_AGENTS=claude, OPENCLAW_LIVE_ACP_BIND_AGENTS=codex, OPENCLAW_LIVE_ACP_BIND_AGENTS=droid, OPENCLAW_LIVE_ACP_BIND_AGENTS=gemini ou OPENCLAW_LIVE_ACP_BIND_AGENTS=opencode pour restreindre la matrice.
Il prépare les éléments d’authentification CLI correspondants dans le conteneur, puis installe la CLI live demandée (CLICLI@anthropic-ai/claude-code, @openai/codex, Factory Droid via https://app.factory.ai/cli, @google/gemini-cli ou opencode-ai) si elle est manquante. Le backend ACP lui-même est le package acpx/runtime intégré du plugin officiel acpx.
La variante Docker Droid prépare Docker~/.factory pour les paramètres, transfère FACTORY_API_KEYAPIOAuth et nécessite cette clé API car l’authentification OAuth/porte-clés Factory locale n’est pas portable dans le conteneur. Elle utilise l’entrée de registre droid exec --output-format acp intégrée d’ACPX.
La variante Docker OpenCode est une voie de régression stricte à agent unique. Elle écrit un modèle DockerOPENCODE_CONFIG_CONTENT par défaut temporaire à partir de OPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL (opencode/kimi-k2.6 par défaut), et pnpm test:docker:live-acp-bind:opencode nécessite une transcription d’assistant lié au lieu d’accepter l’oubli générique post-liaison.
Les appels CLI acpxCLIGatewayDockerOpenClaw directs ne constituent qu’une voie manuelle/de contournement pour comparer le comportement en dehors de la Gateway. Le test de fumée de liaison ACP Docker exerce le backend d’exécution acpx intégré d’OpenClaw.

Live: Codex app-server harness smoke

Objectif : valider le harnais Codex détenu par le plugin via la méthode normale de passerelle agent :
- charger le plugin codex groupé
- sélectionner openai/gpt-5.5, qui achemine les tours d’agent OpenAI via Codex par défaut
- envoyer un premier tour d’agent de passerelle à openai/gpt-5.5 avec le harnais Codex sélectionné
- envoyer un second tour à la même session OpenClaw et vérifier que le fil de discussion du serveur d’application peut reprendre
- exécuter /codex status et /codex models via le même chemin de commande de passerelle
- exécuter facultativement deux sondes de shell escaladées et examinées par Guardian : une commande bénigne qui devrait être approuvée et un faux téléversement de secret qui devrait être refusé pour que l’agent redemande
Test : src/gateway/gateway-codex-harness.live.test.ts
Activer : OPENCLAW_LIVE_CODEX_HARNESS=1
Modèle par défaut : openai/gpt-5.5
Sonde d’image facultative : OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1
Sonde MCP/outil facultative : OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1
Sonde Guardian facultative : OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1
Le test de fumée force le fournisseur/modèle agentRuntime.id: "codex" pour qu’un harnais Codex défaillant ne puisse pas passer en revenant silencieusement à OpenClaw.
Auth : auth du serveur d’application Codex depuis la connexion d’abonnement Codex local. Les tests de fumée Docker peuvent également fournir OPENAI_API_KEY pour les sondes non-Codex le cas échéant, plus des ~/.codex/auth.json et ~/.codex/config.toml copiés facultatifs.

Recette locale :

OPENCLAW_LIVE_CODEX_HARNESS=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_MODEL=openai/gpt-5.5 \
  pnpm test:live -- src/gateway/gateway-codex-harness.live.test.ts

Recette Docker :

pnpm test:docker:live-codex-harness

Notes Docker :

Le lanceur Docker se trouve à scripts/test-live-codex-harness-docker.sh.
Il transmet OPENAI_API_KEYCLI, copie les fichiers d’auth CLI Codex lorsqu’ils sont présents, installe @openai/codex dans un préfixe npm monté en écriture, prépare l’arborescence source, puis exécute uniquement le test en direct du harnais Codex.
Docker active par défaut les sondages d’image, MCP/tool et Guardian. Définissez OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=0 ou OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=0 ou OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=0 lorsque vous avez besoin d’un exécution de débogage plus ciblée.
Docker utilise la même configuration d’exécution explicite de Codex, donc les alias hérités ou le repli OpenClaw ne peuvent pas masquer une régression du harnais Codex.

Recettes live recommandées

Les listes d’autorisation étroites et explicites sont les plus rapides et les moins instables :

Modèle unique, direct (sans passerelle) :
- OPENCLAW_LIVE_MODELS="openai/gpt-5.5" pnpm test:live src/agents/models.profiles.live.test.ts
Profil direct pour petit modèle :
- OPENCLAW_LIVE_MODELS=small pnpm test:live src/agents/models.profiles.live.test.ts
Test de fumée de l’Ollama Cloud API :
- OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_OLLAMA=1 OPENCLAW_LIVE_OLLAMA_BASE_URL=https://ollama.com OPENCLAW_LIVE_OLLAMA_MODEL=glm-5.1:cloud OPENCLAW_LIVE_OLLAMA_WEB_SEARCH=0 pnpm test:live -- extensions/ollama/ollama.live.test.ts
Modèle unique, test de fumée de passerelle :
- OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
Appel de tool sur plusieurs fournisseurs :
- OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3-flash-preview,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M3" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
Focus Google (clé API Gemini + Antigravity) :
- Gemini (clé API) : OPENCLAW_LIVE_GATEWAY_MODELS="google/gemini-3-flash-preview" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
- Antigravity (OAuth) : OPENCLAW_LIVE_GATEWAY_MODELS="google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-pro-high" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
Test de fumée de la pensée adaptative Google :
- Gemini 3 dynamique par défaut : pnpm openclaw qa manual --provider-mode live-frontier --model google/gemini-3.1-pro-preview --alt-model google/gemini-3.1-pro-preview --message '/think adaptive Reply exactly: GEMINI_ADAPTIVE_OK' --timeout-ms 180000
- Gemini 2.5 budget dynamique : pnpm openclaw qa manual --provider-mode live-frontier --model google/gemini-2.5-flash --alt-model google/gemini-2.5-flash --message '/think adaptive Reply exactly: GEMINI25_ADAPTIVE_OK' --timeout-ms 180000

Notes :

google/... utilise le API Gemini (clé API).
google-antigravity/... utilise le pont OAuth Antigravity (point de terminaison d’agent style Cloud Code Assist).
google-gemini-cli/... utilise le CLI Gemini local sur votre machine (auth distincte + bizarreries de tooling).
API Gemini vs CLI Gemini :
- API : OpenClaw appelle le API Gemini hébergé par Google via HTTP (clé API / auth par profil) ; c’est ce que la plupart des utilisateurs entendent par « Gemini ».
- CLI : OpenClaw délègue à un binaire gemini local ; il possède sa propre auth et peut se comporter différemment (support de streaming/tool / décalage de version).

Live : matrice de modèles (ce que nous couvrons)

Il n’y a pas de « liste de models CI » fixe (les tests en direct sont facultatifs), mais voici les models recommandés à couvrir régulièrement sur une machine de développement avec des clés.

Ensemble de tests de fumée modernes (tool calling + image)

Voici l’exécution des « models communs » que nous nous attendons à voir fonctionner :

OpenAI (non-Codex) : openai/gpt-5.5
OpenAI ChatGPT/Codex OAuth : openai/gpt-5.5
Anthropic : anthropic/claude-opus-4-6 (ou anthropic/claude-sonnet-4-6)
Google (Gemini API) : google/gemini-3.1-pro-preview et google/gemini-3-flash-preview (éviter les anciens models Gemini 2.x)
Google (Antigravity) : google-antigravity/claude-opus-4-6-thinking et google-antigravity/gemini-3-flash
DeepSeek : deepseek/deepseek-v4-flash et deepseek/deepseek-v4-pro
Z.AI (GLM) : zai/glm-5.1
MiniMax : minimax/MiniMax-M3

Exécuter le test de fumée de la passerelle avec tools + image : OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3.1-pro-preview,google/gemini-3-flash-preview,google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-flash,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M3" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts

Référence : tool calling (Read + Exec optionnel)

Choisissez au moins un par famille de providers :

OpenAI : openai/gpt-5.5
Anthropic : anthropic/claude-opus-4-6 (ou anthropic/claude-sonnet-4-6)
Google : google/gemini-3-flash-preview (ou google/gemini-3.1-pro-preview)
DeepSeek : deepseek/deepseek-v4-flash
Z.AI (GLM) : zai/glm-5.1
MiniMax : minimax/MiniMax-M3

Couverture supplémentaire optionnelle (la bienvenue) :

xAI : xai/grok-4.3 (ou la dernière disponible)
Mistral : mistral/… (choisissez un model capable « tools » que vous avez activé)
Cerebras : cerebras/… (si vous y avez accès)
LM Studio : lmstudio/… (local ; le tool calling dépend du mode API)

Vision : envoi d’image (pièce jointe → message multimodal)

Incluez au moins un model compatible image dans OPENCLAW_LIVE_GATEWAY_MODELS (variantes Claude/Gemini/OpenAI compatibles vision, etc.) pour tester la sonde d’image.

Agrégateurs / passerelles alternatives

Si vous avez des clés activées, nous prenons également en charge les tests via :

OpenRouter : openrouter/... (des centaines de modèles ; utilisez openclaw models scan pour trouver les candidats compatibles avec les outils et les images)
OpenCode : opencode/... pour Zen et opencode-go/... pour Go (auth via OPENCODE_API_KEY / OPENCODE_ZEN_API_KEY)

Davantage de fournisseurs que vous pouvez inclure dans la matrice en direct (si vous avez des identifiants/config) :

Intégrés : openai, anthropic, google, google-vertex, google-antigravity, google-gemini-cli, zai, openrouter, opencode, opencode-go, xai, groq, cerebras, mistral, github-copilot
Via models.providers (points de terminaison personnalisés) : minimax (cloud/API), ainsi que tout proxy compatible OpenAI/Anthropic (LM Studio, vLLM, LiteLLM, etc.)

Identifiants (ne jamais commiter)

Les tests en direct découvrent les identifiants de la même manière que le CLI. Conséquences pratiques :

Si le CLI fonctionne, les tests en direct devraient trouver les mêmes clés.
Si un test en direct indique “pas d’identifiants”, débuguez de la même manière que vous débugueriez openclaw models list / la sélection de modèle.
Profils d’authentification par agent : ~/.openclaw/agents/<agentId>/agent/auth-profiles.json (c’est ce que “clés de profil” signifie dans les tests en direct)
Config : ~/.openclaw/openclaw.json (ou OPENCLAW_CONFIG_PATH)
Répertoire d’état hérité : ~/.openclaw/credentials/ (copié dans le répertoire principal intermédiaire en direct lorsqu’il est présent, mais pas le stockage principal des clés de profil)
Les exécutions locales en direct copient la configuration active, les fichiers auth-profiles.json par agent, l’ancien credentials/CLI et les répertoires d’authentification CLI externes pris en charge dans un répertoire de test temporaire par défaut ; les homes en direct intermédiaires ignorent workspace/ et sandboxes/, et les remplacements de chemin agents.*.workspace / agentDir sont supprimés pour que les sondes restent hors de votre espace de travail hôte réel.

Si vous souhaitez vous fier aux clés d’environnement, exportez-les avant les tests locaux ou utilisez les exécuteurs Docker ci-dessous avec un OPENCLAW_PROFILE_FILE explicite.

Deepgram live (transcription audio)

Test : extensions/deepgram/audio.live.test.ts
Activer : DEEPGRAM_API_KEY=... DEEPGRAM_LIVE_TEST=1 pnpm test:live extensions/deepgram/audio.live.test.ts

BytePlus coding plan live

Test : extensions/byteplus/live.test.ts
Activer : BYTEPLUS_API_KEY=... BYTEPLUS_LIVE_TEST=1 pnpm test:live extensions/byteplus/live.test.ts
Remplacement de model facultatif : BYTEPLUS_CODING_MODEL=ark-code-latest

ComfyUI workflow media live

Test : extensions/comfy/comfy.live.test.ts
Activer : OPENCLAW_LIVE_TEST=1 COMFY_LIVE_TEST=1 pnpm test:live -- extensions/comfy/comfy.live.test.ts
Portée :
- Exerce les chemins d’image, vidéo et music_generate comfy regroupés
- Ignore chaque capacité sauf si plugins.entries.comfy.config.<capability> est configuré
- Utile après avoir modifié la soumission, l’interrogation, les téléchargements ou l’enregistrement des plugins du workflow comfy

Génération d’images en direct

Test : test/image-generation.runtime.live.test.ts
Commande : pnpm test:live test/image-generation.runtime.live.test.ts
Harnais : pnpm test:live:media image
Portée :
- Énumère chaque plugin de provider de génération d’images enregistré
- Utilise les variables d’environnement provider déjà exportées avant le sondage
- Utilise les clés API live/env avant les profils d’authentification stockés par défaut, afin que les clés de test obsolètes dans auth-profiles.json ne masquent pas les identifiants réels du shell
- Ignore les providers sans auth/profil/model utilisable
- Exécute chaque provider configuré via le runtime de génération d’images partagé :
  - <provider>:generate
  - <provider>:edit lorsque le provider déclare prendre en charge la modification
Providers regroupés actuels couverts :
- deepinfra
- fal
- google
- minimax
- openai
- openrouter
- vydra
- xai
Rétrécissement facultatif :
- OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="openai,google,openrouter,xai"
- OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="deepinfra"
- OPENCLAW_LIVE_IMAGE_GENERATION_MODELS="openai/gpt-image-2,google/gemini-3.1-flash-image-preview,openrouter/google/gemini-3.1-flash-image-preview,xai/grok-imagine-image"
- OPENCLAW_LIVE_IMAGE_GENERATION_CASES="google:flash-generate,google:pro-edit,openrouter:generate,xai:default-generate,xai:default-edit"
Comportement d’authentification facultatif :
- OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1 pour forcer l’authentification du magasin de profils et ignorer les remplacements uniquement par env

Pour le chemin CLI livré, ajoutez un test infer après la réussite du test en direct du provider/runtime :

OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_INFER_CLI_TEST=1 pnpm test:live -- test/image-generation.infer-cli.live.test.ts
openclaw infer image providers --json
openclaw infer image generate \
  --model google/gemini-3.1-flash-image-preview \
  --prompt "Minimal flat test image: one blue square on a white background, no text." \
  --output ./openclaw-infer-image-smoke.png \
  --json

Cela couvre l’analyse des arguments CLI, la résolution config/default-agent, l’activation des plugins groupés, le runtime de génération d’images partagé et la demande de provider en direct. Les dépendances des plugins sont censées être présentes avant le chargement du runtime.

Génération de musique en direct

Test : extensions/music-generation-providers.live.test.ts
Activer : OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/music-generation-providers.live.test.ts
Harnais : pnpm test:live:media music
Portée :
- Exerce le chemin de provider de génération de musique groupé partagé
- Couvre actuellement Google et MiniMax
- Utilise les env vars de provider déjà exportés avant le sondage
- Utilise par défaut les clés API live/env avant les profils d’authentification stockés, afin que les clés de test périmées dans auth-profiles.json ne masquent pas les identifiants réels du shell
- Ignore les providers sans auth/profile/model utilisable
- Exécute les deux modes de runtime déclarés lorsque disponibles :
  - generate avec saisie de type prompt uniquement
  - edit lorsque le provider déclare capabilities.edit.enabled
- Couverture actuelle de la voie partagée :
  - google : generate, edit
  - minimax : generate
  - comfy : fichier live Comfy séparé, pas ce balayage partagé
Rétrécissement facultatif :
- OPENCLAW_LIVE_MUSIC_GENERATION_PROVIDERS="google,minimax"
- OPENCLAW_LIVE_MUSIC_GENERATION_MODELS="google/lyria-3-clip-preview,minimax/music-2.6"
Comportement d’authentification facultatif :
- OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1 pour forcer l’authentification du magasin de profils et ignorer les remplacements uniquement par env

Génération de vidéo en direct

Test : extensions/video-generation-providers.live.test.ts
Activer : OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/video-generation-providers.live.test.ts
Harnais : pnpm test:live:media video
Portée :
- Teste le chemin de provider de génération vidéo groupé partagé
- Par défaut, utilise le chemin de test smoke sûr pour la release : providers non-FAL, une requête texte-vers-vidéo par provider, un prompt homard d’une seconde, et une limite d’opérations par provider issue de OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS (180000 par défaut)
- Ignore FAL par défaut car la latence de la file d’attente côté provider peut dominer le temps de release ; passez --video-providers fal ou OPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="fal" pour l’exécuter explicitement
- Utilise les variables d’environnement de provider déjà exportées avant de sonder
- Utilise par défaut les clés API live/env avant les profils d’authentification stockés, afin que les clés de test obsolètes dans auth-profiles.json ne masquent pas les véritables identifiants du shell
- Ignore les providers sans authentification/profil/modèle utilisable
- N’exécute que generate par défaut
- Définissez OPENCLAW_LIVE_VIDEO_GENERATION_FULL_MODES=1 pour exécuter également les modes de transformation déclarés lorsque disponibles :
  - imageToVideo lorsque le provider déclare capabilities.imageToVideo.enabled et que le provider/modèle sélectionné accepte les entrées d’image locales basées sur des tampons dans le sweep partagé
  - videoToVideo lorsque le provider déclare capabilities.videoToVideo.enabled et que le provider/modèle sélectionné accepte les entrées de vidéo locales basées sur des tampons dans le sweep partagé
- Providers imageToVideo déclarés mais ignorés actuellement dans le sweep partagé :
  - vydra car veo3 groupé est texte uniquement et kling groupé nécessite une URL d’image distante
- Couverture Vydra spécifique au provider :
  - OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_VYDRA_VIDEO=1 pnpm test:live -- extensions/vydra/vydra.live.test.ts
  - ce fichier exécute du texte-vers-vidéo veo3 plus un canal kling qui utilise par défaut une fixture d’URL d’image distante
- Couverture live videoToVideo actuelle :
  - runway uniquement lorsque le modèle sélectionné est runway/gen4_aleph
- Providers videoToVideo déclarés mais ignorés actuellement dans le sweep partagé :
  - alibaba, qwen, xai car ces chemins nécessitent actuellement des URLs de référence http(s) / MP4 distantes
  - google car la voie partagée Gemini/Véo actuelle utilise une entrée soutenue par un tampon local et ce chemin n’est pas accepté dans le balayage partagé
  - openai car la voie partagée actuelle ne dispose pas de garanties d’accès à l’édition vidéo spécifiques à l’organisation
Rétrécissement facultatif :
- OPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="deepinfra,google,openai,runway"
- OPENCLAW_LIVE_VIDEO_GENERATION_MODELS="google/veo-3.1-fast-generate-preview,openai/sora-2,runway/gen4_aleph"
- OPENCLAW_LIVE_VIDEO_GENERATION_SKIP_PROVIDERS="" pour inclure chaque provider dans le balayage par défaut, y compris FAL
- OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS=60000 pour réduire la limite d’opérations de chaque provider pour un test de fumée agressif
Comportement d’auth facultatif :
- OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1 pour forcer l’auth du magasin de profils et ignorer les substitutions uniquement env

Harnais de live média

Commande : pnpm test:live:media
Objectif :
- Exécute les suites de live d’image, de musique et de vidéo partagées via un point d’entrée natif du dépôt
- Utilise les env vars de provider déjà exportées
- Rétrécit automatiquement chaque suite aux providers qui ont actuellement une auth utilisable par défaut
- Réutilise scripts/test-live.mjs, donc le comportement du heartbeat et du mode silencieux reste cohérent
Exemples :
- pnpm test:live:media
- pnpm test:live:media image video --providers openai,google,minimax
- pnpm test:live:media video --video-providers openai,runway --all-providers
- pnpm test:live:media music --quiet

Connexes

Testing - suites unitaires, d’intégration, QA et Docker

Tests : suites en direct

En direct : commandes de fumée locales

En direct : balayage des capacités de nœud Android

En direct : smoke de modèle (clés de profil)

Couche 1 : Achèvement direct du model (sans passerelle)

Couche 2 : Smoke test Gateway + agent de développement (ce que fait réellement « @openclaw »)

Live : CLI backend smoke (Claude, Gemini, ou autres CLIs locaux)

Live : Accessibilité du proxy HTTP/2 APNs

Live : test de fumace ACP bind (/acp spawn ... --bind here)

Live: Codex app-server harness smoke

Recettes live recommandées

Live : matrice de modèles (ce que nous couvrons)

Ensemble de tests de fumée modernes (tool calling + image)

Référence : tool calling (Read + Exec optionnel)

Vision : envoi d’image (pièce jointe → message multimodal)

Agrégateurs / passerelles alternatives

Identifiants (ne jamais commiter)

Deepgram live (transcription audio)

BytePlus coding plan live

ComfyUI workflow media live

Génération d’images en direct

Génération de musique en direct

Génération de vidéo en direct

Harnais de live média

Connexes

Live : test de fumace ACP bind (`/acp spawn ... --bind here`)