Ir al contenido

Proveedores de modelos

Referencia de proveedores de modelos/LLM (no canales de chat como WhatsApp/Telegram). Para ver las reglas de selección de modelos, consulte Modelos.

Referencias de modelos y asistentes de CLI
  • Las referencias de modelos usan provider/model (ejemplo: opencode/claude-opus-4-6).
  • agents.defaults.models actúa como una lista de permitidos cuando se establece.
  • Asistentes de CLI: openclaw onboard, openclaw models list, `openclaw models set

. - models.providers..contextWindow/contextTokens/maxTokensestablecen valores predeterminados a nivel de proveedor;models.providers..models[].contextWindow/contextTokens/maxTokens` los anulan por modelo. - Reglas de reserva, sondas de enfriamiento y persistencia de anulación de sesión: Conmutación por error de modelo.

Añadir autenticación del proveedor no cambia su modelo principal

openclaw configure conserva un agents.defaults.model.primary existente cuando añade o reautentica un proveedor. openclaw models auth login hace lo mismo a menos que pase --set-default. Los complementos del proveedor aún pueden devolver un modelo predeterminado recomendado en su parche de configuración de autenticación, pero OpenClaw lo trata como “hacer disponible este modelo” cuando ya existe un modelo principal, no como “reemplazar el modelo principal actual”.

Para cambiar intencionalmente el modelo predeterminado, use `openclaw models set

oopenclaw models auth login —provider

—set-default`.

División de proveedor/tiempo de ejecución de OpenAI

Las rutas de la familia OpenAI son específicas del prefijo:

  • `openai/

usa el arnés nativo del servidor de aplicaciones Codex para los turnos del agente de forma predeterminada. Esta es la configuración de suscripción habitual de ChatGPT/Codex. -openai-codex/

es una configuración heredada que el doctor reescribe aopenai/

. - openai/

más proveedor/modeloagentRuntime.id: “pi”` usa PI para rutas de clave de API explícita o compatibilidad.

Consulte [OpenAI](/es/providers/openai) y [Arnés de Codex](/es/plugins/codex-harness). Si la división de proveedor/tiempo de ejecución es confusa, lea [Tiempos de ejecución de agentes](/es/concepts/agent-runtimes) primero.
La activación automática de complementos sigue el mismo límite: las referencias de agente `openai/*` activan el complemento Codex para la ruta predeterminada, y las referencias explícitas de proveedor/modelo `agentRuntime.id: "codex"` o heredadas `codex/

` también lo requieren.

GPT-5.5 está disponible a través del arnés nativo del servidor de aplicaciones Codex de forma predeterminada en `openai/gpt-5.5`, y solo a través de PI cuando la política de tiempo de ejecución de proveedor/modelo selecciona explícitamente `pi`.
CLI runtimes

Los tiempos de ejecución de la CLI utilizan la misma división: elija referencias de modelos canónicas como anthropic/claude-* o google/gemini-*, luego establezca la política de tiempo de ejecución del proveedor/modelo en claude-cli o google-gemini-cli cuando desee un backend de CLI local.

Las referencias heredadas claude-cli/* y google-gemini-cli/* migran de nuevo a las referencias de proveedor canónicas con el tiempo de ejecución registrado por separado. Las referencias heredadas codex-cli/* migran a openai/* y utilizan la ruta del servidor de aplicaciones de Codex; OpenClaw ya no mantiene un backend de CLI de Codex incluido.

Comportamiento del proveedor propiedad del complemento

Sección titulada «Comportamiento del proveedor propiedad del complemento»

La mayor parte de la lógica específica del proveedor reside en los complementos del proveedor (registerProvider(...)), mientras que OpenClaw mantiene el bucle de inferencia genérico. Los complementos son responsables de la incorporación, catálogos de modelos, mapeo de variables de entorno de autenticación, normalización de transporte/configuración, limpieza de esquemas de herramientas, clasificación de conmutación por error, actualización de OAuth, informes de uso, perfiles de pensamiento/razonamiento y más.

La lista completa de enlaces de SDK del proveedor y ejemplos de plugins empaquetados se encuentra en Provider plugins. Un proveedor que necesita un ejecutor de solicitudes totalmente personalizado es una superficie de extensión separada y más profunda.

Key sources and priority

Configure varias claves mediante:

  • `OPENCLAW_LIVE_

_KEY(anulación única en vivo, prioridad más alta) -

_API_KEYS(lista separada por comas o punto y coma) -

_API_KEY(clave principal) -

API_KEY*(lista numerada, p. ej.,

_API_KEY_1`)

Para los proveedores de Google, `GOOGLE_API_KEY` también se incluye como alternativa. El orden de selección de claves preserva la prioridad y elimina duplicados de los valores.
Cuándo se activa la rotación
  • Las solicitudes se reintentan con la siguiente clave solo en respuestas de límite de velocidad (por ejemplo 429, rate_limit, quota, resource exhausted, Too many concurrent requests, ThrottlingException, concurrency limit reached, workers_ai ... quota limit exceeded, o mensajes periódicos de límite de uso).
  • Los fallos que no son por límite de velocidad fallan inmediatamente; no se intenta la rotación de claves.
  • Cuando fallan todas las claves candidatas, se devuelve el error final del último intento.

OpenClaw se distribuye con el catálogo pi-ai. Estos proveedores no requieren configuración de models.providers; simplemente configure la autenticación y elija un modelo.

  • Proveedor: openai
  • Autenticación: OPENAI_API_KEY
  • Rotación opcional: OPENAI_API_KEYS, OPENAI_API_KEY_1, OPENAI_API_KEY_2, además de OPENCLAW_LIVE_OPENAI_KEY (anulación única)
  • Modelos de ejemplo: openai/gpt-5.5, openai/gpt-5.4-mini
  • Verifique la disponibilidad de la cuenta/modelo con openclaw models list --provider openai si una instalación o clave de API específica se comporta de manera diferente.
  • CLI: openclaw onboard --auth-choice openai-api-key
  • El transporte predeterminado es auto; OpenClaw pasa la elección de transporte a pi-ai.
  • Anular por modelo mediante agents.defaults.models["openai/<model>"].params.transport ("sse", "websocket" o "auto")
  • El procesamiento prioritario de OpenAI se puede habilitar mediante agents.defaults.models["openai/<model>"].params.serviceTier
  • /fast y params.fastMode mapean las solicitudes directas de openai/* Responses a service_tier=priority en api.openai.com
  • Use params.serviceTier cuando desee un nivel explícito en lugar del interruptor compartido /fast
  • Los encabezados ocultos de atribución de OpenClaw (originator, version, User-Agent) se aplican solo en el tráfico nativo de OpenAI hacia api.openai.com, no en proxies compatibles con OpenAI genéricos
  • Las rutas nativas de OpenAI también mantienen store de Responses, sugerencias de caché de prompts y modelado de carga útil compatible con el razonamiento de OpenAI; las rutas de proxy no
  • openai/gpt-5.3-codex-spark se suprime intencionalmente en OpenClaw porque las solicitudes en vivo de la API de OpenAI la rechazan y el catálogo actual de Codex no la expone
{
agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },
}
  • Proveedor: anthropic
  • Autenticación: ANTHROPIC_API_KEY
  • Rotación opcional: ANTHROPIC_API_KEYS, ANTHROPIC_API_KEY_1, ANTHROPIC_API_KEY_2, más OPENCLAW_LIVE_ANTHROPIC_KEY (anulación única)
  • Modelo de ejemplo: anthropic/claude-opus-4-6
  • CLI: openclaw onboard --auth-choice apiKey
  • Las solicitudes públicas directas a Anthropic admiten el interruptor compartido /fast y params.fastMode, incluyendo el tráfico autenticado por clave de API y OAuth enviado a api.anthropic.com; OpenClaw lo mapea a service_tier de Anthropic (auto vs standard_only)
  • La configuración preferida de la CLI de Claude mantiene la referencia del modelo canónica y selecciona el backend de la CLI por separado: anthropic/claude-opus-4-7 con agentRuntime.id: "claude-cli" con ámbito de modelo. Las referencias heredadas claude-cli/claude-opus-4-7 todavía funcionan por compatibilidad.
{
agents: { defaults: { model: { primary: "anthropic/claude-opus-4-6" } } },
}
  • Proveedor: openai-codex
  • Autenticación: OAuth (ChatGPT)
  • Referencia heredada de modelo de PI: openai-codex/gpt-5.5
  • Referencia de arnés nativo del servidor de aplicaciones de Codex: openai/gpt-5.5
  • Documentos del arnés del servidor de aplicaciones nativo de Codex: Codex harness
  • Referencias de modelos heredadas: codex/gpt-*
  • Límite del complemento (Plugin boundary): openai-codex/* carga el complemento de OpenAI; el complemento nativo del servidor de aplicaciones de Codex se selecciona solo mediante el tiempo de ejecución del arnés de Codex o las referencias codex/* heredadas.
  • CLI: openclaw onboard --auth-choice openai-codex o openclaw models auth login --provider openai-codex
  • El transporte predeterminado es auto (prioridad WebSocket, alternativa SSE)
  • Anular por modelo de PI mediante agents.defaults.models["openai-codex/<model>"].params.transport ("sse", "websocket" o "auto")
  • params.serviceTier también se reenvía en las solicitudes de respuestas de Codex nativas (chatgpt.com/backend-api)
  • Los encabezados de atribución ocultos de OpenClaw (originator, version, User-Agent) solo se adjuntan en el tráfico nativo de Codex hacia chatgpt.com/backend-api, no en los proxies compatibles con OpenAI genéricos
  • Comparte el mismo botón de alternancia /fast y la configuración params.fastMode que openai/* directo; OpenClaw asigna eso a service_tier=priority
  • openai-codex/gpt-5.5 utiliza el contextWindow = 400000 nativo del catálogo de Codex y el tiempo de ejecución predeterminado contextTokens = 272000; anule el límite del tiempo de ejecución con models.providers.openai-codex.models[].contextTokens
  • Nota de política: OpenAI Codex OAuth es explícitamente compatible con herramientas/flujos de trabajo externos como OpenClaw.
  • Para la ruta común de suscripción más el tiempo de ejecución nativo de Codex, inicie sesión con la autenticación openai-codex pero configure openai/gpt-5.5; el agente de OpenAI selecciona Codex de forma predeterminada.
  • Use el proveedor/modelo agentRuntime.id: "pi" solo cuando desee una ruta de compatibilidad a través de PI; de lo contrario, mantenga openai/gpt-5.5 en el arnés de Codex predeterminado.
  • Las referencias openai-codex/gpt-* siguen siendo una ruta heredada de PI. Prefiera openai/gpt-5.5 en el tiempo de ejecución nativo de Codex para la configuración de nuevos agentes, y ejecute openclaw doctor --fix cuando desee migrar referencias antiguas de openai-codex/* a referencias canónicas openai/*.
{
plugins: { entries: { codex: { enabled: true } } },
agents: {
defaults: {
model: { primary: "openai/gpt-5.5" },
},
},
}
{
models: {
providers: {
"openai-codex": {
models: [{ id: "gpt-5.5", contextTokens: 160000 }],
},
},
},
}

Otras opciones alojadas de estilo de suscripción

Sección titulada «Otras opciones alojadas de estilo de suscripción»
Modelos GLM

Plan de codificación Z.AI o puntos finales de API generales.

MiniMax

Plan de codificación MiniMax OAuth o acceso con clave de API.

Qwen Cloud

Superficie del proveedor Qwen Cloud además de Alibaba DashScope y la asignación de puntos finales del Plan de codificación.

  • Autenticación: OPENCODE_API_KEY (o OPENCODE_ZEN_API_KEY)
  • Proveedor de tiempo de ejecución Zen: opencode
  • Proveedor de tiempo de ejecución Go: opencode-go
  • Modelos de ejemplo: opencode/claude-opus-4-6, opencode-go/kimi-k2.6
  • CLI: openclaw onboard --auth-choice opencode-zen o openclaw onboard --auth-choice opencode-go
{
agents: { defaults: { model: { primary: "opencode/claude-opus-4-6" } } },
}
  • Proveedor: google
  • Autenticación: GEMINI_API_KEY
  • Rotación opcional: GEMINI_API_KEYS, GEMINI_API_KEY_1, GEMINI_API_KEY_2, respaldo GOOGLE_API_KEY y OPENCLAW_LIVE_GEMINI_KEY (anulación única)
  • Modelos de ejemplo: google/gemini-3.1-pro-preview, google/gemini-3-flash-preview
  • Compatibilidad: la configuración heredada de OpenClaw que usa google/gemini-3.1-flash-preview se normaliza a google/gemini-3-flash-preview
  • Alias: google/gemini-3.1-pro se acepta y normaliza al id de la API en vivo de Gemini de Google, google/gemini-3.1-pro-preview
  • CLI: openclaw onboard --auth-choice gemini-api-key
  • Thinking: /think adaptive usa el pensamiento dinámico de Google. Gemini 3/3.1 omiten un thinkingLevel fijo; Gemini 2.5 envía thinkingBudget: -1.
  • Las ejecuciones directas de Gemini también aceptan agents.defaults.models["google/<model>"].params.cachedContent (o el heredado cached_content) para reenviar un identificador cachedContents/... nativo del proveedor; los aciertos de caché de Gemini aparecen como cacheRead de OpenClaw
  • Proveedores: google-vertex, google-gemini-cli
  • Autenticación: Vertex usa ADC de gcloud; la CLI de Gemini usa su flujo OAuth

Gemini CLI OAuth se incluye como parte del complemento incluido google.

  1. Instalar CLI de Gemini

    Ventana de terminal
    brew install gemini-cli
  2. Enable plugin

    Ventana de terminal
    openclaw plugins enable google
  3. Iniciar sesión

    Ventana de terminal
    openclaw models auth login --provider google-gemini-cli --set-default

    Modelo predeterminado: google-gemini-cli/gemini-3-flash-preview. No debes pegar un id de cliente ni un secreto en openclaw.json. El flujo de inicio de sesión de CLI almacena los tokens en perfiles de autenticación en el host de la puerta de enlace.

  4. Establecer proyecto (si es necesario)

    Si las solicitudes fallan después de iniciar sesión, establece GOOGLE_CLOUD_PROJECT o GOOGLE_CLOUD_PROJECT_ID en el host de la puerta de enlace.

Las respuestas JSON de Gemini CLI se analizan desde response; el uso retrocede a stats, con stats.cached normalizado en cacheRead de OpenClaw.

  • Proveedor: zai
  • Autenticación: ZAI_API_KEY
  • Modelo de ejemplo: zai/glm-5.1
  • CLI: openclaw onboard --auth-choice zai-api-key
    • Alias: z.ai/* y z-ai/* se normalizan a zai/*
    • zai-api-key detecta automáticamente el punto final de Z.AI coincidente; zai-coding-global, zai-coding-cn, zai-global y zai-cn fuerzan una superficie específica
  • Proveedor: vercel-ai-gateway
  • Autenticación: AI_GATEWAY_API_KEY
  • Modelos de ejemplo: vercel-ai-gateway/anthropic/claude-opus-4.6, vercel-ai-gateway/moonshotai/kimi-k2.6
  • CLI: openclaw onboard --auth-choice ai-gateway-api-key
  • Proveedor: kilocode
  • Autenticación: KILOCODE_API_KEY
  • Modelo de ejemplo: kilocode/kilo/auto
  • CLI: openclaw onboard --auth-choice kilocode-api-key
  • URL base: https://api.kilo.ai/api/gateway/
  • El catálogo estático de reserva incluye kilocode/kilo/auto; el descubrimiento https://api.kilo.ai/api/gateway/models en vivo puede expandir aún más el catálogo de tiempo de ejecución.
  • El enrutamiento ascendente exacto detrás de kilocode/kilo/auto es propiedad de Kilo Gateway, no está codificado en OpenClaw.

Consulte /providers/kilocode para obtener detalles de configuración.

ProveedorIdEntorno de autenticaciónModelo de ejemplo
BytePlusbyteplus / byteplus-planBYTEPLUS_API_KEYbyteplus-plan/ark-code-latest
CerebrascerebrasCEREBRAS_API_KEYcerebras/zai-glm-4.7
Cloudflare AI Gatewaycloudflare-ai-gatewayCLOUDFLARE_AI_GATEWAY_API_KEY-
DeepInfradeepinfraDEEPINFRA_API_KEYdeepinfra/deepseek-ai/DeepSeek-V3.2
DeepSeekdeepseekDEEPSEEK_API_KEYdeepseek/deepseek-v4-flash
GitHub Copilotgithub-copilotCOPILOT_GITHUB_TOKEN / GH_TOKEN / GITHUB_TOKEN-
GroqgroqGROQ_API_KEY-
Hugging Face InferencehuggingfaceHUGGINGFACE_HUB_TOKEN o HF_TOKENhuggingface/deepseek-ai/DeepSeek-R1
Kilo GatewaykilocodeKILOCODE_API_KEYkilocode/kilo/auto
Kimi CodingkimiKIMI_API_KEY o KIMICODE_API_KEYkimi/kimi-for-coding
MiniMaxminimax / minimax-portalMINIMAX_API_KEY / MINIMAX_OAUTH_TOKENminimax/MiniMax-M2.7
MistralmistralMISTRAL_API_KEYmistral/mistral-large-latest
MoonshotmoonshotMOONSHOT_API_KEYmoonshot/kimi-k2.6
NVIDIAnvidiaNVIDIA_API_KEYnvidia/nvidia/nemotron-3-super-120b-a12b
OpenRouteropenrouterOPENROUTER_API_KEYopenrouter/auto
QianfanqianfanQIANFAN_API_KEYqianfan/deepseek-v3.2
Qwen CloudqwenQWEN_API_KEY / MODELSTUDIO_API_KEY / DASHSCOPE_API_KEYqwen/qwen3.5-plus
StepFunstepfun / stepfun-planSTEPFUN_API_KEYstepfun/step-3.5-flash
TogethertogetherTOGETHER_API_KEYtogether/moonshotai/Kimi-K2.5
VeniceveniceVENICE_API_KEY-
Vercel AI Gatewayvercel-ai-gatewayAI_GATEWAY_API_KEYvercel-ai-gateway/anthropic/claude-opus-4.6
Volcano Engine (Doubao)volcengine / volcengine-planVOLCANO_ENGINE_API_KEYvolcengine-plan/ark-code-latest
xAIxaiSuperGrok/X Premium OAuth o XAI_API_KEYxai/grok-4.3
XiaomixiaomiXIAOMI_API_KEYxiaomi/mimo-v2-flash
OpenRouter

Aplica sus encabezados de atribución de la aplicación y los marcadores cache_control de Anthropic solo en las rutas openrouter.ai verificadas. Las referencias de DeepSeek, Moonshot y ZAI son elegibles para el TTL de caché para el almacenamiento en caché de avisos gestionado por OpenRouter, pero no reciben marcadores de caché de Anthropic. Como una ruta compatible con OpenAI de estilo proxy, omite el modelado nativo solo de OpenAI (serviceTier, Respuestas store, sugerencias de caché de avisos, compatibilidad de razonamiento de OpenAI). Las referencias con tecnología de Gemini mantienen únicamente la saneamiento de la firma de pensamiento del proxy-Gemini.

Kilo Gateway

Las referencias respaldadas por Gemini siguen la misma ruta de saneamiento de proxy-Gemini; kilocode/kilo/auto y otras referencias no compatibles con el razonamiento de proxy omiten la inyección de razonamiento de proxy.

MiniMax

La incorporación de API-key escribe definiciones explícitas de modelos de chat M2.7 solo de texto; la comprensión de imágenes se mantiene en el proveedor de medios MiniMax-VL-01 propiedad del complemento.

NVIDIA

Los IDs de modelo utilizan un espacio de nombres `nvidia/

/

(por ejemplonvidia/nvidia/nemotron-…junto connvidia/moonshotai/kimi-k2.5); los selectores conservan la composición literal

/

` mientras que la clave canónica enviada a la API se mantiene con un solo prefijo.

xAI

Utiliza la ruta de Respuestas de xAI. La ruta recomendada es SuperGrok/X Premium OAuth; las claves de API aún funcionan a través de XAI_API_KEY o la configuración del plugin. grok-4.3 es el modelo de chat predeterminado incluido. /fast o params.fastMode: true reescriben grok-3, grok-3-mini, grok-4 y grok-4-0709 a sus variantes *-fast. tool_stream está activado de forma predeterminada; desactívelo mediante `agents.defaults.models[“xai/

“].params.tool_stream=false`.

Cerebras

Se envía como el plugin de proveedor cerebras incluido. GLM usa zai-glm-4.7; la URL base compatible con OpenAI es https://api.cerebras.ai/v1.

Proveedores a través de models.providers (URL personalizada/base)

Sección titulada «Proveedores a través de models.providers (URL personalizada/base)»

Use models.providers (o models.json) para agregar proveedores personalizados o proxys compatibles con OpenAI/Anthropic.

Muchos de los plugins de proveedor incluidos a continuación ya publican un catálogo predeterminado. Use entradas explícitas models.providers.<id> solo cuando desee anular la URL base, los encabezados o la lista de modelos predeterminados.

Las comprobaciones de capacidad del modelo de puerta de enlace también leen metadatos explícitos models.providers.<id>.models[]. Si un modelo personalizado o proxy acepta imágenes, establezca input: ["text", "image"] en ese modelo para que las rutas de archivos adjuntos de WebChat y de origen de nodo pasen las imágenes como entradas de modelo nativas en lugar de referencias de medios solo de texto.

agents.defaults.models["provider/model"] solo controla la visibilidad del modelo, los alias y los metadatos por modelo para los agentes. Por sí mismo, no registra un nuevo modelo en tiempo de ejecución. Para modelos de proveedores personalizados, también agregue models.providers.<provider>.models[] con al menos el id coincidente.

Moonshot se incluye como un complemento de proveedor incluido. Use el proveedor integrado de forma predeterminada y agregue una entrada explícita de models.providers.moonshot solo cuando necesite anular la URL base o los metadatos del modelo:

  • Proveedor: moonshot
  • Autenticación: MOONSHOT_API_KEY
  • Modelo de ejemplo: moonshot/kimi-k2.6
  • CLI: openclaw onboard --auth-choice moonshot-api-key o openclaw onboard --auth-choice moonshot-api-key-cn

IDs de modelos Kimi K2:

  • moonshot/kimi-k2.6
  • moonshot/kimi-k2.5
  • moonshot/kimi-k2-thinking
  • moonshot/kimi-k2-thinking-turbo
  • moonshot/kimi-k2-turbo
{
agents: {
defaults: { model: { primary: "moonshot/kimi-k2.6" } },
},
models: {
mode: "merge",
providers: {
moonshot: {
baseUrl: "https://api.moonshot.ai/v1",
apiKey: "${MOONSHOT_API_KEY}",
api: "openai-completions",
models: [{ id: "kimi-k2.6", name: "Kimi K2.6" }],
},
},
},
}

Kimi Coding utiliza el punto de conexión compatible con Anthropic de Moonshot AI:

  • Proveedor: kimi
  • Autenticación: KIMI_API_KEY
  • Modelo de ejemplo: kimi/kimi-for-coding
{
env: { KIMI_API_KEY: "sk-..." },
agents: {
defaults: { model: { primary: "kimi/kimi-for-coding" } },
},
}

Los identificadores de modelo heredados kimi/kimi-code y kimi/k2p5 siguen siendo aceptados como identificadores de modelos de compatibilidad y se normalizan al ID del modelo API estable de Kimi.

Volcano Engine (火山引擎) proporciona acceso a Doubao y otros modelos en China.

  • Proveedor: volcengine (codificación: volcengine-plan)
  • Autenticación: VOLCANO_ENGINE_API_KEY
  • Modelo de ejemplo: volcengine-plan/ark-code-latest
  • CLI: openclaw onboard --auth-choice volcengine-api-key
{
agents: {
defaults: { model: { primary: "volcengine-plan/ark-code-latest" } },
},
}

La incorporación se predetermina a la superficie de codificación, pero el catálogo general volcengine/* se registra al mismo tiempo.

En los selectores de modelo de incorporación/configuración, la elección de autenticación de Volcengine prefiere las filas volcengine/* y volcengine-plan/*. Si esos modelos aún no se han cargado, OpenClaw recurre al catálogo sin filtrar en lugar de mostrar un selector con ámbito de proveedor vacío.

  • volcengine/doubao-seed-1-8-251228 (Doubao Seed 1.8)
  • volcengine/doubao-seed-code-preview-251028
  • volcengine/kimi-k2-5-260127 (Kimi K2.5)
  • volcengine/glm-4-7-251222 (GLM 4.7)
  • volcengine/deepseek-v3-2-251201 (DeepSeek V3.2 128K)

BytePlus ARK proporciona acceso a los mismos modelos que Volcano Engine para usuarios internacionales.

  • Proveedor: byteplus (código: byteplus-plan)
  • Autenticación: BYTEPLUS_API_KEY
  • Modelo de ejemplo: byteplus-plan/ark-code-latest
  • CLI: openclaw onboard --auth-choice byteplus-api-key
{
agents: {
defaults: { model: { primary: "byteplus-plan/ark-code-latest" } },
},
}

La incorporación por defecto es para la superficie de código, pero el catálogo general byteplus/* se registra al mismo tiempo.

En la incorporación/configuración de selectores de modelos, la elección de autenticación de BytePlus prefiere tanto las filas byteplus/* como byteplus-plan/*. Si esos modelos aún no se han cargado, OpenClaw recurre al catálogo sin filtrar en lugar de mostrar un selector vacío con ámbito de proveedor.

  • byteplus/seed-1-8-251228 (Semilla 1.8)
  • byteplus/kimi-k2-5-260127 (Kimi K2.5)
  • byteplus/glm-4-7-251222 (GLM 4.7)

Synthetic proporciona modelos compatibles con Anthropic detrás del proveedor synthetic:

  • Proveedor: synthetic
  • Autenticación: SYNTHETIC_API_KEY
  • Modelo de ejemplo: synthetic/hf:MiniMaxAI/MiniMax-M2.5
  • CLI: openclaw onboard --auth-choice synthetic-api-key
{
agents: {
defaults: { model: { primary: "synthetic/hf:MiniMaxAI/MiniMax-M2.5" } },
},
models: {
mode: "merge",
providers: {
synthetic: {
baseUrl: "https://api.synthetic.new/anthropic",
apiKey: "${SYNTHETIC_API_KEY}",
api: "anthropic-messages",
models: [{ id: "hf:MiniMaxAI/MiniMax-M2.5", name: "MiniMax M2.5" }],
},
},
},
}

MiniMax se configura a través de models.providers porque utiliza endpoints personalizados:

  • MiniMax OAuth (Global): --auth-choice minimax-global-oauth
  • MiniMax OAuth (CN): --auth-choice minimax-cn-oauth
  • MiniMax API key (Global): --auth-choice minimax-global-api
  • MiniMax API key (CN): --auth-choice minimax-cn-api
  • Autenticación: MINIMAX_API_KEY para minimax; MINIMAX_OAUTH_TOKEN o MINIMAX_API_KEY para minimax-portal

Consulte /providers/minimax para obtener detalles de configuración, opciones de modelo y fragmentos de configuración.

División de capacidades propiedad del complemento:

  • Los valores predeterminados de texto/chat se mantienen en minimax/MiniMax-M2.7
  • La generación de imágenes es minimax/image-01 o minimax-portal/image-01
  • La comprensión de imágenes es MiniMax-VL-01 propiedad del complemento en ambas rutas de autenticación de MiniMax
  • La búsqueda web se mantiene en el ID de proveedor minimax

LM Studio se incluye como un complemento de proveedor agrupado que utiliza la API nativa:

  • Proveedor: lmstudio
  • Autenticación: LM_API_TOKEN
  • URL base de inferencia predeterminada: http://localhost:1234/v1

Luego configure un modelo (reemplácelo con uno de los IDs devueltos por http://localhost:1234/api/v1/models):

{
agents: {
defaults: { model: { primary: "lmstudio/openai/gpt-oss-20b" } },
},
}

OpenClaw utiliza los /api/v1/models y /api/v1/models/load nativos de LM Studio para el descubrimiento y la carga automática, con /v1/chat/completions para la inferencia de forma predeterminada. Si desea que la carga JIT, el TTL y la expulsión automática de LM Studio sean propietarios del ciclo de vida del modelo, configure models.providers.lmstudio.params.preload: false. Consulte /providers/lmstudio para la configuración y solución de problemas.

Ollama se incluye como un complemento de proveedor agrupado y utiliza la API nativa de Ollama:

  • Proveedor: ollama
  • Autenticación: No se requiere (servidor local)
  • Modelo de ejemplo: ollama/llama3.3
  • Instalación: https://ollama.com/download
Ventana de terminal
# Install Ollama, then pull a model:
ollama pull llama3.3
{
agents: {
defaults: { model: { primary: "ollama/llama3.3" } },
},
}

Ollama se detecta localmente en http://127.0.0.1:11434 cuando opta por participar con OLLAMA_API_KEY, y el complemento de proveedor incluido añade Ollama directamente a openclaw onboard y al selector de modelos. Consulte /providers/ollama para el incorporation, modo nube/local y configuración personalizada.

vLLM se incluye como un complemento de proveedor agrupado para servidores compatibles con OpenAI locales/autoalojados:

  • Proveedor: vllm
  • Autenticación: Opcional (depende de su servidor)
  • URL base predeterminada: http://127.0.0.1:8000/v1

Para activar el autodescubrimiento local (cualquier valor funciona si su servidor no impone autenticación):

Ventana de terminal
export VLLM_API_KEY="vllm-local"

Luego configure un modelo (reemplácelo con uno de los IDs devueltos por /v1/models):

{
agents: {
defaults: { model: { primary: "vllm/your-model-id" } },
},
}

Consulte /providers/vllm para obtener detalles.

SGLang se distribuye como un complemento de proveedor incluido para servidores compatibles con OpenAI autoalojados rápidos:

  • Proveedor: sglang
  • Autenticación: Opcional (depende de su servidor)
  • URL base predeterminada: http://127.0.0.1:30000/v1

Para optar por el autodescubrimiento local (cualquier valor funciona si su servidor no exige autenticación):

Ventana de terminal
export SGLANG_API_KEY="sglang-local"

Luego configure un modelo (reemplácelo con uno de los IDs devueltos por /v1/models):

{
agents: {
defaults: { model: { primary: "sglang/your-model-id" } },
},
}

Consulte /providers/sglang para obtener más detalles.

Proxies locales (LM Studio, vLLM, LiteLLM, etc.)

Sección titulada «Proxies locales (LM Studio, vLLM, LiteLLM, etc.)»

Ejemplo (compatible con OpenAI):

{
agents: {
defaults: {
model: { primary: "lmstudio/my-local-model" },
models: { "lmstudio/my-local-model": { alias: "Local" } },
},
},
models: {
providers: {
lmstudio: {
baseUrl: "http://localhost:1234/v1",
apiKey: "${LM_API_TOKEN}",
api: "openai-completions",
timeoutSeconds: 300,
models: [
{
id: "my-local-model",
name: "Local Model",
reasoning: false,
input: ["text"],
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
contextWindow: 200000,
maxTokens: 8192,
},
],
},
},
},
}
Default optional fields

Para proveedores personalizados, reasoning, input, cost, contextWindow y maxTokens son opcionales. Cuando se omiten, OpenClaw usa por defecto:

  • reasoning: false
  • input: ["text"]
  • cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }
  • contextWindow: 200000
  • maxTokens: 8192

Recomendado: establezca valores explícitos que coincidan con los límites de su proxy/modelo.

Reglas de conformación de rutas de proxy
  • Para api: "openai-completions" en puntos finales no nativos (cualquier baseUrl no vacío cuyo host no sea api.openai.com), OpenClaw fuerza compat.supportsDeveloperRole: false para evitar errores 400 del proveedor por roles developer no compatibles.
  • Las rutas compatibles con OpenAI de estilo proxy también omiten la conformación de solicitudes exclusiva de OpenAI nativa: sin service_tier, sin Responses store, sin Completions store, sin sugerencias de caché de indicaciones, sin conformación de carga útil compatible con el razonamiento de OpenAI y sin encabezados de atribución ocultos de OpenClaw.
  • Para los proxies de Completions compatibles con OpenAI que necesitan campos específicos del proveedor, establezca agents.defaults.models["provider/model"].params.extra_body (o extraBody) para fusionar JSON adicional en el cuerpo de la solicitud saliente.
  • Para los controles de plantillas de chat de vLLM, establezca agents.defaults.models["provider/model"].params.chat_template_kwargs. El complemento vLLM incluido envía automáticamente enable_thinking: false y force_nonempty_content: true para vllm/nemotron-3-* cuando el nivel de pensamiento de la sesión está desactivado.
  • Para modelos locales lentos o hosts remotos de LAN/tailnet, establezca `models.providers.

.timeoutSeconds. Esto extiende el manejo de solicitudes HTTP del modelo de proveedor, incluida la conexión, los encabezados, la transmisión del cuerpo y la interrupción total de la recuperación protegida, sin aumentar el tiempo de espera de ejecución del agente completo. Si agents.defaults.timeoutSecondso un tiempo de espera específico de la ejecución es menor, aumente también ese límite; los tiempos de espera del proveedor no pueden extender toda la ejecución. - Las llamadas HTTP del proveedor de modelos permiten respuestas DNS de IP falsas de Surge, Clash y sing-box en198.18.0.0/15yfc00::/7solo para el nombre de host del proveedorbaseUrlconfigurado. Los puntos finales del proveedor personalizados locales también confían en ese origenscheme://host:portconfigurado exacto para solicitudes de modelos protegidas, incluidos los hosts de loopback, LAN y tailnet. Esta no es una nueva opción de configuración; elbaseUrlque configure extiende la política de solicitud solo para ese origen. La允许encia del nombre de host de IP falsa y la confianza de origen exacto son mecanismos independientes. Otros destinos privados, de loopback, de enlace local, de metadatos y puertos diferentes aún requieren una aceptación explícita demodels.providers.

.request.allowPrivateNetwork: true. Establezca models.providers.

.request.allowPrivateNetwork: falsepara no participar en la confianza de origen exacto. - SibaseUrlestá vacío/omitido, OpenClaw mantiene el comportamiento predeterminado de OpenAI (que se resuelve enapi.openai.com). - Por seguridad, un compat.supportsDeveloperRole: trueexplícito todavía se anula en los puntos finalesopenai-completionsno nativos. - Paraapi: “anthropic-messages”en puntos finales no directos (cualquier proveedor que no sea elanthropiccanónico, o unmodels.providers.anthropic.baseUrlpersonalizado cuyo host no sea un punto finalapi.anthropic.compúblico), OpenClaw suprime los encabezados beta implícitos de Anthropic, comoclaude-code-20250219, interleaved-thinking-2025-05-14y los marcadores de OAuth, para que los proxies compatibles con Anthropic personalizados no rechacen las marcas beta no compatibles. Establezcamodels.providers.

.headers[“anthropic-beta”]` explícitamente si su proxy necesita funciones beta específicas.

Ventana de terminal
openclaw onboard --auth-choice opencode-zen
openclaw models set opencode/claude-opus-4-6
openclaw models list

Consulte también: Configuration para ver ejemplos completos de configuración.