OpenAI

OpenAI proporciona API de desarrollador para modelos GPT, y Codex también está disponible como agente de codificación con plan ChatGPT a través de los clientes de Codex de OpenAI. OpenClaw mantiene esas superficies separadas para que la configuración sea predecible.

OpenClaw utiliza openai/* como la ruta de modelo canónica de OpenAI. El agente integrado activa los modelos de OpenAI que se ejecutan a través del tiempo de ejecución del servidor de aplicaciones nativo de Codex de forma predeterminada; la autenticación directa con clave de API de OpenAI sigue disponible para superficies de OpenAI que no son de agentes, como imágenes, incrustaciones, voz y tiempo real.

Modelos de agente - modelos openai/* a través del tiempo de ejecución de Codex; inicie sesión con la autenticación de Codex para el uso de suscripción a ChatGPT/Codex, o configure una copia de seguridad de clave de API de OpenAI compatible con Codex cuando desee intencionalmente la autenticación con clave de API.
APIs de OpenAI sin agente - acceso directo a la plataforma OpenAI con facturación basada en el uso a través de OPENAI_API_KEY o incorporación de clave de API de OpenAI.
Configuración heredada - las referencias de modelo openai-codex/* se reparan mediante openclaw doctor --fix a openai/* además del tiempo de ejecución de Codex.

OpenAI admite explícitamente el uso de OAuth de suscripción en herramientas y flujos de trabajo externos como OpenClaw.

El proveedor, el modelo, el tiempo de ejecución y el canal son capas separadas. Si esas etiquetas se están mezclando, lea Tiempos de ejecución del agente antes de cambiar la configuración.

Elección rápida

Objetivo	Uso	Notas
Suscripción ChatGPT/Codex con runtime nativo de Codex	`openai/gpt-5.5`	Configuración predeterminada del agente OpenAI. Inicie sesión con la autenticación de Codex.
Facturación directa con clave de API para modelos de agente	`openai/gpt-5.5` más un perfil de clave de API compatible con Codex	Use `auth.order.openai` para colocar la copia de seguridad después de la autenticación de suscripción.
Facturación directa con clave de API a través de PI explícito	`openai/gpt-5.5` más el tiempo de ejecución del proveedor/modelo `pi`	Seleccione un perfil de clave de API normal `openai`.
Alias de la API Instant más reciente de ChatGPT	`openai/chat-latest`	Solo clave de API directa. Alias móvil para experimentos, no el predeterminado.
Autenticación de suscripción ChatGPT/Codex a través de PI explícito	`openai/gpt-5.5` más el tiempo de ejecución del proveedor/modelo `pi`	Seleccione un perfil de autenticación `openai-codex` para la ruta de compatibilidad.
Generación o edición de imágenes	`openai/gpt-image-2`	Funciona con `OPENAI_API_KEY` u OAuth de OpenAI Codex.
Imágenes con fondo transparente	`openai/gpt-image-1.5`	Use `outputFormat=png` o `webp` y `openai.background=transparent`.

Mapa de nombres

Los nombres son similares pero no intercambiables:

Nombre que ves	Capa	Significado
`openai`	Prefijo del proveedor	Ruta canónica del modelo de OpenAI; los turnos del agente usan el tiempo de ejecución de Codex.
`openai-codex`	Prefijo de autenticación/perfil heredado	Espacio de nombres del perfil de OAuth/suscripción antiguo de OpenAI Codex. Los perfiles existentes y `auth.order.openai-codex` todavía funcionan.
complemento `codex`	Complemento	Complemento incluido en OpenClaw que proporciona el tiempo de ejecución nativo del servidor de aplicaciones Codex y controles de chat `/codex`.
proveedor/modelo `agentRuntime.id: codex`	Tiempo de ejecución del agente	Forzar el arnés nativo del servidor de aplicaciones de Codex para los turnos integrados coincidentes.
`/codex ...`	Conjunto de comandos de chat	Vincular/Controlar hilos del servidor de aplicaciones de Codex desde una conversación.
`runtime: "acp", agentId: "codex"`	Ruta de sesión ACP	Ruta de reserva explícita que ejecuta Codex a través de ACP/acpx.

Esto significa que una configuración puede contener intencionalmente referencias de modelos openai/* mientras los perfiles de autenticación siguen apuntando a credenciales compatibles con Codex. Prefiera auth.order.openai para nuevas configuraciones; los perfiles openai-codex:* existentes y auth.order.openai-codex siguen siendo compatibles. openclaw doctor --fix reescribe las referencias de modelos openai-codex/* heredadas a la ruta canónica del modelo OpenAI.

Cobertura de funciones de OpenClaw

Capacidad de OpenAI	Superficie de OpenClaw	Estado
Chat / Respuestas	proveedor del modelo `openai/<model>`	Sí
Modelos de suscripción Codex	`openai/<model>` con OAuth `openai-codex`	Sí
Referencias de modelo Codex heredadas	`openai-codex/<model>` o `codex-cli/<model>`	Reparado por doctor a `openai/<model>`
Arnés de Codex app-server	`openai/<model>` con tiempo de ejecución omitido o proveedor/modelo `agentRuntime.id: codex`	Sí
Búsqueda web en el lado del servidor	Herramienta nativa OpenAI Responses	Sí, cuando la búsqueda web está habilitada y ningún proveedor está fijado
Imágenes	`image_generate`	Sí
Videos	`video_generate`	Sí
Texto a voz	`messages.tts.provider: "openai"` / `tts`	Sí
Voz a texto por lotes	`tools.media.audio` / comprensión de medios	Sí
Voz a texto en streaming	Llamada de voz `streaming.provider: "openai"`	Sí
Voz en tiempo real	Llamada de voz `realtime.provider: "openai"` / Talk de interfaz de control	Sí
Incrustaciones	proveedor de incrustación de memoria	Sí

Incrustaciones de memoria

OpenClaw puede usar OpenAI, o un punto final de incrustación compatible con OpenAI, para incrustaciones de indexación y consultas de memory_search:

{
  agents: {
    defaults: {
      memorySearch: {
        provider: "openai",
        model: "text-embedding-3-small",
      },
    },
  },
}

Para los puntos de conexión compatibles con OpenAI que requieren etiquetas de incrustación asimétricas, configure queryInputType y documentInputType bajo memorySearch. OpenClaw reenvía esos como campos de solicitud input_type específicos del proveedor: las incrustaciones de consultas usan queryInputType; los fragmentos de memoria indexados y la indexación por lotes usan documentInputType. Consulte la Referencia de configuración de memoria para ver el ejemplo completo.

Comenzando

Elija su método de autenticación preferido y siga los pasos de configuración.

Mejor para: acceso directo a la API y facturación basada en el uso.

Obtén tu clave de API
Crea o copia una clave de API desde el panel de la plataforma de OpenAI.

Ejecuta la incorporación

openclaw onboard --auth-choice openai-api-key

O pasa la clave directamente:

openclaw onboard --openai-api-key "$OPENAI_API_KEY"

Verifica que el modelo esté disponible
Ventana de terminal
```
openclaw models list --provider openai
```

Resumen de rutas

Ref. de modelo	Config. de tiempo de ejecución	Ruta	Autenticación
`openai/gpt-5.5`	omitido / provider/model `agentRuntime.id: "codex"`	Arnés del servidor de aplicaciones Codex	Perfil de OpenAI compatible con Codex
`openai/gpt-5.4-mini`	omitido / provider/model `agentRuntime.id: "codex"`	Arnés del servidor de aplicaciones Codex	Perfil de OpenAI compatible con Codex
`openai/gpt-5.5`	provider/model `agentRuntime.id: "pi"`	Tiempo de ejecución integrado de PI	Perfil `openai` o perfil `openai-codex` seleccionado

Ejemplo de configuración

{
  env: { OPENAI_API_KEY: "sk-..." },
  agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },
}

Para probar el modelo Instant actual de ChatGPT desde la API de OpenAI, establece el modelo en openai/chat-latest:

{
  env: { OPENAI_API_KEY: "sk-..." },
  agents: { defaults: { model: { primary: "openai/chat-latest" } } },
}

chat-latest es un alias en movimiento. OpenAI lo documenta como el modelo Instant más reciente utilizado en ChatGPT y recomienda gpt-5.5 para el uso de la API en producción, así que mantén openai/gpt-5.5 como el predeterminado estable a menos que desees explícitamente ese comportamiento de alias. El alias actualmente acepta solo la verbosidad de texto medium, por lo que OpenClaw normaliza las anulaciones incompatibles de verbosidad de texto de OpenAI para este modelo.

Mejor para: usar tu suscripción a ChatGPT/Codex con la ejecución nativa del servidor de aplicaciones Codex en lugar de una clave de API separada. La nube de Codex requiere el inicio de sesión en ChatGPT.

Ejecutar Codex OAuth
Ventana de terminal
```
openclaw onboard --auth-choice openai-codex
```
O ejecute OAuth directamente:
Ventana de terminal
```
openclaw models auth login --provider openai-codex
```
Para configuraciones sin interfaz gráfica o hostiles a las devoluciones de llamada, añada --device-code para iniciar sesión con un flujo de código de dispositivo de ChatGPT en lugar de la devolución de llamada del navegador localhost:
Ventana de terminal
```
openclaw models auth login --provider openai-codex --device-code
```
Usar la ruta canónica del modelo OpenAI
Ventana de terminal
```
openclaw config set agents.defaults.model.primary openai/gpt-5.5
```
No se requiere configuración de tiempo de ejecución para la ruta predeterminada. Los giros del agente OpenAI seleccionan automáticamente el tiempo de ejecución del servidor de aplicaciones Codex nativo, y OpenClaw instala o repara el complemento Codex incluido cuando se elige esta ruta.
Verificar que la autenticación de Codex está disponible
Ventana de terminal
```
openclaw models list --provider openai-codex
```
Después de que la puerta de enlace se esté ejecutando, envíe /codex status o /codex models en el chat para verificar el tiempo de ejecución del servidor de aplicaciones nativo.

Resumen de rutas

Referencia del modelo	Configuración de tiempo de ejecución	Ruta	Autenticación
`openai/gpt-5.5`	omitido / proveedor/modelo `agentRuntime.id: "codex"`	Arnés del servidor de aplicaciones Codex nativo	Inicio de sesión de Codex o perfil de autenticación `openai` ordenado
`openai/gpt-5.5`	proveedor/modelo `agentRuntime.id: "pi"`	Tiempo de ejecución integrado de PI con transporte de autenticación Codex interna	Perfil `openai-codex` seleccionado
`openai-codex/gpt-5.5`	reparado por doctor	Ruta heredada reescrita a `openai/gpt-5.5`	Perfil `openai-codex` existente
`codex-cli/gpt-5.5`	reparado por doctor	Ruta heredada de CLI reescrita a `openai/gpt-5.5`	Autenticación del servidor de aplicaciones Codex

Ejemplo de configuración

{
  plugins: { entries: { codex: { enabled: true } } },
  agents: {
    defaults: {
      model: { primary: "openai/gpt-5.5" },
    },
  },
}

Con una copia de seguridad de clave de API, mantenga el modelo en openai/gpt-5.5 y coloque el orden de autenticación bajo openai. OpenClaw intentará primero la suscripción y luego la clave de API, mientras se mantiene en el arnés de Codex:

{
  plugins: { entries: { codex: { enabled: true } } },
  agents: {
    defaults: {
      model: { primary: "openai/gpt-5.5" },
    },
  },
  auth: {
    order: {
      openai: [
        "openai-codex:[email protected]",
        "openai:api-key-backup",
      ],
    },
  },
}

Verificar y recuperar el enrutamiento de OAuth de Codex

Use estos comandos para ver qué modelo, tiempo de ejecución y ruta de autenticación está usando su agente predeterminado:

openclaw models status
openclaw models auth list --provider openai-codex
openclaw config get agents.defaults.model --json
openclaw config get models.providers.openai.agentRuntime --json

Para un agente específico, añada `—agent

```bash
openclaw models status --agent

openclaw models auth list —agent

—provider openai-codex

Si una configuración anterior todavía tiene `openai-codex/gpt-*` o un pin de sesión de PI de OpenAI obsoleto
sin una configuración explícita de tiempo de ejecución, repárela:

```bash
openclaw doctor --fix
openclaw config validate

Si models auth list --provider openai-codex no muestra ningún perfil utilizable, inicie sesión de nuevo:

openclaw models auth login --provider openai-codex
openclaw models status --probe --probe-provider openai-codex

openai/* es la ruta del modelo para los giros del agente OpenAI a través de Codex. El id del proveedor de autenticación/perfil openai-codex sigue siendo aceptado para los perfiles existentes y el listado de CLI.

Indicador de estado

El chat /status muestra qué tiempo de ejecución del modelo está activo para la sesión actual. El arnés del servidor de aplicaciones Codex incluido aparece como Runtime: OpenAI Codex para los giros del modelo del agente OpenAI. Los pines de sesión de PI obsoletos se reparan a Codex a menos que la configuración fije explícitamente PI.

Advertencia del doctor

Si las rutas openai-codex/* o los pines de PI de OpenAI obsoletos permanecen en la configuración o en el estado de la sesión, openclaw doctor --fix los reescribe a openai/* con el tiempo de ejecución de Codex a menos que PI esté configurado explícitamente.

Límite de la ventana de contexto

OpenClaw trata los metadatos del modelo y el límite de contexto del tiempo de ejecución como valores separados.

Para openai/gpt-5.5 a través del catálogo OAuth de Codex:

contextWindow nativo: 1000000
Límite de contextTokens del tiempo de ejecución predeterminado: 272000

El límite predeterminado más pequeño tiene mejores características de latencia y calidad en la práctica. Anúlelo con contextTokens:

{
  models: {
    providers: {
      "openai-codex": {
        models: [{ id: "gpt-5.5", contextTokens: 160000 }],
      },
    },
  },
}

Recuperación del catálogo

OpenClaw utiliza los metadatos del catálogo de Codex aguas arriba para gpt-5.5 cuando está presente. Si el descubrimiento en vivo de Codex omite la fila gpt-5.5 mientras la cuenta está autenticada, OpenClaw sintetiza esa fila del modelo OAuth para que cron, subagente y las ejecuciones del modelo predeterminado configurado no fallen con Unknown model.

Autenticación nativa del servidor de aplicaciones Codex

El arnés de la aplicación nativa de Codex utiliza referencias de modelo openai/* más configuración de tiempo de ejecución omitida o proveedor/modelo agentRuntime.id: "codex", pero su autenticación sigue basándose en la cuenta. OpenClaw selecciona la autenticación en este orden:

Perfiles de autenticación de OpenAI ordenados para el agente, preferiblemente bajo auth.order.openai. Los perfiles openai-codex:* existentes y auth.order.openai-codex siguen siendo válidos para instalaciones antiguas.
La cuenta existente del servidor de aplicaciones, como un inicio de sesión local de Codex CLI ChatGPT.
Solo para inicios locales de la aplicación-servidor stdio, CODEX_API_KEY, luego OPENAI_API_KEY, cuando la aplicación-servidor no informa de ninguna cuenta y aún requiere autenticación de OpenAI.

Eso significa que un inicio de sesión de suscripción local de ChatGPT/Codex no se reemplaza solo porque el proceso de puerta de enlace también tiene OPENAI_API_KEY para modelos directos de OpenAI o incrustaciones. La alternativa de clave de API de entorno es solo la ruta local stdio sin cuenta; no se envía a conexiones de aplicación-servidor WebSocket. Cuando se selecciona un perfil de Codex estilo suscripción, OpenClaw también mantiene CODEX_API_KEY y OPENAI_API_KEY fuera del hijo de la aplicación-servidor stdio generado y envía las credenciales seleccionadas a través del RPC de inicio de sesión de la aplicación-servidor. Cuando ese perfil de suscripción está bloqueado por un límite de uso de Codex, OpenClaw puede rotar al siguiente perfil de clave de API openai:* ordenado sin cambiar el modelo seleccionado ni salir del arnés de Codex. Una vez que pasa el tiempo de restablecimiento de la suscripción, el perfil de suscripción vuelve a ser elegible.

Generación de imágenes

El complemento incluido openai registra la generación de imágenes a través de la herramienta image_generate. Soporta tanto la generación de imágenes con clave de API de OpenAI como la generación de imágenes OAuth de Codex a través de la misma referencia de modelo openai/gpt-image-2.

Capacidad	Clave de API de OpenAI	Codex OAuth
Referencia de modelo	`openai/gpt-image-2`	`openai/gpt-image-2`
Autenticación	`OPENAI_API_KEY`	Inicio de sesión OAuth de OpenAI Codex
Transporte	API de OpenAI Images	Backend de Codex Responses
Máximo de imágenes por solicitud	4	4
Modo de edición	Habilitado (hasta 5 imágenes de referencia)	Habilitado (hasta 5 imágenes de referencia)
Anulaciones de tamaño	Soportado, incluyendo tamaños 2K/4K	Soportado, incluyendo tamaños 2K/4K
Relación de aspecto / resolución	No reenviado a la API de OpenAI Images	Mapeado a un tamaño compatible cuando sea seguro

{
  agents: {
    defaults: {
      imageGenerationModel: { primary: "openai/gpt-image-2" },
    },
  },
}

gpt-image-2 es el valor predeterminado tanto para la generación de texto a imagen de OpenAI como para la edición de imágenes. gpt-image-1.5, gpt-image-1 y gpt-image-1-mini siguen siendo utilizables como anulaciones explícitas de modelo. Use openai/gpt-image-1.5 para la salida PNG/WebP con fondo transparente; la API actual de gpt-image-2 rechaza background: "transparent".

Para una solicitud con fondo transparente, los agentes deben llamar a image_generate con model: "openai/gpt-image-1.5", outputFormat: "png" o "webp", y background: "transparent"; la opción de proveedor anterior openai.background todavía se acepta. OpenClaw también protege las rutas públicas de OAuth de OpenAI y OpenAI Codex reescribiendo las solicitudes transparentes predeterminadas de openai/gpt-image-2 a gpt-image-1.5; los puntos finales de Azure y los personalizados compatibles con OpenAI conservan sus nombres de implementación/modelo configurados.

La misma configuración está expuesta para ejecuciones de CLI sin interfaz gráfica:

openclaw infer image generate \
  --model openai/gpt-image-1.5 \
  --output-format png \
  --background transparent \
  --prompt "A simple red circle sticker on a transparent background" \
  --json

Use las mismas marcas --output-format y --background con openclaw infer image edit cuando comience desde un archivo de entrada. --openai-background sigue disponible como un alias específico de OpenAI.

Para las instalaciones de OAuth de Codex, mantenga la misma referencia de openai/gpt-image-2. Cuando se configura un perfil de OAuth openai-codex, OpenClaw resuelve ese token de acceso OAuth almacenado y envía solicitudes de imágenes a través del backend de Respuestas de Codex. No intenta primero OPENAI_API_KEY ni recurre silenciosamente a una clave API para esa solicitud. Configure models.providers.openai explícitamente con una clave API, URL base personalizada o punto final de Azure cuando desee la ruta directa de la API de Imágenes de OpenAI en su lugar. Si ese punto final de imagen personalizado está en una dirección LAN/privada de confianza, también configure browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true; OpenClaw mantiene bloqueados los puntos finales de imagen compatibles con OpenAI privados/internos a menos que esta opción de participación esté presente.

Generar:

/tool image_generate model=openai/gpt-image-2 prompt="A polished launch poster for OpenClaw on macOS" size=3840x2160 count=1

Generar un PNG transparente:

/tool image_generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparent

Editar:

/tool image_generate model=openai/gpt-image-2 prompt="Preserve the object shape, change the material to translucent glass" image=/path/to/reference.png size=1024x1536

Generación de video

El complemento openai incluido registra la generación de video a través de la herramienta video_generate.

Capacidad	Valor
Modelo predeterminado	`openai/sora-2`
Modos	Texto a video, imagen a video, edición de video único
Entradas de referencia	1 imagen o 1 video
anulaciones de tamaño	Soportado
Otras anulaciones	`aspectRatio`, `resolution`, `audio`, `watermark` se ignoran con una advertencia de herramienta

{
  agents: {
    defaults: {
      videoGenerationModel: { primary: "openai/sora-2" },
    },
  },
}

Contribución del prompt GPT-5

OpenClaw añade una contribución de prompt de GPT-5 compartida para las ejecuciones de la familia GPT-5 en superficies de prompt ensambladas por OpenClaw. Se aplica por id de modelo, por lo que las rutas de PI/proveedor como las referencias heredadas previas a la reparación (openai-codex/gpt-5.5), openrouter/openai/gpt-5.5, opencode/gpt-5.5 y otras referencias compatibles de GPT-5 reciben la misma superposición. Los modelos GPT-4.x más antiguos no lo hacen.

El arnés nativo de Codex incluido no recibe esta superposición de GPT-5 de OpenClaw a través de las instrucciones para desarrolladores del servidor de aplicaciones de Codex. Codex nativo mantiene el comportamiento base, de modelo, de personalidad y de documentos del proyecto propiedad de Codex; OpenClaw contribuye solo con el contexto de ejecución, como la entrega del canal, las herramientas dinámicas de OpenClaw, la delegación de ACP, el contexto del área de trabajo y las habilidades de OpenClaw.

La contribución de GPT-5 añade un contrato de comportamiento etiquetado para la persistencia de la persona, la seguridad de ejecución, la disciplina de herramientas, la forma de salida, las verificaciones de finalización y la verificación en los prompts ensamblados por OpenClaw coincidentes. El comportamiento de respuesta y de mensaje silencioso específico del canal permanece en el prompt del sistema OpenClaw compartido y la política de entrega saliente. La capa de estilo de interacción amigable es separada y configurable.

Valor	Efecto
`"friendly"` (predeterminado)	Habilitar la capa de estilo de interacción amigable
`"on"`	Alias para `"friendly"`
`"off"`	Deshabilitar solo la capa de estilo amigable

{
  agents: {
    defaults: {
      promptOverlays: {
        gpt5: { personality: "friendly" },
      },
    },
  },
}

openclaw config set agents.defaults.promptOverlays.gpt5.personality off

Voz y habla

Síntesis de voz (TTS)

El complemento incluido openai registra la síntesis de voz para la superficie messages.tts.

Configuración	Ruta de configuración	Predeterminado
Modelo	`messages.tts.providers.openai.model`	`gpt-4o-mini-tts`
Voz	`messages.tts.providers.openai.voice`	`coral`
Velocidad	`messages.tts.providers.openai.speed`	(sin establecer)
Instrucciones	`messages.tts.providers.openai.instructions`	(sin establecer, solo `gpt-4o-mini-tts`)
Formato	`messages.tts.providers.openai.responseFormat`	`opus` para notas de voz, `mp3` para archivos
Clave de API	`messages.tts.providers.openai.apiKey`	Recurre a `OPENAI_API_KEY`
URL base	`messages.tts.providers.openai.baseUrl`	`https://api.openai.com/v1`
Cuerpo adicional	`messages.tts.providers.openai.extraBody` / `extra_body`	(sin establecer)

Modelos disponibles: gpt-4o-mini-tts, tts-1, tts-1-hd. Voces disponibles: alloy, ash, ballad, cedar, coral, echo, fable, juniper, marin, onyx, nova, sage, shimmer, verse.

extraBody se fusiona en el JSON de solicitud /audio/speech después de los campos generados por OpenClaw, por lo que úselo para puntos de conexión compatibles con OpenAI que requieren claves adicionales como lang. Se ignoran las claves de prototipo.

{
  messages: {
    tts: {
      providers: {
        openai: { model: "gpt-4o-mini-tts", voice: "coral" },
      },
    },
  },
}

Conversión de voz a texto

El complemento incluido openai registra la conversión de voz a texto por lotes a través de la superficie de transcripción de comprensión de medios de OpenClaw.

Modelo predeterminado: gpt-4o-transcribe
Punto de conexión: OpenAI REST /v1/audio/transcriptions
Ruta de entrada: carga de archivo de audio multiparte
Compatible con OpenClaw dondequiera que la transcripción de audio entrante utilice tools.media.audio, incluyendo segmentos de canales de voz de Discord y archivos de audio adjuntos del canal

Para forzar el uso de OpenAI para la transcripción de audio entrante:

{
  tools: {
    media: {
      audio: {
        models: [
          {
            type: "provider",
            provider: "openai",
            model: "gpt-4o-transcribe",
          },
        ],
      },
    },
  },
}

Las sugerencias de idioma y prompt se reenvían a OpenAI cuando son proporcionadas por la configuración de medios de audio compartida o la solicitud de transcripción por llamada.

Transcripción en tiempo real

El complemento incluido openai registra la transcripción en tiempo real para el complemento Voice Call.

Configuración	Ruta de configuración	Predeterminado
Modelo	`plugins.entries.voice-call.config.streaming.providers.openai.model`	`gpt-4o-transcribe`
Idioma	`...openai.language`	(sin establecer)
Prompt	`...openai.prompt`	(sin establecer)
Duración del silencio	`...openai.silenceDurationMs`	`800`
Umbral de VAD	`...openai.vadThreshold`	`0.5`
Autenticación	`...openai.apiKey`, `OPENAI_API_KEY`, o `openai-codex` OAuth	Las claves de API se conectan directamente; OAuth genera un secreto de cliente de transcripción en tiempo real

Voz en tiempo real

El complemento openai incluido registra la voz en tiempo real para el complemento Voice Call.

Configuración	Ruta de configuración	Predeterminado
Modelo	`plugins.entries.voice-call.config.realtime.providers.openai.model`	`gpt-realtime-2`
Voz	`...openai.voice`	`alloy`
Temperatura (puente de despliegue de Azure)	`...openai.temperature`	`0.8`
Umbral de VAD	`...openai.vadThreshold`	`0.5`
Duración del silencio	`...openai.silenceDurationMs`	`500`
Relleno de prefijo	`...openai.prefixPaddingMs`	`300`
Esfuerzo de razonamiento	`...openai.reasoningEffort`	(sin establecer)
Autenticación	`...openai.apiKey`, `OPENAI_API_KEY`, o `openai-codex` OAuth	Browser Talk y los puentes de backend que no son de Azure pueden usar Codex OAuth

Voces integradas en tiempo real disponibles para gpt-realtime-2: alloy, ash, ballad, coral, echo, sage, shimmer, verse, marin, cedar. OpenAI recomienda marin y cedar para obtener la mejor calidad en tiempo real. Este es un conjunto separado de las voces de conversión de texto a voz anteriores; no asuma que una voz TTS como fable, nova, o onyx es válida para sesiones en tiempo real.

Note

Control UI Talk utiliza sesiones en tiempo real del navegador de OpenAI con un secreto de cliente efímero generado por el Gateway y un intercambio SDP WebRTC directo del navegador contra la API en tiempo real de OpenAI. Cuando no se configura ninguna clave de API de OpenAI directa, el Gateway puede generar ese secreto de cliente con el perfil OAuth de openai-codex seleccionado. El relay de Gateway y los puentes WebSocket en tiempo real del backend de Voice Call utilizan la misma alternativa de OAuth para los puntos finales nativos de OpenAI. La verificación en vivo del mantenedor está disponible con OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts; los extremos de OpenAI verifican tanto el puente WebSocket del backend como el intercambio SDP WebRTC del navegador sin registrar secretos.

Puntos de conexión de Azure OpenAI

El proveedor integrado openai puede apuntar a un recurso de Azure OpenAI para la generación de imágenes anulando la URL base. En la ruta de generación de imágenes, OpenClaw detecta los nombres de host de Azure en models.providers.openai.baseUrl y cambia automáticamente a la forma de solicitud de Azure.

Use Azure OpenAI cuando:

Ya tenga una suscripción, cuota o contrato empresarial de Azure OpenAI
Necesite controles de residencia de datos regionales o cumplimiento que Azure proporciona
Quiera mantener el tráfico dentro de un inquilino de Azure existente

Configuración

Para la generación de imágenes de Azure a través del proveedor integrado openai, apunte models.providers.openai.baseUrl a su recurso de Azure y configure apiKey con la clave de Azure OpenAI (no una clave de la plataforma OpenAI):

{
  models: {
    providers: {
      openai: {
        baseUrl: "https://<your-resource>.openai.azure.com",
        apiKey: "<azure-openai-api-key>",
      },
    },
  },
}

OpenClaw reconoce estos sufijos de host de Azure para la ruta de generación de imágenes de Azure:

*.openai.azure.com
*.services.ai.azure.com
*.cognitiveservices.azure.com

Para las solicitudes de generación de imágenes en un host de Azure reconocido, OpenClaw:

Envía el encabezado api-key en lugar de Authorization: Bearer
Usa rutas con ámbito de implementación (/openai/deployments/{deployment}/...)
Agrega ?api-version=... a cada solicitud
Utiliza un tiempo de espera de solicitud predeterminado de 600 s para las llamadas de generación de imágenes de Azure. Los valores de timeoutMs por llamada siguen anulando este valor predeterminado.

Otras URL base (OpenAI pública, proxies compatibles con OpenAI) mantienen la forma de solicitud de imagen estándar de OpenAI.

Versión de la API

Configure AZURE_OPENAI_API_VERSION para fijar una versión específica de Azure vista previa o GA para la ruta de generación de imágenes de Azure:

export AZURE_OPENAI_API_VERSION="2024-12-01-preview"

El valor predeterminado es 2024-12-01-preview cuando la variable no está configurada.

Los nombres de los modelos son los nombres de las implementaciones

Azure OpenAI vincula los modelos a las implementaciones. Para las solicitudes de generación de imágenes de Azure enrutadas a través del proveedor integrado openai, el campo model en OpenClaw debe ser el nombre de la implementación de Azure que configuró en el portal de Azure, no el identificador del modelo público de OpenAI.

Si crea una implementación llamada gpt-image-2-prod que sirve gpt-image-2:

/tool image_generate model=openai/gpt-image-2-prod prompt="A clean poster" size=1024x1024 count=1

La misma regla de nombre de implementación se aplica a las llamadas de generación de imágenes enrutadas a través del proveedor openai incluido.

Disponibilidad regional

La generación de imágenes de Azure está actualmente disponible solo en un subconjunto de regiones (por ejemplo eastus2, swedencentral, polandcentral, westus3, uaenorth). Consulte la lista actual de regiones de Microsoft antes de crear una implementación y confirme que el modelo específico se ofrece en su región.

Diferencias de parámetros

Azure OpenAI y OpenAI público no siempre aceptan los mismos parámetros de imagen. Azure puede rechazar opciones que OpenAI público permite (por ejemplo, ciertos valores de background en gpt-image-2) o exponerlos solo en versiones específicas del modelo. Estas diferencias provienen de Azure y el modelo subyacente, no de OpenClaw. Si una solicitud de Azure falla con un error de validación, verifique el conjunto de parámetros admitido por su implementación específica y la versión de la API en el portal de Azure.

Configuración avanzada

Transporte (WebSocket vs SSE)

OpenClaw utiliza WebSocket con prioridad y SSE como alternativa ("auto") para openai/*.

En modo "auto", OpenClaw:

Reintenta un fallo temprano de WebSocket antes de recurrir a SSE
Después de un fallo, marca WebSocket como degradado durante ~60 segundos y usa SSE durante el enfriamiento
Adjunta encabezados estables de identidad de sesión y turno para reintentos y reconexiones
Normaliza los contadores de uso (input_tokens / prompt_tokens) en todas las variantes de transporte

Valor	Comportamiento
`"auto"` (predeterminado)	WebSocket primero, SSE como alternativa
`"sse"`	Forzar solo SSE
`"websocket"`	Forzar solo WebSocket

{
  agents: {
    defaults: {
      models: {
        "openai/gpt-5.5": {
          params: { transport: "auto" },
        },
      },
    },
  },
}

Documentación relacionada de OpenAI:

Modo rápido

OpenClaw expone un interruptor compartido de modo rápido para openai/*:

Chat/UI: /fast status|on|off
Configuración: `agents.defaults.models[”

“].params.fastMode`

Cuando está habilitado, OpenClaw asigna el modo rápido al procesamiento prioritario de OpenAI (`service_tier = "priority"`). Los valores existentes de `service_tier` se conservan, y el modo rápido no reescribe `reasoning` ni `text.verbosity`.

```json5
{
  agents: {
    defaults: {
      models: {
        "openai/gpt-5.5": { params: { fastMode: true } },
      },
    },
  },
}
```

Procesamiento prioritario (service_tier)

La API de OpenAI expone el procesamiento prioritario a través de service_tier. Configúrelo por modelo en OpenClaw:

{
  agents: {
    defaults: {
      models: {
        "openai/gpt-5.5": { params: { serviceTier: "priority" } },
      },
    },
  },
}

Valores admitidos: auto, default, flex, priority.

Compactación del lado del servidor (API de Responses)

Para modelos directos de OpenAI Responses (openai/* en api.openai.com), el contenedor de flujo Pi-harness del complemento OpenAI habilita automáticamente la compactación del lado del servidor:

Fuerza store: true (a menos que la compatibilidad del modelo establezca supportsStore: false)
Inyecta context_management: [{ type: "compaction", compact_threshold: ... }]
compact_threshold predeterminado: 70% de contextWindow (o 80000 cuando no esté disponible)

Esto se aplica a la ruta integrada de Pi harness y a los enlaces del proveedor OpenAI utilizados en ejecuciones integradas. El arnés nativo del servidor de aplicaciones Codex gestiona su propio contexto a través de Codex y se configura mediante la ruta del agente predeterminado de OpenAI o la política de tiempo de ejecución del proveedor/modelo.

Útil para puntos de conexión compatibles como Azure OpenAI Responses:

{
  agents: {
    defaults: {
      models: {
        "azure-openai-responses/gpt-5.5": {
          params: { responsesServerCompaction: true },
        },
      },
    },
  },
}

{
  agents: {
    defaults: {
      models: {
        "openai/gpt-5.5": {
          params: {
            responsesServerCompaction: true,
            responsesCompactThreshold: 120000,
          },
        },
      },
    },
  },
}

{
  agents: {
    defaults: {
      models: {
        "openai/gpt-5.5": {
          params: { responsesServerCompaction: false },
        },
      },
    },
  },
}

Modo GPT de agencia estricta

Para ejecuciones de la familia GPT-5 en openai/*, OpenClaw puede utilizar un contrato de ejecución integrada más estricto:

{
  agents: {
    defaults: {
      embeddedPi: { executionContract: "strict-agentic" },
    },
  },
}

Con strict-agentic, OpenClaw:

Ya no trata un turno de solo planificación como un progreso exitoso cuando hay disponible una acción de herramienta
Reintenta el turno con una dirección de acción inmediata
Habilita automáticamente update_plan para trabajo sustancial
Muestra un estado de bloqueo explícito si el modelo sigue planeando sin actuar

Native vs OpenAI-compatible routes

OpenClaw trata los puntos de conexión directos de OpenAI, Codex y Azure OpenAI de manera diferente a los proxies /v1 compatibles con OpenAI genéricos:

Rutas nativas (openai/*, Azure OpenAI):

Mantiene reasoning: { effort: "none" } solo para modelos que admiten el esfuerzo none de OpenAI
Omite el razonamiento deshabilitado para modelos o proxies que rechazan reasoning.effort: "none"
Establece por defecto los esquemas de herramientas en modo estricto
Adjunta encabezados de atribución ocultos solo en hosts nativos verificados
Mantiene el modelado de solicitudes exclusivo de OpenAI (service_tier, store, reasoning-compat, prompt-cache hints)

Rutas de proxy/compatibles:

Utilizan un comportamiento de compatibilidad más flexible
Eliminan store de Completions de las cargas útiles openai-completions no nativas
Aceptan JSON de paso params.extra_body/params.extraBody avanzado para proxies de Completions compatibles con OpenAI
Aceptan params.chat_template_kwargs para proxies de Completions compatibles con OpenAI como vLLM
No fuerzan esquemas de herramientas estrictos ni encabezados exclusivos de nativos

Azure OpenAI utiliza transporte nativo y comportamiento de compatibilidad, pero no recibe los encabezados de atribución ocultos.

Relacionado

Selección de modelo

Elección de proveedores, referencias de modelos y comportamiento de conmutación por error.

Generación de imágenes

Parámetros compartidos de la herramienta de imágenes y selección de proveedor.

Generación de videos

Parámetros compartidos de la herramienta de video y selección de proveedor.

OAuth y autenticación

Detalles de autenticación y reglas de reutilización de credenciales.