Ir al contenido

Inworld

Inworld es un proveedor de texto a voz (TTS) en streaming. En OpenClaw, sintetiza el audio de respuesta saliente (MP3 por defecto, OGG_OPUS para notas de voz) y audio PCM para canales de telefonía como Llamada de voz.

OpenClaw envía una solicitud al punto final de TTS en streaming de Inworld, concatena los trozos de audio base64 devueltos en un único búfer y entrega el resultado a la canalización estándar de audio de respuesta.

PropiedadValor
ID del proveedorinworld
Complementoincluido, enabledByDefault: true
ContratospeechProviders (solo TTS)
Variable de entorno de autenticaciónINWORLD_API_KEY (HTTP Basic, credencial del panel en Base64)
URL basehttps://api.inworld.ai
Voz predeterminadaSarah
Modelo predeterminadoinworld-tts-1.5-max
SalidaMP3 (predeterminado), OGG_OPUS (notas de voz), PCM 22050 Hz (telefonía)
Sitio webinworld.ai
Documentacióndocs.inworld.ai/tts/tts
  1. Establezca su clave de API

    Copie la credencial de su panel de Inworld (Espacio de trabajo > Claves de API) y configúrela como una variable de entorno. El valor se envía textualmente como la credencial HTTP Basic, por lo que no la codifique en Base64 nuevamente ni la convierta en un token de portador (bearer token).

    INWORLD_API_KEY=
  2. Seleccione Inworld en messages.tts

    {
    messages: {
    tts: {
    auto: "always",
    provider: "inworld",
    providers: {
    inworld: {
    voiceId: "Sarah",
    modelId: "inworld-tts-1.5-max",
    },
    },
    },
    },
    }
  3. Envíe un mensaje

    Envíe una respuesta a través de cualquier canal conectado. OpenClaw sintetiza el audio con Inworld y lo entrega como MP3 (o OGG_OPUS cuando el canal espera una nota de voz).

OpciónRutaDescripción
apiKeymessages.tts.providers.inworld.apiKeyCredencial del panel en Base64. Recurre a INWORLD_API_KEY.
baseUrlmessages.tts.providers.inworld.baseUrlAnula la URL base de la API de Inworld (predeterminado https://api.inworld.ai).
voiceIdmessages.tts.providers.inworld.voiceIdIdentificador de voz (predeterminado Sarah).
modelIdmessages.tts.providers.inworld.modelIdID del modelo TTS (predeterminado inworld-tts-1.5-max).
temperaturemessages.tts.providers.inworld.temperatureTemperatura de muestreo 0..2 (opcional).
Authentication

Inworld utiliza autenticación básica HTTP con una única cadena de credenciales codificada en Base64. Cópiela tal cual del panel de control de Inworld. El proveedor la envía como `Authorization: Basic

` sin ninguna codificación adicional, por lo que no debe codificarla en Base64 usted mismo ni pasar un token de estilo bearer. Consulte las notas de autenticación de TTS para la misma advertencia.

Models

IDs de modelos compatibles: inworld-tts-1.5-max (predeterminado), inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.

Audio outputs

Las respuestas utilizan MP3 de forma predeterminada. Cuando el objetivo del canal es voice-note, OpenClaw solicita a Inworld OGG_OPUS para que el audio se reproduzca como un globo de voz nativo. La síntesis de telefonía utiliza PCM en bruto a 22050 Hz para alimentar el puente de telefonía.

Custom endpoints

Anule el host de la API con messages.tts.providers.inworld.baseUrl. Se eliminan las barras diagonales finales antes de enviar las solicitudes.

Text-to-speech

Visión general de TTS, proveedores y configuración de messages.tts.

Configuration

Referencia de configuración completa, incluida la configuración de messages.tts.

Providers

Todos los proveedores incluidos en OpenClaw.

Solución de problemas

Problemas comunes y pasos de depuración.