Aller au contenu

Inworld

Inworld est un fournisseur de synthèse vocale en continu (TTS). Dans OpenClaw, il synthétise l’audio des réponses sortantes (MP3 par défaut, OGG_OPUS pour les notes vocales) et l’audio PCM pour les canaux de téléphonie tels que Voice Call.

OpenClaw envoie à Inworld une requête au point de terminaison TTS en continu, concatène les fragments audio base64 renvoyés dans un seul tampon et transmet le résultat au pipeline standard de réponse audio.

PropriétéValeur
ID du fournisseurinworld
Pluginintégré, enabledByDefault: true
ContratspeechProviders (TTS uniquement)
Variable d’env. d’auth.INWORLD_API_KEY (HTTP Basic, identifiant du tableau de bord en Base64)
URL de basehttps://api.inworld.ai
Voix par défautSarah
Modèle par défautinworld-tts-1.5-max
SortieMP3 (par défaut), OGG_OPUS (notes vocales), PCM 22050 Hz (téléphonie)
Site Webinworld.ai
Docsdocs.inworld.ai/tts/tts
  1. Définissez votre clé API

    Copiez l’identifiant depuis votre tableau de bord Inworld (Espace de travail > API Keys) et définissez-le comme variable d’environnement. La valeur est envoyée telle quelle en tant qu’identifiant HTTP Basic, ne l’encodez pas à nouveau en Base64 et ne la convertissez pas en jeton Bearer.

    INWORLD_API_KEY=
  2. Sélectionnez Inworld dans messages.tts

    {
    messages: {
    tts: {
    auto: "always",
    provider: "inworld",
    providers: {
    inworld: {
    voiceId: "Sarah",
    modelId: "inworld-tts-1.5-max",
    },
    },
    },
    },
    }
  3. Envoyez un message

    Envoyez une réponse via n’importe quel canal connecté. OpenClaw synthétise l’audio avec Inworld et le livre au format MP3 (ou OGG_OPUS lorsque le canal attend une note vocale).

OptionCheminDescription
apiKeymessages.tts.providers.inworld.apiKeyIdentifiant du tableau de bord en Base64. Se rabat sur INWORLD_API_KEY.
baseUrlmessages.tts.providers.inworld.baseUrlRemplacer l’URL de base de l’API Inworld (par défaut https://api.inworld.ai).
voiceIdmessages.tts.providers.inworld.voiceIdIdentifiant de voix (par défaut Sarah).
modelIdmessages.tts.providers.inworld.modelIdID de modèle TTS (par défaut inworld-tts-1.5-max).
temperaturemessages.tts.providers.inworld.temperatureTempérature d’échantillonnage 0..2 (facultatif).
Authentification

Inworld utilise l’authentification HTTP Basic avec une seule chaîne d’informations d’identification codée en Base64. Copiez-la telle quelle depuis le tableau de bord Inworld. Le provider l’envoie sous la forme `Authorization: Basic

` sans aucun encodage supplémentaire, donc ne l’encodez pas en Base64 vous-même et ne passez pas de jeton de type porteur. Voir Notes d’authentification TTS pour le même avertissement.

Modèles

IDs de modèles pris en charge : inworld-tts-1.5-max (par défaut), inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.

Sorties audio

Les réponses utilisent le MP3 par défaut. Lorsque la cible du canal est voice-note OpenClaw demande à Inworld OGG_OPUS afin que l’audio soit diffusé sous forme de bulle vocale native. La synthèse téléphonique utilise le PCM brut à 22050 Hz pour alimenter le pont téléphonique.

Points de terminaison personnalisés

Remplacez l’hôte de l’API par messages.tts.providers.inworld.baseUrl. Les barres obliques de fin sont supprimées avant l’envoi des requêtes.

Synthèse vocale

Aperçu TTS, providers et configuration messages.tts.

Configuration

Référence complète de la configuration, y compris les paramètres messages.tts.

Providers

Tous les providers OpenClaw intégrés.

Dépannage

Problèmes courants et étapes de débogage.