Deepgram

Deepgram est une API de reconnaissance vocale. Dans API, elle est utilisée pour la transcription audio/notes vocales entrantes via tools.media.audio et pour la STT en continu des appels vocaux via plugins.entries.voice-call.config.streaming.

Pour la transcription par lot, OpenClaw télécharge le fichier audio complet vers Deepgram et injecte la transcription dans le pipeline de réponse (bloc {{Transcript}} + [Audio]). Pour la diffusion en continu d’appels vocaux, OpenClaw transfère les trames G.711 u-law en direct via le point de terminaison WebSocket listen de Deepgram et émet des transcriptions partielles ou finales au fur et à mesure que Deepgram les renvoie.

Détail	Valeur
Site Web	deepgram.com
Docs	developers.deepgram.com
Auth	`DEEPGRAM_API_KEY`
Modèle par défaut	`nova-3`

Getting started

Définissez votre clé API
Ajoutez votre clé Deepgram API à l’environnement :
```
DEEPGRAM_API_KEY=dg_...
```

Activez le fournisseur audio

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

Envoyez une note vocale
Envoyez un message audio via n’importe quel channel connecté. OpenClaw la transcrit via Deepgram et injecte la transcription dans le pipeline de réponse.

Options de configuration

Option	Chemin	Description
`model`	`tools.media.audio.models[].model`	ID du modèle Deepgram (par défaut : `nova-3`)
`language`	`tools.media.audio.models[].language`	Indication de langue (facultatif)
`detect_language`	`tools.media.audio.providerOptions.deepgram.detect_language`	Activer la détection de langue (facultatif)
`punctuate`	`tools.media.audio.providerOptions.deepgram.punctuate`	Activer la ponctuation (facultatif)
`smart_format`	`tools.media.audio.providerOptions.deepgram.smart_format`	Activer le formatage intelligent (facultatif)

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

{
  tools: {
    media: {
      audio: {
        enabled: true,
        providerOptions: {
          deepgram: {
            detect_language: true,
            punctuate: true,
            smart_format: true,
          },
        },
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

STT en continu pour les appels vocaux

Le plugin deepgram inclus enregistre également un fournisseur de transcription en temps réel pour le plugin Voice Call.

Paramètre	Chemin de configuration	Par défaut
Clé API	`plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey`	Revient à `DEEPGRAM_API_KEY`
Modèle	`...deepgram.model`	`nova-3`
Langue	`...deepgram.language`	(non défini)
Encodage	`...deepgram.encoding`	`mulaw`
Taux d’échantillonnage	`...deepgram.sampleRate`	`8000`
Détection de fin	`...deepgram.endpointingMs`	`800`
Résultats intermédiaires	`...deepgram.interimResults`	`true`

{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "deepgram",
            providers: {
              deepgram: {
                apiKey: "${DEEPGRAM_API_KEY}",
                model: "nova-3",
                endpointingMs: 800,
                language: "en-US",
              },
            },
          },
        },
      },
    },
  },
}

Notes

Authentification

L’authentification suit l’ordre standard d’authentification des fournisseurs. DEEPGRAM_API_KEY est le chemin le plus simple.

Proxy et points de terminaison personnalisés

Remplacez les points de terminaison ou les en-têtes avec tools.media.audio.baseUrl et tools.media.audio.headers lors de l’utilisation d’un proxy.

Comportement de la sortie

La sortie suit les mêmes règles audio que les autres fournisseurs (limites de taille, délais d’expiration, injection de transcription).

Connexes

Outils multimédias

Vue d’ensemble du pipeline de traitement audio, image et vidéo.

Configuration

Référence de configuration complète incluant les paramètres de l’outil média.

Dépannage

Problèmes courants et étapes de débogage.

FAQ

Questions fréquemment posées sur la configuration OpenClaw.