Deepgram
Deepgram est une API de reconnaissance vocale. Dans API, elle est utilisée pour la transcription
audio/notes vocales entrantes via tools.media.audio et pour la STT en
continu des appels vocaux via plugins.entries.voice-call.config.streaming.
Pour la transcription par lot, OpenClaw télécharge le fichier audio complet vers Deepgram
et injecte la transcription dans le pipeline de réponse (bloc {{Transcript}} +
[Audio]). Pour la diffusion en continu d’appels vocaux, OpenClaw transfère les trames G.711
u-law en direct via le point de terminaison WebSocket listen de Deepgram et émet des transcriptions partielles ou
finales au fur et à mesure que Deepgram les renvoie.
| Détail | Valeur |
|---|---|
| Site Web | deepgram.com |
| Docs | developers.deepgram.com |
| Auth | DEEPGRAM_API_KEY |
| Modèle par défaut | nova-3 |
Getting started
Section intitulée « Getting started »Définissez votre clé API
Ajoutez votre clé Deepgram API à l’environnement :
DEEPGRAM_API_KEY=dg_...Activez le fournisseur audio
{tools: {media: {audio: {enabled: true,models: [{ provider: "deepgram", model: "nova-3" }],},},},}Envoyez une note vocale
Envoyez un message audio via n’importe quel channel connecté. OpenClaw la transcrit via Deepgram et injecte la transcription dans le pipeline de réponse.
Options de configuration
Section intitulée « Options de configuration »| Option | Chemin | Description |
|---|---|---|
model | tools.media.audio.models[].model | ID du modèle Deepgram (par défaut : nova-3) |
language | tools.media.audio.models[].language | Indication de langue (facultatif) |
detect_language | tools.media.audio.providerOptions.deepgram.detect_language | Activer la détection de langue (facultatif) |
punctuate | tools.media.audio.providerOptions.deepgram.punctuate | Activer la ponctuation (facultatif) |
smart_format | tools.media.audio.providerOptions.deepgram.smart_format | Activer le formatage intelligent (facultatif) |
{ tools: { media: { audio: { enabled: true, models: [{ provider: "deepgram", model: "nova-3", language: "en" }], }, }, },}{ tools: { media: { audio: { enabled: true, providerOptions: { deepgram: { detect_language: true, punctuate: true, smart_format: true, }, }, models: [{ provider: "deepgram", model: "nova-3" }], }, }, },}STT en continu pour les appels vocaux
Section intitulée « STT en continu pour les appels vocaux »Le plugin deepgram inclus enregistre également un fournisseur de transcription en temps réel pour le plugin Voice Call.
| Paramètre | Chemin de configuration | Par défaut |
|---|---|---|
| Clé API | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey | Revient à DEEPGRAM_API_KEY |
| Modèle | ...deepgram.model | nova-3 |
| Langue | ...deepgram.language | (non défini) |
| Encodage | ...deepgram.encoding | mulaw |
| Taux d’échantillonnage | ...deepgram.sampleRate | 8000 |
| Détection de fin | ...deepgram.endpointingMs | 800 |
| Résultats intermédiaires | ...deepgram.interimResults | true |
{ plugins: { entries: { "voice-call": { config: { streaming: { enabled: true, provider: "deepgram", providers: { deepgram: { apiKey: "${DEEPGRAM_API_KEY}", model: "nova-3", endpointingMs: 800, language: "en-US", }, }, }, }, }, }, },}Authentification
L’authentification suit l’ordre standard d’authentification des fournisseurs. DEEPGRAM_API_KEY est le chemin le plus simple.
Proxy et points de terminaison personnalisés
Remplacez les points de terminaison ou les en-têtes avec tools.media.audio.baseUrl et tools.media.audio.headers lors de l’utilisation d’un proxy.
Comportement de la sortie
La sortie suit les mêmes règles audio que les autres fournisseurs (limites de taille, délais d’expiration, injection de transcription).
Connexes
Section intitulée « Connexes »Vue d’ensemble du pipeline de traitement audio, image et vidéo.
Référence de configuration complète incluant les paramètres de l’outil média.
Problèmes courants et étapes de débogage.
Questions fréquemment posées sur la configuration OpenClaw.