Aller au contenu

Deepgram

Deepgram est une API de reconnaissance vocale. Dans API, elle est utilisée pour la transcription de fichiers audio/notes vocales entrants via tools.media.audio.

Lorsqu’elle est activée, OpenClaw télécharge le fichier audio vers Deepgram et injecte la transcription dans le pipeline de réponse (bloc {{Transcript}} + [Audio]). Ce n’est pas un streaming; il utilise le point de terminaison de transcription préenregistrée.

Site Web : https://deepgram.com
Docs : https://developers.deepgram.com

  1. Définissez votre clé API :
DEEPGRAM_API_KEY=dg_...
  1. Activez le fournisseur :
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
  • model : id du modèle Deepgram (par défaut : nova-3)
  • language : indication de langue (facultatif)
  • tools.media.audio.providerOptions.deepgram.detect_language : activer la détection de langue (facultatif)
  • tools.media.audio.providerOptions.deepgram.punctuate : activer la ponctuation (facultatif)
  • tools.media.audio.providerOptions.deepgram.smart_format : activer le formatage intelligent (facultatif)

Exemple avec langue :

{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
},
},
},
}

Exemple avec les options Deepgram :

{
tools: {
media: {
audio: {
enabled: true,
providerOptions: {
deepgram: {
detect_language: true,
punctuate: true,
smart_format: true,
},
},
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
  • L’authentification suit l’ordre d’authentification standard des fournisseurs ; DEEPGRAM_API_KEY est le chemin le plus simple.
  • Remplacez les points de terminaison ou les en-têtes avec tools.media.audio.baseUrl et tools.media.audio.headers lors de l’utilisation d’un proxy.
  • La sortie suit les mêmes règles audio que les autres fournisseurs (limites de taille, délais d’attente, injection de transcription).