Deepgram
Deepgram 是一個語音轉文字 API。在 OpenClaw 中,它用於透過 tools.media.audio 進行入站音訊/語音備忘錄轉錄,並透過 plugins.entries.voice-call.config.streaming 進行語音通話串流 STT。
對於批次轉錄,OpenClaw 會將完整的音訊檔案上傳至 Deepgram,並將轉錄文字注入回覆管線 ({{Transcript}} + [Audio] 區塊)。對於語音通話串流,OpenClaw 會透過 Deepgram 的 WebSocket listen 端點轉發即時 G.711 μ-law 幀,並在 Deepgram 傳回時發出部分或最終轉錄文字。
| 詳細資料 | 值 |
|---|---|
| 網站 | deepgram.com |
| 文件 | developers.deepgram.com |
| 驗證 | DEEPGRAM_API_KEY |
| 預設模型 | nova-3 |
設定您的 API 金鑰
將您的 Deepgram API 金鑰新增至環境變數中:
DEEPGRAM_API_KEY=dg_...啟用音訊提供者
{tools: {media: {audio: {enabled: true,models: [{ provider: "deepgram", model: "nova-3" }],},},},}傳送語音備忘錄
透過任何連線的頻道傳送音訊訊息。OpenClaw 會透過 Deepgram 將其轉錄,並將轉錄文字注入回覆管線。
| 選項 | 路徑 | 說明 |
|---|---|---|
model | tools.media.audio.models[].model | Deepgram 模型 ID (預設:nova-3) |
language | tools.media.audio.models[].language | 語言提示 (選用) |
detect_language | tools.media.audio.providerOptions.deepgram.detect_language | 啟用語言偵測 (選用) |
punctuate | tools.media.audio.providerOptions.deepgram.punctuate | 啟用標點符號 (選用) |
smart_format | tools.media.audio.providerOptions.deepgram.smart_format | 啟用智慧格式化 (選用) |
{ tools: { media: { audio: { enabled: true, models: [{ provider: "deepgram", model: "nova-3", language: "en" }], }, }, },}{ tools: { media: { audio: { enabled: true, providerOptions: { deepgram: { detect_language: true, punctuate: true, smart_format: true, }, }, models: [{ provider: "deepgram", model: "nova-3" }], }, }, },}語音通話串流 STT
Section titled “語音通話串流 STT”內建的 deepgram 外掛同時也為 Voice Call 外掛註冊了一個即時轉錄提供者。
| 設定 | 配置路徑 | 預設值 |
|---|---|---|
| API 金鑰 | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey | 回退至 DEEPGRAM_API_KEY |
| 模型 | ...deepgram.model | nova-3 |
| 語言 | ...deepgram.language | (未設定) |
| 編碼 | ...deepgram.encoding | mulaw |
| 取樣率 | ...deepgram.sampleRate | 8000 |
| 端點偵測 | ...deepgram.endpointingMs | 800 |
| 過渡結果 | ...deepgram.interimResults | true |
{ plugins: { entries: { "voice-call": { config: { streaming: { enabled: true, provider: "deepgram", providers: { deepgram: { apiKey: "${DEEPGRAM_API_KEY}", model: "nova-3", endpointingMs: 800, language: "en-US", }, }, }, }, }, }, },}身分驗證
身分驗證遵循標準提供者驗證順序。DEEPGRAM_API_KEY 是 最簡單的方式。
代理與自訂端點
使用代理時,可透過 tools.media.audio.baseUrl 和 tools.media.audio.headers 覆寫端點或標頭。
輸出行為
輸出遵循與其他提供者相同的音訊規則(大小上限、逾時、 轉錄內容注入)。
媒體工具
音訊、圖片和影片處理管道概覽。
設定
包含媒體工具設定的完整配置參考。
疑難排解
常見問題與除錯步驟。
常見問題
關於 OpenClaw 設定的常見問題。