Skip to content

Venice AI

Venice AI 提供專注隱私的 AI 推理服務,支援非審查模型,並透過其匿名代理存取主要的專有模型。所有推理預設皆為私密 — 不使用您的資料進行訓練,不進行日誌記錄。

  • 開源模型的私密推理(無日誌記錄)。
  • 當您需要時提供非審查模型
  • 當品質重要時,對專有模型(Opus/GPT/Gemini)進行匿名存取
  • 相容 OpenAI 的 /v1 端點。

Venice 提供兩種隱私等級 — 理解此點對於選擇您的模型至關重要:

模式描述模型
私密完全私密。提示詞/回應絕不會被儲存或記錄。暫時性。Llama、Qwen、DeepSeek、Kimi、MiniMax、Venice Uncensored 等。
匿名透過 Venice 代理並移除中繼資料。底層供應商(OpenAI、Anthropic、Google、xAI)會看到經過匿名處理的請求。Claude、GPT、Gemini、Grok

  • 專注隱私:可選擇「私密」(完全私密)與「匿名」(代理)模式
  • 非審查模型:可存取無內容限制的模型
  • 主要模型存取:透過 Venice 的匿名代理使用 Claude、GPT、Gemini 和 Grok
  • 相容 OpenAI 的 API:標準 /v1 端點,便於整合
  • 串流:所有模型皆支援
  • 函式呼叫:選定模型支援(請檢查模型功能)
  • 視覺:具備視覺能力的模型支援
  • 無嚴格速率限制:對於極端使用情況可能會採取公平使用限速
  1. 取得您的 API 金鑰

    1. venice.ai 註冊
    2. 前往 Settings > API Keys > Create new key
    3. 複製您的 API 金鑰(格式:vapi_xxxxxxxxxxxx
  2. 設定 OpenClaw

    選擇您偏好的設定方式:

    Terminal window
    openclaw onboard --auth-choice venice-api-key

    這將會:

    1. 提示您輸入 API 金鑰(或使用現有的 VENICE_API_KEY
    2. 顯示所有可用的 Venice 模型
    3. 讓您選擇預設模型
    4. 自動設定提供者
  3. 驗證設定

    Terminal window
    openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

設定完成後,OpenClaw 會顯示所有可用的 Venice 模型。請根據您的需求進行選擇:

  • 預設模型venice/kimi-k2-5 適合強大的私人推理以及視覺功能。
  • 高功能選項venice/claude-opus-4-6 適合最強的匿名 Venice 路徑。
  • 隱私:選擇「私人」模型以進行完全私有的推理。
  • 功能:選擇「匿名」模型以透過 Venice 的代理存取 Claude、GPT、Gemini。

您可以隨時變更預設模型:

Terminal window
openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6

列出所有可用的模型:

Terminal window
openclaw models list --all --provider venice

您也可以執行 openclaw configure,選擇 Model/auth,然後選擇 Venice AI

如果 Venice 公開了 DeepSeek V4 模型,例如 venice/deepseek-v4-provenice/deepseek-v4-flash,當代理伺服器 遺漏時,OpenClaw 會在助理訊息上填入所需的 DeepSeek V4 reasoning_content 重播佔位符。Venice 會拒絕 DeepSeek 原生頂層的 thinking 控制,因此 OpenClaw 會將該供應商特定的重播修復與原生 DeepSeek 供應商的思考控制分開處理。

Private models (26) — fully private, no logging
模型 ID名稱上下文功能
kimi-k2-5Kimi K2.5256kDefault, reasoning, vision
kimi-k2-thinkingKimi K2 Thinking256kReasoning
llama-3.3-70bLlama 3.3 70B128kGeneral
llama-3.2-3bLlama 3.2 3B128kGeneral
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B128kGeneral, tools disabled
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking128kReasoning
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct128kGeneral
qwen3-coder-480b-a35b-instructQwen3 Coder 480B256kCoding
qwen3-coder-480b-a35b-instruct-turboQwen3 Coder 480B Turbo256kCoding
qwen3-5-35b-a3bQwen3.5 35B A3B256kReasoning, vision
qwen3-next-80bQwen3 Next 80B256kGeneral
qwen3-vl-235b-a22bQwen3 VL 235B (Vision)256kVision
qwen3-4bVenice Small (Qwen3 4B)32kFast, reasoning
deepseek-v3.2DeepSeek V3.2160kReasoning, tools disabled
venice-uncensoredVenice Uncensored (Dolphin-Mistral)32kUncensored, tools disabled
mistral-31-24bVenice Medium (Mistral)128kVision
google-gemma-3-27b-itGoogle Gemma 3 27B Instruct198kVision
openai-gpt-oss-120bOpenAI GPT OSS 120B128kGeneral
nvidia-nemotron-3-nano-30b-a3bNVIDIA Nemotron 3 Nano 30B128kGeneral
olafangensan-glm-4.7-flash-hereticGLM 4.7 Flash Heretic128kReasoning
zai-org-glm-4.6GLM 4.6198kGeneral
zai-org-glm-4.7GLM 4.7198kReasoning
zai-org-glm-4.7-flashGLM 4.7 Flash128kReasoning
zai-org-glm-5GLM 5198kReasoning
minimax-m21MiniMax M2.1198kReasoning
minimax-m25MiniMax M2.5198kReasoning
匿名模型(15 個)— 透過 Venice 代理
模型 ID名稱Context功能
claude-opus-4-6Claude Opus 4.6 (透過 Venice)1MReasoning, vision
claude-opus-4-5Claude Opus 4.5 (透過 Venice)198kReasoning, vision
claude-sonnet-4-6Claude Sonnet 4.6 (透過 Venice)1MReasoning, vision
claude-sonnet-4-5Claude Sonnet 4.5 (透過 Venice)198kReasoning, vision
openai-gpt-54GPT-5.4 (透過 Venice)1MReasoning, vision
openai-gpt-53-codexGPT-5.3 Codex (透過 Venice)400kReasoning, vision, coding
openai-gpt-52GPT-5.2 (透過 Venice)256kReasoning
openai-gpt-52-codexGPT-5.2 Codex (透過 Venice)256kReasoning, vision, coding
openai-gpt-4o-2024-11-20GPT-4o (透過 Venice)128kVision
openai-gpt-4o-mini-2024-07-18GPT-4o Mini (透過 Venice)128kVision
gemini-3-1-pro-previewGemini 3.1 Pro (透過 Venice)1MReasoning, vision
gemini-3-pro-previewGemini 3 Pro (透過 Venice)198kReasoning, vision
gemini-3-flash-previewGemini 3 Flash (透過 Venice)256kReasoning, vision
grok-41-fastGrok 4.1 Fast (透過 Venice)1MReasoning, vision
grok-code-fast-1Grok Code Fast 1 (透過 Venice)256kReasoning, coding

OpenClaw 內建了一個基於清單的 Venice 種子目錄,用於唯讀模型列表。執行階段重新整理仍然可以從 Venice API 發現模型,如果無法連上 API,則會回退到清單目錄。

/models 端點是公開的(列出項目不需要驗證),但推論需要有效的 API 金鑰。

功能支援
串流所有模型
函數呼叫大多數模型(請檢查 API 中的 supportsFunctionCalling
視覺/圖片標有「Vision」功能的模型
JSON 模式透過 response_format 支援

Venice 使用基於點數的系統。請查看 venice.ai/pricing 以了解當前費率:

  • Private models:通常費用較低
  • Anonymized models:類似於直接 API 定價 + 少量 Venice 手續費
面向Venice (匿名化)直接 API
隱私元數據已剝離,已匿名化您的帳戶已連結
延遲+10-50ms (代理)直接
功能支援大多數功能完整功能
計費Venice 點數提供商計費
Terminal window
# Use the default private model
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"
# Use Claude Opus via Venice (anonymized)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"
# Use uncensored model
openclaw agent --model venice/venice-uncensored --message "Draft options"
# Use vision model with image
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"
# Use coding model
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"
無法識別 API 金鑰
Terminal window
echo $VENICE_API_KEY
openclaw models list | grep venice

請確保金鑰以 vapi_ 開頭。

模型無法使用

Venice 模型目錄會動態更新。執行 openclaw models list 以查看目前可用的模型。部分模型可能暫時離線。

連線問題

Venice API 位於 https://api.venice.ai/api/v1。請確保您的網路允許 HTTPS 連線。

Config file example
{
env: { VENICE_API_KEY: "vapi_..." },
agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
models: {
mode: "merge",
providers: {
venice: {
baseUrl: "https://api.venice.ai/api/v1",
apiKey: "${VENICE_API_KEY}",
api: "openai-completions",
models: [
{
id: "kimi-k2-5",
name: "Kimi K2.5",
reasoning: true,
input: ["text", "image"],
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
contextWindow: 256000,
maxTokens: 65536,
},
],
},
},
},
}
Model selection

選擇提供商、模型參照和故障轉移行為。

Venice AI

Venice AI 首頁和帳戶註冊。

API documentation

Venice API 參考和開發者文件。

定價

目前的 Venice 點數費率與方案。