Ir al contenido

Venice AI

Venice es nuestra configuración destacada de Venice para inferencia con prioridad de privacidad y acceso opcional anonimizado a modelos propietarios.

Venice AI proporciona inferencia de IA centrada en la privacidad con soporte para modelos sin censura y acceso a modelos propietarios importantes a través de su proxy anonimizado. Toda la inferencia es privada de forma predeterminada: sin entrenamiento con tus datos, sin registro.

  • Inferencia privada para modelos de código abierto (sin registro).
  • Modelos sin censura cuando los necesites.
  • Acceso anonimizado a modelos propietarios (Opus/GPT/Gemini) cuando la calidad importa.
  • Puntos finales /v1 compatibles con OpenAI.

Venice ofrece dos niveles de privacidad; entender esto es clave para elegir tu modelo:

ModoDescripciónModelos
PrivadoCompletamente privado. Los indicadores y las respuestas nunca se almacenan ni registran. Efímero.Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored, etc.
AnonimizadoProxied a través de Venice con los metadatos eliminados. El proveedor subyacente (OpenAI, Anthropic, Google, xAI) ve solicitudes anonimizadas.Claude, GPT, Gemini, Grok
  • Centrado en la privacidad: Elige entre los modos “privado” (completamente privado) y “anonimizado” (vía proxy)
  • Modelos sin censura: Acceso a modelos sin restricciones de contenido
  • Acceso a modelos importantes: Usa Claude, GPT, Gemini y Grok a través del proxy anonimizado de Venice
  • API compatible con OpenAI: Puntos finales /v1 estándar para una integración sencilla
  • Streaming: ✅ Compatible con todos los modelos
  • Llamada a funciones (Function calling): ✅ Compatible con modelos seleccionados (consulta las capacidades del modelo)
  • Visión: ✅ Compatible con modelos con capacidad de visión
  • Sin límites de tasa estrictos: Es posible que se aplique una limitación de uso justo para un uso extremo
  1. Regístrate en venice.ai
  2. Ve a Configuración → Claves de API → Crear nueva clave
  3. Copia tu clave de API (formato: vapi_xxxxxxxxxxxx)

Opción A: Variable de entorno

Ventana de terminal
export VENICE_API_KEY="vapi_xxxxxxxxxxxx"

Opción B: Configuración interactiva (Recomendado)

Ventana de terminal
openclaw onboard --auth-choice venice-api-key

Esto hará lo siguiente:

  1. Solicita tu clave API (o usa la existente VENICE_API_KEY)
  2. Mostrar todos los modelos de Venice disponibles
  3. Permite elegir tu modelo predeterminado
  4. Configurar el proveedor automáticamente

Opción C: No interactiva

Ventana de terminal
openclaw onboard --non-interactive \
--auth-choice venice-api-key \
--venice-api-key "vapi_xxxxxxxxxxxx"
Ventana de terminal
openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

Después de la configuración, OpenClaw muestra todos los modelos de Venice disponibles. Elige según tus necesidades:

  • Modelo predeterminado: venice/kimi-k2-5 para un razonamiento privado sólido más visión.
  • Opción de alta capacidad: venice/claude-opus-4-6 para la ruta de Venice anonimizada más potente.
  • Privacidad: Elige modelos “privados” para una inferencia totalmente privada.
  • Capacidad: Elige modelos “anonimizados” para acceder a Claude, GPT, Gemini a través del proxy de Venice.

Cambia tu modelo predeterminado en cualquier momento:

Ventana de terminal
openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6

Listar todos los modelos disponibles:

Ventana de terminal
openclaw models list | grep venice
  1. Ejecutar openclaw configure
  2. Seleccionar Modelo/auth
  3. Elegir Venice AI
Caso de usoModelo recomendadoPor qué
Chat general (predeterminado)kimi-k2-5Razonamiento privado sólido más visión
Mejor calidad generalclaude-opus-4-6Opción de Venice anonimizada más potente
Privacidad + programaciónqwen3-coder-480b-a35b-instructModelo de programación privado con contexto grande
Visión privadakimi-k2-5Soporte de visión sin salir del modo privado
Rápido + económicoqwen3-4bModelo de razonamiento ligero
Tareas privadas complejasdeepseek-v3.2Razonamiento fuerte, pero sin soporte de herramientas de Venice
Sin censuravenice-uncensoredSin restricciones de contenido

Modelos Privados (26) - Totalmente Privados, Sin Registro

Sección titulada «Modelos Privados (26) - Totalmente Privados, Sin Registro»
ID del modeloNombreContextoCaracterísticas
kimi-k2-5Kimi K2.5256kPredeterminado, razonamiento, visión
kimi-k2-thinkingKimi K2 Thinking256kRazonamiento
llama-3.3-70bLlama 3.3 70B128kGeneral
llama-3.2-3bLlama 3.2 3B128kGeneral
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B128kGeneral, herramientas deshabilitadas
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking128kRazonamiento
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct128kGeneral
qwen3-coder-480b-a35b-instructQwen3 Coder 480B256kProgramación
qwen3-coder-480b-a35b-instruct-turboQwen3 Coder 480B Turbo256kProgramación
qwen3-5-35b-a3bQwen3.5 35B A3B256kRazonamiento, visión
qwen3-next-80bQwen3 Next 80B256kGeneral
qwen3-vl-235b-a22bQwen3 VL 235B (Visión)256kVisión
qwen3-4bVenice Small (Qwen3 4B)32kRápido, razonamiento
deepseek-v3.2DeepSeek V3.2160kRazonamiento, herramientas deshabilitadas
venice-uncensoredVenice Uncensored (Dolphin-Mistral)32kSin censura, herramientas deshabilitadas
mistral-31-24bVenice Medium (Mistral)128kVisión
google-gemma-3-27b-itGoogle Gemma 3 27B Instruct198kVisión
openai-gpt-oss-120bOpenAI GPT OSS 120B128kGeneral
nvidia-nemotron-3-nano-30b-a3bNVIDIA Nemotron 3 Nano 30B128kGeneral
olafangensan-glm-4.7-flash-hereticGLM 4.7 Flash Heretic128kRazonamiento
zai-org-glm-4.6GLM 4.6198kGeneral
zai-org-glm-4.7GLM 4.7198kRazonamiento
zai-org-glm-4.7-flashGLM 4.7 Flash128kRazonamiento
zai-org-glm-5GLM 5198kRazonamiento
minimax-m21MiniMax M2.1198kRazonamiento
minimax-m25MiniMax M2.5198kRazonamiento

Modelos Anonimizados (15) - A través del Proxy de Venice

Sección titulada «Modelos Anonimizados (15) - A través del Proxy de Venice»
ID del modeloNombreContextoCaracterísticas
claude-opus-4-6Claude Opus 4.6 (vía Venice)1MRazonamiento, visión
claude-opus-4-5Claude Opus 4.5 (vía Venice)198kRazonamiento, visión
claude-sonnet-4-6Claude Sonnet 4.6 (vía Venice)1MRazonamiento, visión
claude-sonnet-4-5Claude Sonnet 4.5 (vía Venice)198kRazonamiento, visión
openai-gpt-54GPT-5.4 (vía Venice)1MRazonamiento, visión
openai-gpt-53-codexGPT-5.3 Codex (vía Venice)400kRazonamiento, visión, programación
openai-gpt-52GPT-5.2 (vía Venice)256kRazonamiento
openai-gpt-52-codexGPT-5.2 Codex (vía Venice)256kRazonamiento, visión, programación
openai-gpt-4o-2024-11-20GPT-4o (vía Venice)128kVisión
openai-gpt-4o-mini-2024-07-18GPT-4o Mini (vía Venice)128kVisión
gemini-3-1-pro-previewGemini 3.1 Pro (vía Venice)1MRazonamiento, visión
gemini-3-pro-previewGemini 3 Pro (vía Venice)198kRazonamiento, visión
gemini-3-flash-previewGemini 3 Flash (vía Venice)256kRazonamiento, visión
grok-41-fastGrok 4.1 Fast (vía Venice)1MRazonamiento, visión
grok-code-fast-1Grok Code Fast 1 (vía Venice)256kRazonamiento, programación

OpenClaw descubre automáticamente los modelos de la API de Venice cuando VENICE_API_KEY está configurado. Si la API es inalcanzable, recurre a un catálogo estático.

El endpoint /models es público (no se requiere autenticación para listar), pero la inferencia requiere una clave de API válida.

CaracterísticaSoporte
Transmisión✅ Todos los modelos
Llamada de funciones✅ La mayoría de modelos (verifique supportsFunctionCalling en la API)
Visión/Imágenes✅ Modelos marcados con la característica “Visión”
Modo JSON✅ Soportado a través de response_format

Venice utiliza un sistema basado en créditos. Consulte venice.ai/pricing para las tarifas actuales:

  • Modelos privados: Generalmente menor costo
  • Modelos anonimizados: Similar a los precios de la API directa + pequeña tarifa de Venice
AspectoVenice (Anonimizado)API directa
PrivacidadMetadatos eliminados, anonimizadosSu cuenta vinculada
Latencia+10-50ms (proxy)Directo
CaracterísticasLa mayoría de características soportadasCaracterísticas completas
FacturaciónCréditos de VeniceFacturación del proveedor
Ventana de terminal
# Use the default private model
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"
# Use Claude Opus via Venice (anonymized)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"
# Use uncensored model
openclaw agent --model venice/venice-uncensored --message "Draft options"
# Use vision model with image
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"
# Use coding model
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"
Ventana de terminal
echo $VENICE_API_KEY
openclaw models list | grep venice

Asegúrese de que la clave comience con vapi_.

El catálogo de modelos de Venice se actualiza dinámicamente. Ejecute openclaw models list para ver los modelos actualmente disponibles. Algunos modelos pueden estar temporalmente fuera de línea.

La API de Venice está en https://api.venice.ai/api/v1. Asegúrese de que su red permita conexiones HTTPS.

{
env: { VENICE_API_KEY: "vapi_..." },
agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
models: {
mode: "merge",
providers: {
venice: {
baseUrl: "https://api.venice.ai/api/v1",
apiKey: "${VENICE_API_KEY}",
api: "openai-completions",
models: [
{
id: "kimi-k2-5",
name: "Kimi K2.5",
reasoning: true,
input: ["text", "image"],
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
contextWindow: 256000,
maxTokens: 65536,
},
],
},
},
},
}