Venice AI

Venice AI proporciona inferencia de IA centrada en la privacidad con soporte para modelos sin censura y acceso a modelos propietarios importantes a través de su proxy anonimizado. Toda la inferencia es privada de forma predeterminada: no se entrena con sus datos, no se registran registros.

Por qué Venice en OpenClaw

Inferencia privada para modelos de código abierto (sin registro).
Modelos sin censura cuando los necesite.
Acceso anonimizado a modelos propietarios (Opus/GPT/Gemini) cuando importa la calidad.
Puntos finales /v1 compatibles con OpenAI.

Modos de privacidad

Venice ofrece dos niveles de privacidad; comprender esto es clave para elegir su modelo:

Modo	Descripción	Modelos
Privado	Totalmente privado. Los mensajes/prompt y las respuestas nunca se almacenan ni registran. Efímero.	Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored, etc.
Anonimizado	Proxied a través de Venice con los metadatos eliminados. El proveedor subyacente (OpenAI, Anthropic, Google, xAI) ve solicitudes anonimizadas.	Claude, GPT, Gemini, Grok

Características

Centrado en la privacidad: elija entre los modos “privado” (totalmente privado) y “anonimizado” (vía proxy)
Modelos sin censura: acceso a modelos sin restricciones de contenido
Acceso a modelos importantes: use Claude, GPT, Gemini y Grok a través del proxy anonimizado de Venice
API compatible con OpenAI: puntos finales /v1 estándar para una integración sencilla
Streaming: compatible con todos los modelos
Llamada a funciones (Function calling): compatible con modelos seleccionados (verifique las capacidades del modelo)
Visión: compatible con modelos con capacidad de visión
Sin límites de estrictos de velocidad: puede aplicarse una limitación de uso justo para usos extremos

Primeros pasos

Obtén tu clave de API
1. Regístrate en venice.ai
2. Ve a Settings > API Keys > Create new key
3. Copia tu clave de API (formato: vapi_xxxxxxxxxxxx)
Configurar OpenClaw
Elija su método de configuración preferido:
Ventana de terminal
openclaw onboard --auth-choice venice-api-key
Esto hará:
1. Solicitar su clave de API (o usar la existente VENICE_API_KEY)
2. Mostrar todos los modelos de Venice disponibles
3. Permitirle elegir su modelo predeterminado
4. Configurar el proveedor automáticamente
Ventana de terminal
export VENICE_API_KEY="vapi_xxxxxxxxxxxx"
Ventana de terminal
openclaw onboard --non-interactive \ --auth-choice venice-api-key \ --venice-api-key "vapi_xxxxxxxxxxxx"

Verificar configuración

openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

Selección de modelo

Después de la configuración, OpenClaw muestra todos los modelos de Venice disponibles. Elija según sus necesidades:

Modelo predeterminado: venice/kimi-k2-5 para un razonamiento privado sólido más visión.
Opción de alta capacidad: venice/claude-opus-4-6 para la ruta más anónima de Venice.
Privacidad: Elija modelos “privados” (private) para una inferencia totalmente privada.
Capacidad: Elija modelos “anonymized” para acceder a Claude, GPT, Gemini a través del proxy de Venice.

Cambie su modelo predeterminado en cualquier momento:

openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6

Listar todos los modelos disponibles:

openclaw models list --all --provider venice

También puede ejecutar openclaw configure, seleccionar Model/auth y elegir Venice AI.

Tip

Use la tabla siguiente para elegir el modelo adecuado para su caso de uso.

Caso de uso	Modelo recomendado	Por qué
Chat general (predeterminado)	`kimi-k2-5`	Razonamiento privado fuerte más visión
Mejor calidad general	`claude-opus-4-6`	Opción de Venice anonimizada más fuerte
Privacidad + codificación	`qwen3-coder-480b-a35b-instruct`	Modelo de codificación privado con contexto grande
Visión privada	`kimi-k2-5`	Soporte de visión sin salir del modo privado
Rápido + barato	`qwen3-4b`	Modelo de razonamiento ligero
Tareas privadas complejas	`deepseek-v3.2`	Razonamiento fuerte, pero sin soporte de herramientas de Venice
Sin censura	`venice-uncensored`	Sin restricciones de contenido

Comportamiento de repetición de DeepSeek V4

Si Venice expone modelos DeepSeek V4 como venice/deepseek-v4-pro o venice/deepseek-v4-flash, OpenClaw completa el marcador de posición de repetición reasoning_content requerido por DeepSeek V4 en los mensajes del asistente cuando el proxy lo omite. Venice rechaza el control thinking de nivel superior nativo de DeepSeek, por lo que OpenClaw mantiene esa corrección de repetición específica del proveedor separada de los controles de pensamiento del proveedor nativo de DeepSeek.

Catálogo integrado (41 en total)

Modelos privados (26) — totalmente privados, sin registros

ID del modelo	Nombre	Contexto	Características
`kimi-k2-5`	Kimi K2.5	256k	Por defecto, razonamiento, visión
`kimi-k2-thinking`	Kimi K2 Thinking	256k	Razonamiento
`llama-3.3-70b`	Llama 3.3 70B	128k	General
`llama-3.2-3b`	Llama 3.2 3B	128k	General
`hermes-3-llama-3.1-405b`	Hermes 3 Llama 3.1 405B	128k	General, herramientas deshabilitadas
`qwen3-235b-a22b-thinking-2507`	Qwen3 235B Thinking	128k	Razonamiento
`qwen3-235b-a22b-instruct-2507`	Qwen3 235B Instruct	128k	General
`qwen3-coder-480b-a35b-instruct`	Qwen3 Coder 480B	256k	Programación
`qwen3-coder-480b-a35b-instruct-turbo`	Qwen3 Coder 480B Turbo	256k	Programación
`qwen3-5-35b-a3b`	Qwen3.5 35B A3B	256k	Razonamiento, visión
`qwen3-next-80b`	Qwen3 Next 80B	256k	General
`qwen3-vl-235b-a22b`	Qwen3 VL 235B (Vision)	256k	Visión
`qwen3-4b`	Venice Small (Qwen3 4B)	32k	Rápido, razonamiento
`deepseek-v3.2`	DeepSeek V3.2	160k	Razonamiento, herramientas deshabilitadas
`venice-uncensored`	Venice Uncensored (Dolphin-Mistral)	32k	Sin censura, herramientas deshabilitadas
`mistral-31-24b`	Venice Medium (Mistral)	128k	Visión
`google-gemma-3-27b-it`	Google Gemma 3 27B Instruct	198k	Visión
`openai-gpt-oss-120b`	OpenAI GPT OSS 120B	128k	General
`nvidia-nemotron-3-nano-30b-a3b`	NVIDIA Nemotron 3 Nano 30B	128k	General
`olafangensan-glm-4.7-flash-heretic`	GLM 4.7 Flash Heretic	128k	Razonamiento
`zai-org-glm-4.6`	GLM 4.6	198k	General
`zai-org-glm-4.7`	GLM 4.7	198k	Razonamiento
`zai-org-glm-4.7-flash`	GLM 4.7 Flash	128k	Razonamiento
`zai-org-glm-5`	GLM 5	198k	Razonamiento
`minimax-m21`	MiniMax M2.1	198k	Razonamiento
`minimax-m25`	MiniMax M2.5	198k	Razonamiento

Modelos anonimizados (15) — vía proxy Venice

ID de modelo	Nombre	Contexto	Características
`claude-opus-4-6`	Claude Opus 4.6 (vía Venice)	1M	Razonamiento, visión
`claude-opus-4-5`	Claude Opus 4.5 (vía Venice)	198k	Razonamiento, visión
`claude-sonnet-4-6`	Claude Sonnet 4.6 (vía Venice)	1M	Razonamiento, visión
`claude-sonnet-4-5`	Claude Sonnet 4.5 (vía Venice)	198k	Razonamiento, visión
`openai-gpt-54`	GPT-5.4 (vía Venice)	1M	Razonamiento, visión
`openai-gpt-53-codex`	GPT-5.3 Codex (vía Venice)	400k	Razonamiento, visión, programación
`openai-gpt-52`	GPT-5.2 (vía Venice)	256k	Razonamiento
`openai-gpt-52-codex`	GPT-5.2 Codex (vía Venice)	256k	Razonamiento, visión, programación
`openai-gpt-4o-2024-11-20`	GPT-4o (vía Venice)	128k	Visión
`openai-gpt-4o-mini-2024-07-18`	GPT-4o Mini (vía Venice)	128k	Visión
`gemini-3-1-pro-preview`	Gemini 3.1 Pro (vía Venice)	1M	Razonamiento, visión
`gemini-3-pro-preview`	Gemini 3 Pro (vía Venice)	198k	Razonamiento, visión
`gemini-3-flash-preview`	Gemini 3 Flash (vía Venice)	256k	Razonamiento, visión
`grok-41-fast`	Grok 4.1 Fast (vía Venice)	1M	Razonamiento, visión
`grok-code-fast-1`	Grok Code Fast 1 (vía Venice)	256k	Razonamiento, programación

Descubrimiento de modelos

OpenClaw incluye un catálogo semilla de Venice respaldado por manifiesto para el listado de modelos de solo lectura. La actualización en tiempo de ejecución aún puede descubrir modelos desde la API de Venice y recurre al catálogo de manifiestos si la API es inalcanzable.

El punto final /models es público (no se requiere autenticación para el listado), pero la inferencia requiere una clave de API válida.

Soporte de transmisión y herramientas

Característica	Soporte
Transmisión (Streaming)	Todos los modelos
Llamada de funciones (Function calling)	La mayoría de los modelos (consulta `supportsFunctionCalling` en la API)
Visión/Imágenes	Modelos marcados con la característica “Visión”
Modo JSON	Soportado a través de `response_format`

Precios

Venice utiliza un sistema basado en créditos. Consulta venice.ai/pricing para las tarifas actuales:

Modelos privados: Generalmente menor costo
Modelos anonimizados: Similar a la precios de la API directa + pequeña tarifa de Venice

Venice (anonimizado) vs API directa

Aspecto	Venice (Anonimizado)	API directa
Privacidad	Metadatos eliminados, anonimizados	Su cuenta vinculada
Latencia	+10-50ms (proxy)	Directo
Características	La mayoría de las funciones compatibles	Funciones completas
Facturación	Créditos de Venice	Facturación del proveedor

Ejemplos de uso

# Use the default private model
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"

# Use Claude Opus via Venice (anonymized)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"

# Use uncensored model
openclaw agent --model venice/venice-uncensored --message "Draft options"

# Use vision model with image
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"

# Use coding model
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"

Solución de problemas

Clave de API no reconocida

echo $VENICE_API_KEY
openclaw models list | grep venice

Asegúrate de que la clave comience con vapi_.

Modelo no disponible

El catálogo de modelos de Venice se actualiza dinámicamente. Ejecuta openclaw models list para ver los modelos disponibles actualmente. Algunos modelos pueden estar temporalmente fuera de línea.

Problemas de conexión

La API de Venice está en https://api.venice.ai/api/v1. Asegúrate de que tu red permita conexiones HTTPS.

Configuración avanzada

Ejemplo de archivo de configuración

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}

Relacionado

Selección de modelo

Elección de proveedores, referencias de modelos y comportamiento de conmutación por error.

Venice AI

Página de inicio de Venice AI y registro de cuenta.

Documentación de la API

Referencia de la API de Venice y documentación para desarrolladores.

Precios

Tarifas y planes de crédito actuales de Venice.