Hugging Face (inferencia)
Los proveedores de inferencia de Hugging Face ofrecen completaciones de chat compatibles con OpenAI a través de una única API de enrutamiento. Obtienes acceso a muchos modelos (DeepSeek, Llama y más) con un solo token. OpenClaw utiliza el endpoint compatible con OpenAI (solo completaciones de chat); para texto a imagen, incrustaciones o voz, usa los clientes de inferencia de HF directamente.
- Proveedor:
huggingface - Autenticación:
HUGGINGFACE_HUB_TOKENoHF_TOKEN(token de grano fino con Realizar llamadas a proveedores de inferencia) - API: Compatible con OpenAI (
https://router.huggingface.co/v1) - Facturación: Token único de HF; precios sigue las tarifas del proveedor con un nivel gratuito.
Primeros pasos
Sección titulada «Primeros pasos»Crear un token de grano fino
Ve a Tokens de configuración de Hugging Face y crea un nuevo token de grano fino.
Ejecutar la incorporación
Elige Hugging Face en el menú desplegable de proveedores, luego ingresa tu clave de API cuando se te solicite:
Ventana de terminal openclaw onboard --auth-choice huggingface-api-keySeleccionar un modelo predeterminado
En el menú desplegable Modelo Hugging Face predeterminado, elige el modelo que deseas. La lista se carga desde la API de inferencia cuando tienes un token válido; de lo contrario, se muestra una lista integrada. Tu elección se guarda como el modelo predeterminado.
También puedes establecer o cambiar el modelo predeterminado más tarde en la configuración:
{agents: {defaults: {model: { primary: "huggingface/deepseek-ai/DeepSeek-R1" },},},}Verificar que el modelo esté disponible
Ventana de terminal openclaw models list --provider huggingface
Configuración no interactiva
Sección titulada «Configuración no interactiva»openclaw onboard --non-interactive \ --mode local \ --auth-choice huggingface-api-key \ --huggingface-api-key "$HF_TOKEN"Esto establecerá huggingface/deepseek-ai/DeepSeek-R1 como el modelo predeterminado.
ID de modelo
Sección titulada «ID de modelo»Las referencias de modelos utilizan el formato huggingface/<org>/<model> (ID de estilo Hub). La lista a continuación proviene de GET https://router.huggingface.co/v1/models; tu catálogo puede incluir más.
| Modelo | Ref (con el prefijo huggingface/) |
|---|---|
| DeepSeek R1 | deepseek-ai/DeepSeek-R1 |
| DeepSeek V3.2 | deepseek-ai/DeepSeek-V3.2 |
| Qwen3 8B | Qwen/Qwen3-8B |
| Qwen2.5 7B Instruct | Qwen/Qwen2.5-7B-Instruct |
| Qwen3 32B | Qwen/Qwen3-32B |
| Llama 3.3 70B Instruct | meta-llama/Llama-3.3-70B-Instruct |
| Llama 3.1 8B Instruct | meta-llama/Llama-3.1-8B-Instruct |
| GPT-OSS 120B | openai/gpt-oss-120b |
| GLM 4.7 | zai-org/GLM-4.7 |
| Kimi K2.5 | moonshotai/Kimi-K2.5 |
Configuración avanzada
Sección titulada «Configuración avanzada»Model discovery and onboarding dropdown
OpenClaw descubre los modelos llamando al Inference endpoint directamente:
GET https://router.huggingface.co/v1/models(Opcional: envía Authorization: Bearer $HUGGINGFACE_HUB_TOKEN o $HF_TOKEN para obtener la lista completa; algunos endpoints devuelven un subconjunto sin autenticación). La respuesta es de estilo OpenAI { "object": "list", "data": [ { "id": "Qwen/Qwen3-8B", "owned_by": "Qwen", ... }, ... ] }.
Cuando configuras una clave de API de Hugging Face (vía onboarding, HUGGINGFACE_HUB_TOKEN, o HF_TOKEN), OpenClaw utiliza este GET para descubrir los modelos de chat-completion disponibles. Durante la configuración interactiva, después de ingresar tu token, verás un menú desplegable de Default Hugging Face model rellenado a partir de esa lista (o el catálogo integrado si la solicitud falla). En tiempo de ejecución (por ejemplo, al iniciar el Gateway), cuando hay una clave presente, OpenClaw vuelve a llamar a GET https://router.huggingface.co/v1/models para actualizar el catálogo. La lista se fusiona con un catálogo integrado (para metadatos como la ventana de contexto y el costo). Si la solicitud falla o no se establece ninguna clave, solo se utiliza el catálogo integrado.
Nombres de modelos, alias y sufijos de política
- Nombre de la API: El nombre visible del modelo se obtiene de GET /v1/models cuando la API devuelve
name,titleodisplay_name; de lo contrario, se deriva del id del modelo (por ejemplo,deepseek-ai/DeepSeek-R1se convierte en “DeepSeek R1”). - Sobrescribir nombre visible: Puede establecer una etiqueta personalizada por modelo en la configuración para que aparezca como desee en la CLI y la UI:
{ agents: { defaults: { models: { "huggingface/deepseek-ai/DeepSeek-R1": { alias: "DeepSeek R1 (fast)" }, "huggingface/deepseek-ai/DeepSeek-R1:cheapest": { alias: "DeepSeek R1 (cheap)" }, }, }, },}-
Sufijos de política: La documentación y las utilidades de Hugging Face incluidas en OpenClaw actualmente tratan estos dos sufijos como variantes de política integradas:
:fastest— máximo rendimiento.:cheapest— menor costo por token de salida.
Puede agregarlos como entradas separadas en
models.providers.huggingface.modelso establecermodel.primarycon el sufijo. También puede establecer su orden predeterminado de proveedores en Configuración del proveedor de inferencia (sin sufijo = usar ese orden). -
Fusión de configuración: Las entradas existentes en
models.providers.huggingface.models(por ejemplo, enmodels.json) se mantienen cuando se fusiona la configuración. Por lo tanto, cualquiername,aliasu opciones de modelo que establezca allí se conservan.
Configuración de entorno y demonio
Si el Gateway se ejecuta como un demonio (launchd/systemd), asegúrese de que HUGGINGFACE_HUB_TOKEN o HF_TOKEN estén disponibles para ese proceso (por ejemplo, en ~/.openclaw/.env o a través de env.shellEnv).
Config: DeepSeek R1 con respaldo Qwen
{ agents: { defaults: { model: { primary: "huggingface/deepseek-ai/DeepSeek-R1", fallbacks: ["huggingface/Qwen/Qwen3-8B"], }, models: { "huggingface/deepseek-ai/DeepSeek-R1": { alias: "DeepSeek R1" }, "huggingface/Qwen/Qwen3-8B": { alias: "Qwen3 8B" }, }, }, },}Config: Qwen con las variantes más económicas y rápidas
{ agents: { defaults: { model: { primary: "huggingface/Qwen/Qwen3-8B" }, models: { "huggingface/Qwen/Qwen3-8B": { alias: "Qwen3 8B" }, "huggingface/Qwen/Qwen3-8B:cheapest": { alias: "Qwen3 8B (cheapest)" }, "huggingface/Qwen/Qwen3-8B:fastest": { alias: "Qwen3 8B (fastest)" }, }, }, },}Config: DeepSeek + Llama + GPT-OSS con alias
{ agents: { defaults: { model: { primary: "huggingface/deepseek-ai/DeepSeek-V3.2", fallbacks: [ "huggingface/meta-llama/Llama-3.3-70B-Instruct", "huggingface/openai/gpt-oss-120b", ], }, models: { "huggingface/deepseek-ai/DeepSeek-V3.2": { alias: "DeepSeek V3.2" }, "huggingface/meta-llama/Llama-3.3-70B-Instruct": { alias: "Llama 3.3 70B" }, "huggingface/openai/gpt-oss-120b": { alias: "GPT-OSS 120B" }, }, }, },}Config: Múltiples Qwen y DeepSeek con sufijos de política
{ agents: { defaults: { model: { primary: "huggingface/Qwen/Qwen2.5-7B-Instruct:cheapest" }, models: { "huggingface/Qwen/Qwen2.5-7B-Instruct": { alias: "Qwen2.5 7B" }, "huggingface/Qwen/Qwen2.5-7B-Instruct:cheapest": { alias: "Qwen2.5 7B (cheap)" }, "huggingface/deepseek-ai/DeepSeek-R1:fastest": { alias: "DeepSeek R1 (fast)" }, "huggingface/meta-llama/Llama-3.1-8B-Instruct": { alias: "Llama 3.1 8B" }, }, }, },}Relacionado
Sección titulada «Relacionado»Resumen de todos los proveedores, referencias de modelos y comportamiento de conmutación por error.
Cómo elegir y configurar modelos.
Documentación oficial de Hugging Face Inference Providers.
Referencia completa de configuración.