LM Studio
LM Studio es una aplicación amigable pero potente para ejecutar modelos de pesos abiertos en su propio hardware. Le permite ejecutar modelos llama.cpp (GGUF) o MLX (Apple Silicon). Viene en un paquete con interfaz gráfica o como demonio sin interfaz (llmster). Para ver la documentación del producto y la configuración, consulte lmstudio.ai.
Inicio rápido
Sección titulada «Inicio rápido»- Instale LM Studio (escritorio) o
llmster(sin interfaz), luego inicie el servidor local:
curl -fsSL https://lmstudio.ai/install.sh | bash- Iniciar el servidor
Asegúrate de iniciar la aplicación de escritorio o ejecutar el demonio usando el siguiente comando:
lms daemon uplms server start --port 1234Si está utilizando la aplicación, asegúrese de tener JIT habilitado para una experiencia fluida. Obtenga más información en la guía de LM Studio JIT y TTL.
- Si la autenticación de LM Studio está habilitada, configure
LM_API_TOKEN:
export LM_API_TOKEN="your-lm-studio-api-token"Si la autenticación de LM Studio está deshabilitada, puedes dejar la clave API en blanco durante la configuración interactiva de OpenClaw.
Para obtener detalles sobre la configuración de autenticación de LM Studio, consulte Autenticación de LM Studio.
- Ejecute la incorporación y elija
LM Studio:
openclaw onboard- Durante la incorporación, use el mensaje
Default modelpara elegir su modelo de LM Studio.
También puedes establecerlo o cambiarlo más tarde:
openclaw models set lmstudio/qwen/qwen3.5-9bLas claves de modelo de LM Studio siguen un formato author/model-name (p. ej. qwen/qwen3.5-9b). Las referencias de modelo de OpenClaw anteponen el nombre del proveedor: lmstudio/qwen/qwen3.5-9b. Puede encontrar la clave exacta de un modelo ejecutando curl http://localhost:1234/api/v1/models y mirando el campo key.
Incorporación no interactiva
Sección titulada «Incorporación no interactiva»Utiliza la incorporación no interactiva cuando desees automatizar la configuración (CI, aprovisionamiento, inicio remoto):
openclaw onboard \ --non-interactive \ --accept-risk \ --auth-choice lmstudioO especifica la URL base, el modelo y la clave API opcional:
openclaw onboard \ --non-interactive \ --accept-risk \ --auth-choice lmstudio \ --custom-base-url http://localhost:1234/v1 \ --lmstudio-api-key "$LM_API_TOKEN" \ --custom-model-id qwen/qwen3.5-9b--custom-model-id toma la clave del modelo tal como la devuelve LM Studio (p. ej. qwen/qwen3.5-9b), sin el prefijo del proveedor lmstudio/.
Para servidores LM Studio autenticados, pase --lmstudio-api-key o configure LM_API_TOKEN.
Para servidores LM Studio no autenticados, omita la clave; OpenClaw almacena un marcador local no secreto.
--custom-api-key sigue siendo compatible, pero se prefiere --lmstudio-api-key para LM Studio.
Esto escribe models.providers.lmstudio y establece el modelo predeterminado en lmstudio/<custom-model-id>. Cuando proporciona una clave de API, la configuración también escribe el perfil de autenticación lmstudio:default.
La configuración interactiva puede solicitar una longitud de contexto de carga preferida opcional y la aplica en los modelos de LM Studio descubiertos que guarda en la configuración.
La configuración del complemento LM Studio confía en el punto de conexión de LM Studio configurado para las solicitudes de modelo, incluidos los hosts de loopback, LAN y tailnet. Los orígenes de metadatos/enlace local todavía requieren consentimiento explícito. Puede optar por no participar estableciendo models.providers.lmstudio.request.allowPrivateNetwork: false.
Configuración
Sección titulada «Configuración»Compatibilidad de uso de transmisión
Sección titulada «Compatibilidad de uso de transmisión»LM Studio es compatible con el uso en streaming. Cuando no emite un objeto
usage con formato OpenAI, OpenClaw recupera los recuentos de tokens de los metadatos
timings.prompt_n / timings.predicted_n estilo llama.cpp.
El mismo comportamiento de uso de transmisión se aplica a estos backends locales compatibles con OpenAI:
- vLLM
- SGLang
- llama.cpp
- LocalAI
- Jan
- TabbyAPI
- text-generation-webui
Compatibilidad de pensamiento (Thinking)
Sección titulada «Compatibilidad de pensamiento (Thinking)»Cuando el descubrimiento de /api/v1/models de LM Studio informa opciones de razonamiento específicas del modelo,
OpenClaw expone los valores reasoning_effort compatibles con OpenAI correspondientes
en los metadatos de compatibilidad del modelo. Las compilaciones actuales de LM Studio pueden anunciar opciones de interfaz binarias
tales como allowed_options: ["off", "on"] mientras rechazan esos valores
en /v1/chat/completions; OpenClaw normaliza esa forma de descubrimiento binario a
none, minimal, low, medium, high y xhigh antes de enviar solicitudes.
La configuración antigua guardada de LM Studio que contiene mapas de razonamiento off/on se
normaliza de la misma manera cuando se carga el catálogo.
Configuración explícita
Sección titulada «Configuración explícita»{ models: { providers: { lmstudio: { baseUrl: "http://localhost:1234/v1", apiKey: "${LM_API_TOKEN}", api: "openai-completions", models: [ { id: "qwen/qwen3-coder-next", name: "Qwen 3 Coder Next", reasoning: false, input: ["text"], cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }, contextWindow: 128000, maxTokens: 8192, }, ], }, }, },}Solución de problemas
Sección titulada «Solución de problemas»No se detecta LM Studio
Sección titulada «No se detecta LM Studio»Asegúrese de que LM Studio se esté ejecutando. Si la autenticación está habilitada, también establezca LM_API_TOKEN:
# Start via desktop app, or headless:lms server start --port 1234Verifica que la API sea accesible:
curl http://localhost:1234/api/v1/modelsErrores de autenticación (HTTP 401)
Sección titulada «Errores de autenticación (HTTP 401)»Si la configuración informa HTTP 401, verifica tu clave API:
- Compruebe que
LM_API_TOKENcoincida con la clave configurada en LM Studio. - Para obtener detalles sobre la configuración de autenticación de LM Studio, consulte Autenticación de LM Studio.
- Si tu servidor no requiere autenticación, deja la clave en blanco durante la configuración.
Carga de modelos justo a tiempo (Just-in-time)
Sección titulada «Carga de modelos justo a tiempo (Just-in-time)»LM Studio admite la carga de modelos justo a tiempo (JIT), donde los modelos se cargan en la primera solicitud. OpenClaw precarga los modelos a través del punto final de carga nativo de LM Studio de forma predeterminada, lo cual ayuda cuando JIT está deshabilitado. Para permitir que el comportamiento JIT, TTL de inactividad y desalojo automático de LM Studio controlen el ciclo de vida del modelo, desactive el paso de precarga de OpenClaw:
{ models: { providers: { lmstudio: { baseUrl: "http://localhost:1234/v1", api: "openai-completions", params: { preload: false }, models: [{ id: "qwen/qwen3.5-9b" }], }, }, },}Host de LM Studio en LAN o tailnet
Sección titulada «Host de LM Studio en LAN o tailnet»Use la dirección accesible del host de LM Studio, mantenga /v1 y asegúrese de que LM Studio esté vinculado más allá del loopback en esa máquina:
{ models: { providers: { lmstudio: { baseUrl: "http://gpu-box.local:1234/v1", apiKey: "lmstudio", api: "openai-completions", models: [{ id: "qwen/qwen3.5-9b" }], }, }, },}lmstudio confía automáticamente en su punto de conexión local/privado configurado para las solicitudes de modelo protegidas. Las entradas de proveedores personalizadas/local compatibles con OpenAI también confían en su origen baseUrl configurado exacto, excepto los orígenes de metadatos/enlace local; las solicitudes a diferentes puertos privados o destinos todavía requieren models.providers.<id>.request.allowPrivateNetwork: true. Establezca models.providers.<id>.request.allowPrivateNetwork: false para no participar en la confianza de origen exacto.