SGLang

SGLang peut servir des modèles open source via une OpenAI HTTP compatible API. OpenClaw peut se connecter à SGLang en utilisant l’API openai-completions.

OpenClaw peut également découvrir automatiquement les modèles disponibles depuis SGLang lorsque vous activez l’option avec SGLANG_API_KEY (n’importe quelle valeur fonctionne si votre serveur n’applique pas l’authentification) et que vous ne définissez pas explicitement d’entrée models.providers.sglang.

Quick start

Démarrez SGLang avec un serveur compatible OpenAI.

Votre URL de base doit exposer des points de terminaison /v1 (par exemple /v1/models, /v1/chat/completions). SGLang s’exécute généralement sur :

http://127.0.0.1:30000/v1

Activez l’option (n’importe quelle valeur fonctionne si aucune authentification n’est configurée) :

export SGLANG_API_KEY="sglang-local"

Exécutez l’onboarding et choisissez SGLang, ou définissez directement un modèle :

openclaw onboard

{
  agents: {
    defaults: {
      model: { primary: "sglang/your-model-id" },
    },
  },
}

Model discovery (implicit provider)

Lorsque SGLANG_API_KEY est défini (ou qu’un profil d’authentification existe) et que vous ne définissez pas models.providers.sglang, OpenClaw interrogera :

GET http://127.0.0.1:30000/v1/models

et convertira les IDs renvoyés en entrées de modèles.

Si vous définissez models.providers.sglang explicitement, la découverte automatique est ignorée et vous devez définir les modèles manuellement.

Explicit configuration (manual models)

Utilisez une configuration explicite lorsque :

SGLang s’exécute sur un hôte/port différent.
Vous souhaitez épingler les valeurs contextWindow/maxTokens.
Votre serveur nécessite une vraie clé API (ou vous souhaitez contrôler les en-têtes).

{
  models: {
    providers: {
      sglang: {
        baseUrl: "http://127.0.0.1:30000/v1",
        apiKey: "${SGLANG_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "your-model-id",
            name: "Local SGLang Model",
            reasoning: false,
            input: ["text"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 128000,
            maxTokens: 8192,
          },
        ],
      },
    },
  },
}

Troubleshooting

Vérifiez que le serveur est accessible :

curl http://127.0.0.1:30000/v1/models

Si les requêtes échouent avec des erreurs d’authentification, définissez une vraie valeur SGLANG_API_KEY correspondant à la configuration de votre serveur, ou configurez le provider explicitement sous models.providers.sglang.