Aller au contenu

SGLang

SGLang peut servir des modèles open source via une OpenAI HTTP compatible API. OpenClaw peut se connecter à SGLang en utilisant l’API openai-completions.

OpenClaw peut également découvrir automatiquement les modèles disponibles depuis SGLang lorsque vous activez l’option avec SGLANG_API_KEY (n’importe quelle valeur fonctionne si votre serveur n’applique pas l’authentification) et que vous ne définissez pas explicitement d’entrée models.providers.sglang.

  1. Démarrez SGLang avec un serveur compatible OpenAI.

Votre URL de base doit exposer des points de terminaison /v1 (par exemple /v1/models, /v1/chat/completions). SGLang s’exécute généralement sur :

  • http://127.0.0.1:30000/v1
  1. Activez l’option (n’importe quelle valeur fonctionne si aucune authentification n’est configurée) :
Fenêtre de terminal
export SGLANG_API_KEY="sglang-local"
  1. Exécutez l’onboarding et choisissez SGLang, ou définissez directement un modèle :
Fenêtre de terminal
openclaw onboard
{
agents: {
defaults: {
model: { primary: "sglang/your-model-id" },
},
},
}

Lorsque SGLANG_API_KEY est défini (ou qu’un profil d’authentification existe) et que vous ne définissez pas models.providers.sglang, OpenClaw interrogera :

  • GET http://127.0.0.1:30000/v1/models

et convertira les IDs renvoyés en entrées de modèles.

Si vous définissez models.providers.sglang explicitement, la découverte automatique est ignorée et vous devez définir les modèles manuellement.

Utilisez une configuration explicite lorsque :

  • SGLang s’exécute sur un hôte/port différent.
  • Vous souhaitez épingler les valeurs contextWindow/maxTokens.
  • Votre serveur nécessite une vraie clé API (ou vous souhaitez contrôler les en-têtes).
{
models: {
providers: {
sglang: {
baseUrl: "http://127.0.0.1:30000/v1",
apiKey: "${SGLANG_API_KEY}",
api: "openai-completions",
models: [
{
id: "your-model-id",
name: "Local SGLang Model",
reasoning: false,
input: ["text"],
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
contextWindow: 128000,
maxTokens: 8192,
},
],
},
},
},
}
  • Vérifiez que le serveur est accessible :
Fenêtre de terminal
curl http://127.0.0.1:30000/v1/models
  • Si les requêtes échouent avec des erreurs d’authentification, définissez une vraie valeur SGLANG_API_KEY correspondant à la configuration de votre serveur, ou configurez le provider explicitement sous models.providers.sglang.