Aller au contenu

Ollama

Ollama est un runtime LLM local qui facilite l’exécution de modèles open-source sur votre machine. OpenClaw s’intègre à l’Ollama native de API (/api/chat), prend en charge le streaming et l’appel d’outils, et peut découvrir automatiquement les modèles Ollama locaux lorsque vous activez l’option avec OLLAMA_API_KEY (ou un profil d’authentification) et que vous ne définissez pas d’entrée models.providers.ollama explicite.

Le moyen le plus rapide de configurer Ollama passe par l’onboarding :

Fenêtre de terminal
openclaw onboard

Sélectionnez Ollama dans la liste des providers. L’onboarding va :

  1. Demander l’URL de base de Ollama où votre instance peut être atteinte (par défaut http://127.0.0.1:11434).
  2. Vous laisser choisir Cloud + Local (modèles cloud et modèles locaux) ou Local (modèles locaux uniquement).
  3. Ouvrir un flux de connexion dans le navigateur si vous choisissez Cloud + Local et que vous n’êtes pas connecté à ollama.com.
  4. Découvrir les modèles disponibles et suggérer les valeurs par défaut.
  5. Tirer automatiquement le modèle sélectionné s’il n’est pas disponible localement.

Le mode non interactif est également pris en charge :

Fenêtre de terminal
openclaw onboard --non-interactive \
--auth-choice ollama \
--accept-risk

Spécifiez éventuellement une URL de base personnalisée ou un modèle :

Fenêtre de terminal
openclaw onboard --non-interactive \
--auth-choice ollama \
--custom-base-url "http://ollama-host:11434" \
--custom-model-id "qwen3.5:27b" \
--accept-risk
  1. Installez Ollama : https://ollama.com/download

  2. Tirez un modèle local si vous souhaitez une inférence locale :

Fenêtre de terminal
ollama pull glm-4.7-flash
# or
ollama pull gpt-oss:20b
# or
ollama pull llama3.3
  1. Si vous souhaitez également des modèles cloud, connectez-vous :
Fenêtre de terminal
ollama signin
  1. Lancez l’intégration et choisissez Ollama :
Fenêtre de terminal
openclaw onboard
  • Local : modèles locaux uniquement
  • Cloud + Local : modèles locaux plus modèles cloud
  • Les modèles cloud tels que kimi-k2.5:cloud, minimax-m2.5:cloud et glm-5:cloud ne nécessitent pas de ollama pull local

OpenClaw suggère actuellement :

  • défaut local : glm-4.7-flash
  • défauts cloud : kimi-k2.5:cloud, minimax-m2.5:cloud, glm-5:cloud
  1. Si vous préférez une configuration manuelle, activez Ollama pour OpenClaw directement (n’importe quelle valeur fonctionne ; Ollama ne nécessite pas de vraie clé) :
Fenêtre de terminal
# Set environment variable
export OLLAMA_API_KEY="ollama-local"
# Or configure in your config file
openclaw config set models.providers.ollama.apiKey "ollama-local"
  1. Inspecter ou changer de modèles :
Fenêtre de terminal
openclaw models list
openclaw models set ollama/glm-4.7-flash
  1. Ou définir la valeur par défaut dans la configuration :
{
agents: {
defaults: {
model: { primary: "ollama/glm-4.7-flash" },
},
},
}

Lorsque vous définissez OLLAMA_API_KEY (ou un profil d’authentification) et que vous ne définissez pas models.providers.ollama, OpenClaw découvre les modèles depuis l’instance locale Ollama à http://127.0.0.1:11434 :

  • Interroge /api/tags
  • Utilise des recherches /api/show au mieux pour lire contextWindow lorsque disponible
  • Marque reasoning avec une heuristique de nom de modèle (r1, reasoning, think)
  • Définit maxTokens à la limite maximale de jetons par défaut Ollama utilisée par OpenClaw
  • Définit tous les coûts à 0

Cela évite les entrées de modèle manuelles tout en gardant le catalogue aligné avec l’instance locale Ollama.

Pour voir quels modèles sont disponibles :

Fenêtre de terminal
ollama list
openclaw models list

Pour ajouter un nouveau modèle, il suffit de le tirer avec Ollama :

Fenêtre de terminal
ollama pull mistral

Le nouveau modèle sera découvert automatiquement et disponible à l’utilisation.

Si vous définissez models.providers.ollama explicitement, la découverte automatique est ignorée et vous devez définir les modèles manuellement (voir ci-dessous).

Le moyen le plus simple d’activer Ollama est via une variable d’environnement :

Fenêtre de terminal
export OLLAMA_API_KEY="ollama-local"

Utilisez une configuration explicite lorsque :

  • Ollama s’exécute sur un autre hôte/port.
  • Vous voulez forcer des fenêtres de contexte ou des listes de modèles spécifiques.
  • Vous voulez des définitions de modèles entièrement manuelles.
{
models: {
providers: {
ollama: {
baseUrl: "http://ollama-host:11434",
apiKey: "ollama-local",
api: "ollama",
models: [
{
id: "gpt-oss:20b",
name: "GPT-OSS 20B",
reasoning: false,
input: ["text"],
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
contextWindow: 8192,
maxTokens: 8192 * 10
}
]
}
}
}
}

Si OLLAMA_API_KEY est défini, vous pouvez omettre apiKey dans l’entrée du fournisseur et OpenClaw le remplira pour les vérifications de disponibilité.

URL de base personnalisée (configuration explicite)

Section intitulée « URL de base personnalisée (configuration explicite) »

Si Ollama s’exécute sur un hôte ou un port différent (la configuration explicite désactive la découverte automatique, définissez donc les modèles manuellement) :

{
models: {
providers: {
ollama: {
apiKey: "ollama-local",
baseUrl: "http://ollama-host:11434", // No /v1 - use native Ollama API URL
api: "ollama", // Set explicitly to guarantee native tool-calling behavior
},
},
},
}

Une fois configuré, tous vos modèles Ollama sont disponibles :

{
agents: {
defaults: {
model: {
primary: "ollama/gpt-oss:20b",
fallbacks: ["ollama/llama3.3", "ollama/qwen2.5-coder:32b"],
},
},
},
}

Les modèles cloud vous permettent d’exécuter des modèles hébergés dans le cloud (par exemple kimi-k2.5:cloud, minimax-m2.5:cloud, glm-5:cloud) aux côtés de vos modèles locaux.

Pour utiliser des modèles cloud, sélectionnez le mode Cloud + Local lors de la configuration. L’assistant vérifie si vous êtes connecté et ouvre un flux de connexion dans le navigateur si nécessaire. Si l’authentification ne peut pas être vérifiée, l’assistant revient aux paramètres par défaut des modèles locaux.

Vous pouvez également vous connecter directement à ollama.com/signin.

OpenClaw considère par défaut les modèles portant des noms tels que deepseek-r1, reasoning ou think comme capables de raisonnement :

Fenêtre de terminal
ollama pull deepseek-r1:32b

Ollama est gratuit et fonctionne localement, tous les coûts des modèles sont donc fixés à 0 $.

L’intégration OpenClaw de Ollama utilise l’Ollama API native (/api/chat) par défaut, ce qui prend entièrement en charge le streaming et l’appel d’outils simultanément. Aucune configuration spéciale n’est nécessaire.

Si vous devez utiliser le point de terminaison compatible OpenAI à la place (par exemple, derrière un proxy qui ne prend en charge que le format OpenAI), définissez api: "openai-completions" explicitement :

{
models: {
providers: {
ollama: {
baseUrl: "http://ollama-host:11434/v1",
api: "openai-completions",
injectNumCtxForOpenAICompat: true, // default: true
apiKey: "ollama-local",
models: [...]
}
}
}
}

Ce mode peut ne pas prendre en charge simultanément le streaming et l’appel d’outils. Vous devrez peut-être désactiver le streaming avec params: { streaming: false } dans la configuration du modèle.

Lorsque api: "openai-completions" est utilisé avec Ollama, OpenClaw injecte options.num_ctx par défaut pour éviter que Ollama ne revienne silencieusement à une fenêtre de contexte de 4096. Si votre proxy ou votre serveur amont rejette les champs options inconnus, désactivez ce comportement :

{
models: {
providers: {
ollama: {
baseUrl: "http://ollama-host:11434/v1",
api: "openai-completions",
injectNumCtxForOpenAICompat: false,
apiKey: "ollama-local",
models: [...]
}
}
}
}

Pour les modèles découverts automatiquement, OpenClaw utilise la fenêtre de contexte signalée par Ollama si elle est disponible, sinon elle revient à la fenêtre de contexte Ollama par défaut utilisée par OpenClaw. Vous pouvez remplacer contextWindow et maxTokens dans la configuration explicite du fournisseur.

Assurez-vous que Ollama est en cours d’exécution, que vous avez défini OLLAMA_API_KEY (ou un profil d’authentification), et que vous n’avez pas défini d’entrée explicite models.providers.ollama :

Fenêtre de terminal
ollama serve

Et que l’API est accessible :

Fenêtre de terminal
curl http://localhost:11434/api/tags

Si votre modèle n’est pas répertorié, soit :

  • Tirez le modèle localement, ou
  • Définissez le modèle explicitement dans models.providers.ollama.

Pour ajouter des modèles :

Fenêtre de terminal
ollama list # See what's installed
ollama pull glm-4.7-flash
ollama pull gpt-oss:20b
ollama pull llama3.3 # Or another model

Vérifiez que Ollama s’exécute sur le bon port :

Fenêtre de terminal
# Check if Ollama is running
ps aux | grep ollama
# Or restart Ollama
ollama serve