Ollama
Ollama
Section titled “Ollama”Ollama 是一个本地 LLM 运行时,可让您轻松在机器上运行开源模型。OpenClaw 集成了 Ollama 的原生 API (/api/chat),支持流式传输和工具调用,并且当您选择加入 OLLAMA_API_KEY(或身份验证配置文件)且未定义明确的 models.providers.ollama 条目时,可以自动发现本地 Ollama 模型。
新手引导(推荐)
Section titled “新手引导(推荐)”设置 Ollama 最快的方法是通过新手引导:
openclaw onboard从提供商列表中选择 Ollama。新手引导将会:
- 询问可以访问您的实例的 Ollama 基本 URL(默认为
http://127.0.0.1:11434)。 - 让您选择 Cloud + Local(云端模型和本地模型)或 Local(仅本地模型)。
- 如果您选择 Cloud + Local 且尚未登录 ollama.com,则打开浏览器登录流程。
- 发现可用模型并建议默认模型。
- 如果所选模型在本地不可用,则自动拉取该模型。
也支持非交互模式:
openclaw onboard --non-interactive \ --auth-choice ollama \ --accept-risk可以选择指定自定义基础 URL 或模型:
openclaw onboard --non-interactive \ --auth-choice ollama \ --custom-base-url "http://ollama-host:11434" \ --custom-model-id "qwen3.5:27b" \ --accept-risk-
安装 Ollama:https://ollama.com/download
-
如果需要进行本地推理,请拉取一个本地模型:
ollama pull glm-4.7-flash# orollama pull gpt-oss:20b# orollama pull llama3.3- 如果您还需要云端模型,请登录:
ollama signin- 运行新手引导并选择
Ollama:
openclaw onboardLocal:仅限本地模型Cloud + Local:本地模型加上云端模型- 诸如
kimi-k2.5:cloud、minimax-m2.5:cloud和glm-5:cloud之类的云端模型不需要本地ollama pull
OpenClaw 目前建议:
- 本地默认值:
glm-4.7-flash - 云端默认值:
kimi-k2.5:cloud、minimax-m2.5:cloud、glm-5:cloud
- 如果您更喜欢手动设置,请直接为 Ollama 启用 OpenClaw(任何值均可;Ollama 不需要真实的密钥):
# Set environment variableexport OLLAMA_API_KEY="ollama-local"
# Or configure in your config fileopenclaw config set models.providers.ollama.apiKey "ollama-local"- 检查或切换模型:
openclaw models listopenclaw models set ollama/glm-4.7-flash- 或在配置中设置默认值:
{ agents: { defaults: { model: { primary: "ollama/glm-4.7-flash" }, }, },}模型发现(隐式提供商)
Section titled “模型发现(隐式提供商)”当您设置 OLLAMA_API_KEY(或身份验证配置文件)并且不定义 models.providers.ollama 时,OpenClaw 会从 http://127.0.0.1:11434 的本地 Ollama 实例发现模型:
- 查询
/api/tags - 使用尽力而为的
/api/show查找来读取contextWindow(如果可用) - 使用模型名称启发式方法 (
r1、reasoning、think) 标记reasoning - 将
maxTokens设置为 OpenClaw 使用的默认 Ollama 最大令牌上限 - 将所有成本设置为
0
这避免了手动输入模型,同时保持目录与本地 Ollama 实例同步。
要查看可用的模型:
ollama listopenclaw models list要添加新模型,只需使用 Ollama 拉取它:
ollama pull mistral新模型将被自动发现并可供使用。
如果你显式设置了 models.providers.ollama,则会跳过自动发现,并且必须手动定义模型(见下文)。
基本设置(隐式发现)
Section titled “基本设置(隐式发现)”启用 Ollama 的最简单方法是通过环境变量:
export OLLAMA_API_KEY="ollama-local"显式设置(手动模型)
Section titled “显式设置(手动模型)”在以下情况下使用显式配置:
- Ollama 运行在其他主机/端口上。
- 您想要强制特定的上下文窗口或模型列表。
- 您想要完全手动的模型定义。
{ models: { providers: { ollama: { baseUrl: "http://ollama-host:11434", apiKey: "ollama-local", api: "ollama", models: [ { id: "gpt-oss:20b", name: "GPT-OSS 20B", reasoning: false, input: ["text"], cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }, contextWindow: 8192, maxTokens: 8192 * 10 } ] } } }}如果设置了 OLLAMA_API_KEY,你可以在提供商条目中省略 apiKey,OpenClaw 将会为可用性检查填充它。
自定义基础 URL(显式配置)
Section titled “自定义基础 URL(显式配置)”如果 Ollama 在不同的主机或端口上运行(显式配置会禁用自动发现,因此请手动定义模型):
{ models: { providers: { ollama: { apiKey: "ollama-local", baseUrl: "http://ollama-host:11434", // No /v1 - use native Ollama API URL api: "ollama", // Set explicitly to guarantee native tool-calling behavior }, }, },}配置完成后,您的所有 Ollama 模型均可用:
{ agents: { defaults: { model: { primary: "ollama/gpt-oss:20b", fallbacks: ["ollama/llama3.3", "ollama/qwen2.5-coder:32b"], }, }, },}云模型允许你与本地模型一起运行云端托管的模型(例如 kimi-k2.5:cloud、minimax-m2.5:cloud、glm-5:cloud)。
要使用云模型,请在设置过程中选择 Cloud + Local 模式。向导会检查您是否已登录,并在需要时打开浏览器登录流程。如果无法验证身份,向导将回退到本地模型默认设置。
你也可以直接在 ollama.com/signin 登录。
Ollama 网络搜索
Section titled “Ollama 网络搜索”OpenClaw 还支持 Ollama 网络搜索作为捆绑的 web_search
提供商。
- 它使用你配置的 Ollama 主机(如果设置了
models.providers.ollama.baseUrl则使用该值,否则使用http://127.0.0.1:11434)。 - 它是免密钥的。
- 它要求 Ollama 正在运行并使用
ollama signin登录。
在 openclaw onboard 或
openclaw configure --section web 期间选择 Ollama 网络搜索,或者设置:
{ tools: { web: { search: { provider: "ollama", }, }, },}有关完整的设置和行为详细信息,请参阅 Ollama 网络搜索。
OpenClaw 默认将名称为 deepseek-r1、reasoning 或 think 等的模型视为具有推理能力:
ollama pull deepseek-r1:32bOllama 是免费且本地运行的,因此所有模型成本均设置为 $0。
OpenClaw 的 Ollama 集成默认使用 原生 Ollama API (/api/chat),它同时完全支持流式传输和工具调用。无需特殊配置。
旧版 OpenAI 兼容模式
Section titled “旧版 OpenAI 兼容模式”如果您需要改用 OpenAI 兼容的端点(例如,在仅支持 OpenAI 格式的代理后面),请显式设置 api: "openai-completions":
{ models: { providers: { ollama: { baseUrl: "http://ollama-host:11434/v1", api: "openai-completions", injectNumCtxForOpenAICompat: true, // default: true apiKey: "ollama-local", models: [...] } } }}此模式可能不支持同时进行流式传输和工具调用。您可能需要在模型配置中使用 params: { streaming: false } 禁用流式传输。
当 api: "openai-completions" 与 Ollama 一起使用时,OpenClaw 默认会注入 options.num_ctx,以免 Ollama 默默回退到 4096 的上下文窗口。如果您的代理/上游拒绝未知的 options 字段,请禁用此行为:
{ models: { providers: { ollama: { baseUrl: "http://ollama-host:11434/v1", api: "openai-completions", injectNumCtxForOpenAICompat: false, apiKey: "ollama-local", models: [...] } } }}对于自动发现的模型,OpenClaw 使用 Ollama 报告的上下文窗口(如果可用),否则回退到 Ollama 使用的默认 OpenClaw 上下文窗口。您可以在显式提供商配置中覆盖 contextWindow 和 maxTokens。
未检测到 Ollama
Section titled “未检测到 Ollama”请确保 Ollama 正在运行,并且您设置了 OLLAMA_API_KEY(或身份验证配置文件),并且您没有定义显式的 models.providers.ollama 条目:
ollama serve并且 API 是可访问的:
curl http://localhost:11434/api/tags没有可用的模型
Section titled “没有可用的模型”如果未列出您的模型,请执行以下操作之一:
- 在本地拉取模型,或
- 在
models.providers.ollama中显式定义模型。
要添加模型:
ollama list # See what's installedollama pull glm-4.7-flashollama pull gpt-oss:20bollama pull llama3.3 # Or another model检查 Ollama 是否在正确的端口上运行:
# Check if Ollama is runningps aux | grep ollama
# Or restart Ollamaollama serve