Token 使用與成本

OpenClaw 追蹤的是 Token，而不是字元。Token 因模型而異，但大多數 OpenAI 風格的模型對於英文文字平均每個 Token 約為 4 個字元。

系統提示詞的建構方式

OpenClaw 每次執行時都會組裝自己的系統提示詞。它包含：

工具列表 + 簡短描述
技能列表（僅限元資料；指令會透過 read 按需載入）
自我更新指令
工作區 + 引導檔案（AGENTS.md、SOUL.md、TOOLS.md、IDENTITY.md、USER.md、HEARTBEAT.md、BOOTSTRAP.md 當它們是新的時）。大型檔案會被 agents.defaults.bootstrapMaxChars 截斷（預設值：20000）。
時間（UTC + 使用者時區）
回覆標籤 + 心跳行為
執行時期元資料（主機/作業系統/模型/思考）

請參閱系統提示詞以瞭解完整細目。

計入上下文視窗的內容

模型收到的所有內容都會計入上下文限制：

系統提示詞（上文列出的所有部分）
對話歷史記錄（使用者 + 助手訊息）
工具呼叫和工具結果
附件/逐字稿（圖片、音訊、檔案）
壓縮摘要和修剪產物
提供者包裝器或安全標頭（不可見，但仍會計入）

若要查看實用細目（針對每個注入的檔案、工具、技能和系統提示詞大小），請使用 /context list 或 /context detail。請參閱上下文。

如何查看目前 Token 使用量

在聊天中使用這些指令：

/status → 顯示包含工作階段模型、上下文使用量、最後一次回應的輸入/輸出 Token，以及 預估成本（僅限 API 金鑰）的 豐富表情符號狀態卡片。
/usage off|tokens|full → 在每次回應後附加 每次回應的使用量頁尾。
- 每個工作階段都會持續存在（儲存為 responseUsage）。
- OAuth 驗證會隱藏成本（僅顯示 Token）。
/usage cost → 顯示來自 OpenClaw 會話日誌的本地成本摘要。

其他介面：

TUI/Web TUI： 支援 /status + /usage。
CLI： openclaw status --usage 和 openclaw channels list 顯示供應商配額視窗（而非每次回應的成本）。

成本估算（顯示時）

成本是根據您的模型定價配置估算的：

models.providers.<provider>.models[].cost

這些是 input、output、cacheRead 和 cacheWrite 的 每 100 萬個 Token 的美元價格。如果缺少定價，OpenClaw 僅顯示 Token。OAuth Token 從不顯示美元成本。

快取 TTL 和修剪影響

供應商提示快取僅在快取 TTL 視窗內適用。OpenClaw 可以選擇執行 cache-ttl 修剪：一旦快取 TTL 過期，它就會修剪會話，然後重設快取視窗，以便後續請求可以重新使用新快取的上下文，而不是重新快取完整的歷史記錄。這可以降低當會話閒置超過 TTL 時的快取寫入成本。

在 Gateway configuration 中配置它，並在 Session pruning 中查看行為詳情。

心跳可以在閒置期間保持快取溫熱。如果您的模型快取 TTL 是 1h，將心跳間隔設定為略低於該值（例如 55m）可以避免重新快取完整的提示，從而降低快取寫入成本。

對於 Anthropic API 定價，快取讀取比輸入 Token 便宜得多，而快取寫入則按更高的倍率計費。請參閱 Anthropic 的提示快取定價以獲取最新費率和 TTL 倍率： https://docs.anthropic.com/docs/build-with-claude/prompt-caching

範例：使用心跳保持 1 小時快取溫熱

agents:
  defaults:
    model:
      primary: "anthropic/claude-opus-4-5"
    models:
      "anthropic/claude-opus-4-5":
        params:
          cacheRetention: "long"
    heartbeat:
      every: "55m"

減少 Token 壓力的技巧

使用 /compact 來總結長會話。
修剪工作流程中的大型工具輸出。
保持技能描述簡短（技能清單會注入提示中）。
對於冗長、探索性的工作，首選較小的模型。

請參閱 Skills 以了解確切的技能清單開銷公式。