Token 使用與成本
Token 使用與成本
Section titled “Token 使用與成本”OpenClaw 追蹤的是 Token,而不是字元。Token 因模型而異,但大多數 OpenAI 風格的模型對於英文文字平均每個 Token 約為 4 個字元。
系統提示詞的建構方式
Section titled “系統提示詞的建構方式”OpenClaw 每次執行時都會組裝自己的系統提示詞。它包含:
- 工具列表 + 簡短描述
- 技能列表(僅限元資料;指令會透過
read按需載入) - 自我更新指令
- 工作區 + 引導檔案(
AGENTS.md、SOUL.md、TOOLS.md、IDENTITY.md、USER.md、HEARTBEAT.md、BOOTSTRAP.md當它們是新的時)。大型檔案會被agents.defaults.bootstrapMaxChars截斷(預設值:20000)。 - 時間(UTC + 使用者時區)
- 回覆標籤 + 心跳行為
- 執行時期元資料(主機/作業系統/模型/思考)
請參閱 系統提示詞 以瞭解完整細目。
計入上下文視窗的內容
Section titled “計入上下文視窗的內容”模型收到的所有內容都會計入上下文限制:
- 系統提示詞(上文列出的所有部分)
- 對話歷史記錄(使用者 + 助手訊息)
- 工具呼叫和工具結果
- 附件/逐字稿(圖片、音訊、檔案)
- 壓縮摘要和修剪產物
- 提供者包裝器或安全標頭(不可見,但仍會計入)
若要查看實用細目(針對每個注入的檔案、工具、技能和系統提示詞大小),請使用 /context list 或 /context detail。請參閱 上下文。
如何查看目前 Token 使用量
Section titled “如何查看目前 Token 使用量”在聊天中使用這些指令:
/status→ 顯示包含工作階段模型、上下文使用量、 最後一次回應的輸入/輸出 Token,以及 預估成本(僅限 API 金鑰)的 豐富表情符號狀態卡片。/usage off|tokens|full→ 在每次回應後附加 每次回應的使用量頁尾。- 每個工作階段都會持續存在(儲存為
responseUsage)。 - OAuth 驗證會隱藏成本(僅顯示 Token)。
- 每個工作階段都會持續存在(儲存為
/usage cost→ 顯示來自 OpenClaw 會話日誌的本地成本摘要。
其他介面:
- TUI/Web TUI: 支援
/status+/usage。 - CLI:
openclaw status --usage和openclaw channels list顯示 供應商配額視窗(而非每次回應的成本)。
成本估算(顯示時)
Section titled “成本估算(顯示時)”成本是根據您的模型定價配置估算的:
models.providers.<provider>.models[].cost這些是 input、output、cacheRead 和
cacheWrite 的 每 100 萬個 Token 的美元價格。如果缺少定價,OpenClaw 僅顯示 Token。OAuth Token
從不顯示美元成本。
快取 TTL 和修剪影響
Section titled “快取 TTL 和修剪影響”供應商提示快取僅在快取 TTL 視窗內適用。OpenClaw 可以 選擇執行 cache-ttl 修剪:一旦快取 TTL 過期,它就會修剪會話,然後重設快取視窗,以便後續請求可以重新使用 新快取的上下文,而不是重新快取完整的歷史記錄。這可以降低當 會話閒置超過 TTL 時的快取寫入成本。
在 Gateway configuration 中配置它,並在 Session pruning 中查看行為詳情。
心跳 可以在閒置期間保持快取 溫熱。如果您的模型快取 TTL
是 1h,將心跳間隔設定為略低於該值(例如 55m)可以避免
重新快取完整的提示,從而降低快取寫入成本。
對於 Anthropic API 定價,快取讀取比輸入 Token 便宜得多,而快取寫入則按更高的倍率計費。請參閱 Anthropic 的 提示快取定價以獲取最新費率和 TTL 倍率: https://docs.anthropic.com/docs/build-with-claude/prompt-caching
範例:使用心跳保持 1 小時快取溫熱
Section titled “範例:使用心跳保持 1 小時快取溫熱”agents: defaults: model: primary: "anthropic/claude-opus-4-5" models: "anthropic/claude-opus-4-5": params: cacheRetention: "long" heartbeat: every: "55m"減少 Token 壓力的技巧
Section titled “減少 Token 壓力的技巧”- 使用
/compact來總結長會話。 - 修剪工作流程中的大型工具輸出。
- 保持技能描述簡短(技能清單會注入提示中)。
- 對於冗長、探索性的工作,首選較小的模型。
請參閱 Skills 以了解確切的技能清單開銷公式。