Skip to content

圖片產生

image_generate 工具讓代理程式 (agent) 使用您設定的供應商建立和編輯圖片。產生的圖片會在代理程式的回覆中自動以媒體附件的形式傳送。

  1. 為至少一個供應商設定 API 金鑰 (例如 OPENAI_API_KEYGEMINI_API_KEY)。
  2. 選擇性設定您的偏好模型:
{
agents: {
defaults: {
imageGenerationModel: "openai/gpt-image-1",
},
},
}
  1. 告訴代理程式:“產生一張友善的龍蝦吉祥物圖片。”

代理程式會自動呼叫 image_generate。不需要將工具加入允許清單 — 當有供應商可用時,它預設為啟用狀態。

供應商預設模型編輯支援API 金鑰
OpenAIgpt-image-1OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewGEMINI_API_KEYGOOGLE_API_KEY
falfal-ai/flux/devFAL_KEY
MiniMaximage-01是 (主體參考)MINIMAX_API_KEY

使用 action: "list" 在執行時檢查可用的供應商和模型:

/tool image_generate action=list
參數類型描述
prompt字串圖片產生提示詞 (action: "generate" 必填)
action字串"generate" (預設) 或 "list" 以檢查供應商
model字串供應商/模型覆寫,例如 openai/gpt-image-1
image字串編輯模式的單一參考圖片路徑或 URL
imagesstring[]編輯模式的多張參考圖片 (最多 5 張)
size字串尺寸提示:1024x10241536x10241024x15361024x17921792x1024
aspectRatio字串長寬比:1:12:33:23:44:34:55:49:1616:921:9
resolution字串解析度提示:1K2K4K
count數字要產生的圖片數量 (1–4)
filename字串輸出檔名提示

並非所有提供者都支援所有參數。此工具會傳遞各提供者支援的參數,並忽略其餘參數。

{
agents: {
defaults: {
// String form: primary model only
imageGenerationModel: "google/gemini-3-pro-image-preview",
// Object form: primary + ordered fallbacks
imageGenerationModel: {
primary: "openai/gpt-image-1",
fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
},
},
},
}

產生圖片時,OpenClaw 會依下列順序嘗試提供者:

  1. 來自工具呼叫的 model 參數(如果代理程式指定了一個)
  2. 來自組態的 imageGenerationModel.primary
  3. 依序排列的 imageGenerationModel.fallbacks
  4. 自動偵測 — 查詢所有已註冊提供者的預設值,優先順序為:已設定的主要提供者、然後是 OpenAI、接著是 Google、最後是其他提供者

如果提供者失敗(驗證錯誤、速率限制等),系統會自動嘗試下一個候選者。如果全部失敗,錯誤訊息會包含每次嘗試的詳細資訊。

Google、fal 和 MiniMax 支援編輯參考圖片。傳遞參考圖片路徑或 URL:

"Generate a watercolor version of this photo" + image: "/path/to/photo.jpg"

Google 透過 images 參數支援最多 5 張參考圖片。fal 和 MiniMax 支援 1 張。

功能OpenAIGooglefalMiniMax
產生是(最多 4 張)是(最多 4 張)是(最多 4 張)是(最多 9 張)
編輯/參考是(最多 5 張圖片)是(1 張圖片)是(1 張圖片,主體參照)
尺寸控制
長寬比是(僅限產生)
解析度 (1K/2K/4K)