跳转到内容

图像生成

image_generate 工具允许代理使用您配置的提供商创建和编辑图像。生成的图像会作为媒体附件自动在代理的回复中发送。

  1. 为至少一个提供商设置 API 密钥(例如 OPENAI_API_KEYGEMINI_API_KEY)。
  2. (可选)设置您的首选模型:
{
agents: {
defaults: {
imageGenerationModel: "openai/gpt-image-1",
},
},
}
  1. 向代理提问:“生成一张友好的龙虾吉祥物图片。”

代理会自动调用 image_generate。无需将工具加入允许列表 —— 当提供商可用时,它默认处于启用状态。

提供商默认模型编辑支持API 密钥
OpenAIgpt-image-1OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewGEMINI_API_KEYGOOGLE_API_KEY
falfal-ai/flux/devFAL_KEY
MiniMaximage-01是(主体参考)MINIMAX_API_KEY

使用 action: "list" 在运行时检查可用的提供商和模型:

/tool image_generate action=list
参数类型描述
promptstring图像生成提示词(action: "generate" 必需)
actionstring"generate"(默认)或 "list" 以检查提供商
modelstring提供商/模型覆盖,例如 openai/gpt-image-1
imagestring用于编辑模式的单个参考图像路径或 URL
imagesstring[]用于编辑模式的多个参考图像(最多 5 张)
size字符串尺寸提示:1024x10241536x10241024x15361024x17921792x1024
aspectRatio字符串宽高比:1:12:33:23:44:34:55:49:1616:921:9
resolution字符串分辨率提示:1K2K4K
count数字要生成的图片数量(1–4)
filename字符串输出文件名提示

并非所有提供商都支持所有参数。该工具会传递各提供商支持的内容,并忽略其余参数。

{
agents: {
defaults: {
// String form: primary model only
imageGenerationModel: "google/gemini-3-pro-image-preview",
// Object form: primary + ordered fallbacks
imageGenerationModel: {
primary: "openai/gpt-image-1",
fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
},
},
},
}

生成图片时,OpenClaw 会按以下顺序尝试提供商:

  1. 工具调用中的 model 参数(如果代理指定了一个)
  2. 配置中的 imageGenerationModel.primary
  3. 按顺序排列的 imageGenerationModel.fallbacks
  4. 自动检测 — 查询所有已注册提供商的默认设置,优先顺序为:已配置的主提供商,然后是 OpenAI,接着是 Google,最后是其他

如果提供商失败(认证错误、速率限制等),系统会自动尝试下一个候选者。如果全部失败,错误信息将包含每次尝试的详细信息。

Google、fal 和 MiniMax 支持编辑参考图像。传入参考图像路径或 URL:

"Generate a watercolor version of this photo" + image: "/path/to/photo.jpg"

Google 通过 images 参数支持最多 5 张参考图像。fal 和 MiniMax 支持 1 张。

功能OpenAIGooglefalMiniMax
生成是(最多 4 张)是(最多 4 张)是(最多 4 张)是(最多 9 张)
编辑/参考是(最多 5 张图片)是(1 张图片)是(1 张图片,主体参考)
尺寸控制
宽高比是(仅限生成)
分辨率(1K/2K/4K)