Ir al contenido

Generación de imágenes

La herramienta image_generate permite al agente crear y editar imágenes utilizando sus proveedores configurados. Las imágenes generadas se entregan automáticamente como archivos adjuntos en la respuesta del agente.

  1. Configure una clave de API para al menos un proveedor (por ejemplo OPENAI_API_KEY o GEMINI_API_KEY).
  2. Opcionalmente, configure su modelo preferido:
{
agents: {
defaults: {
imageGenerationModel: "openai/gpt-image-1",
},
},
}
  1. Pregúntele al agente: “Genera una imagen de una mascota amigable de langosta.”

El agente llama a image_generate automáticamente. No es necesario permitir la herramienta explícitamente; está habilitada por defecto cuando hay un proveedor disponible.

ProveedorModelo predeterminadoSoporte de ediciónClave de API
OpenAIgpt-image-1NoOPENAI_API_KEY
Googlegemini-3.1-flash-image-previewGEMINI_API_KEY o GOOGLE_API_KEY
falfal-ai/flux/devFAL_KEY
MiniMaximage-01Sí (referencia de sujeto)MINIMAX_API_KEY

Use action: "list" para inspeccionar los proveedores y modelos disponibles en tiempo de ejecución:

/tool image_generate action=list
ParámetroTipoDescripción
promptcadenaPrompt de generación de imágenes (requerido para action: "generate")
actioncadena"generate" (predeterminado) o "list" para inspeccionar proveedores
modelcadenaAnulación de proveedor/modelo, p. ej. openai/gpt-image-1
imagecadenaRuta o URL de una sola imagen de referencia para el modo de edición
imagescadena[]Múltiples imágenes de referencia para el modo de edición (hasta 5)
sizestringSugerencia de tamaño: 1024x1024, 1536x1024, 1024x1536, 1024x1792, 1792x1024
aspectRatiostringRelación de aspecto: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
resolutionstringSugerencia de resolución: 1K, 2K o 4K
countnumberNúmero de imágenes a generar (1–4)
filenamestringSugerencia de nombre de archivo de salida

No todos los proveedores admiten todos los parámetros. La herramienta pasa lo que cada proveedor admite e ignora el resto.

{
agents: {
defaults: {
// String form: primary model only
imageGenerationModel: "google/gemini-3-pro-image-preview",
// Object form: primary + ordered fallbacks
imageGenerationModel: {
primary: "openai/gpt-image-1",
fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
},
},
},
}

Al generar una imagen, OpenClaw prueba los proveedores en este orden:

  1. parámetro model de la llamada a la herramienta (si el agente especifica uno)
  2. imageGenerationModel.primary desde la configuración
  3. imageGenerationModel.fallbacks en orden
  4. Detección automática — consulta todos los proveedores registrados para los valores predeterminados, prefiriendo: proveedor primario configurado, luego OpenAI, luego Google, luego otros

Si un proveedor falla (error de autenticación, límite de velocidad, etc.), se prueba automáticamente el siguiente candidato. Si todos fallan, el error incluye detalles de cada intento.

Google, fal y MiniMax admiten la edición de imágenes de referencia. Pase una ruta de imagen de referencia o una URL:

"Generate a watercolor version of this photo" + image: "/path/to/photo.jpg"

Google admite hasta 5 imágenes de referencia a través del parámetro images. fal y MiniMax admiten 1.

CapacidadOpenAIGooglefalMiniMax
GenerarSí (hasta 4)Sí (hasta 4)Sí (hasta 4)Sí (hasta 9)
Edición/referenciaNoSí (hasta 5 imágenes)Sí (1 imagen)Sí (1 imagen, ref. de sujeto)
Control de tamañoNo
Relación de aspectoNoSí (solo generar)
Resolución (1K/2K/4K)NoNo