Aller au contenu

Génération d'images

L’outil image_generate permet à l’agent de créer et de modifier des images en utilisant vos providers configurés. Les images générées sont délivrées automatiquement en tant que pièces jointes médias dans la réponse de l’agent.

  1. Définissez une clé API pour au moins un provider (par exemple OPENAI_API_KEY ou GEMINI_API_KEY).
  2. Définissez facultativement votre modèle préféré :
{
agents: {
defaults: {
imageGenerationModel: "openai/gpt-image-1",
},
},
}
  1. Demandez à l’agent : “Générer une image d’une mascotte homard sympathique.”

L’agent appelle image_generate automatiquement. Aucune liste blanche d’outils n’est nécessaire — il est activé par défaut lorsqu’un provider est disponible.

ProviderModèle par défautPrise en charge de l’éditionClé API
OpenAIgpt-image-1NonOPENAI_API_KEY
Googlegemini-3.1-flash-image-previewOuiGEMINI_API_KEY ou GOOGLE_API_KEY
falfal-ai/flux/devOuiFAL_KEY
MiniMaximage-01Oui (référence du sujet)MINIMAX_API_KEY

Utilisez action: "list" pour inspecter les providers et modèles disponibles lors de l’exécution :

/tool image_generate action=list
ParamètreTypeDescription
promptchaîneInvite de génération d’image (requis pour action: "generate")
actionchaîne"generate" (par défaut) ou "list" pour inspecter les providers
modelchaîneRemplacement de provider/modèle, par ex. openai/gpt-image-1
imagechaîneChemin ou URL d’une image de référence unique pour le mode édition
imageschaîne[]Plusieurs images de référence pour le mode édition (jusqu’à 5)
sizestringSize hint: 1024x1024, 1536x1024, 1024x1536, 1024x1792, 1792x1024
aspectRatiostringAspect ratio: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
resolutionstringResolution hint: 1K, 2K, ou 4K
countnumberNombre d’images à générer (1-4)
filenamestringIndication du nom du fichier de sortie

Tous les providers ne prennent pas en charge tous les paramètres. L’outil transmet ce que chaque provider prend en charge et ignore le reste.

{
agents: {
defaults: {
// String form: primary model only
imageGenerationModel: "google/gemini-3-pro-image-preview",
// Object form: primary + ordered fallbacks
imageGenerationModel: {
primary: "openai/gpt-image-1",
fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
},
},
},
}

Lors de la génération d’une image, OpenClaw essaie les providers dans cet ordre :

  1. Paramètre model provenant de l’appel de l’outil (si l’agent en spécifie un)
  2. imageGenerationModel.primary à partir de la configuration
  3. imageGenerationModel.fallbacks dans l’ordre
  4. Détection automatique — interroge tous les providers enregistrés pour les valeurs par défaut, en privilégiant : le provider principal configuré, puis OpenAI, puis Google, puis les autres

Si un provider échoue (erreur d’authentification, limite de débit, etc.), le candidat suivant est essayé automatiquement. Si tous échouent, l’erreur inclut les détails de chaque tentative.

Google, fal et MiniMax prennent en charge la modification d’images de référence. Indiquez un chemin ou une URL d’image de référence :

"Generate a watercolor version of this photo" + image: "/path/to/photo.jpg"

Google prend en charge jusqu’à 5 images de référence via le paramètre images. fal et MiniMax en prennent en charge 1.

CapacitéOpenAIGooglefalMiniMax
GénérerOui (jusqu’à 4)Oui (jusqu’à 4)Oui (jusqu’à 4)Oui (jusqu’à 9)
Modification/référenceNonOui (jusqu’à 5 images)Oui (1 image)Oui (1 image, réf. sujet)
Contrôle de la tailleOuiOuiOuiNon
Ratio d’aspectNonOuiOui (génération uniquement)Oui
Résolution (1K/2K/4K)NonOuiOuiNon