Ir al contenido

ComfyUI

OpenClaw incluye un complemento (plugin) comfy integrado para ejecuciones de ComfyUI basadas en flujos de trabajo. El complemento se basa totalmente en flujos de trabajo, por lo que OpenClaw no intenta mapear controles genéricos de size, aspectRatio, resolution, durationSeconds, ni de estilo TTS en tu gráfico.

PropiedadDetalle
Proveedorcomfy
Modeloscomfy/workflow
Superficies compartidasimage_generate, video_generate, music_generate
AutenticaciónNinguna para ComfyUI local; COMFY_API_KEY o COMFY_CLOUD_API_KEY para Comfy Cloud
APIComfyUI /prompt / /history / /view y Comfy Cloud /api/*
  • Generación de imágenes desde un JSON de flujo de trabajo
  • Edición de imágenes con 1 imagen de referencia cargada
  • Generación de videos desde un JSON de flujo de trabajo
  • Generación de videos con 1 imagen de referencia cargada
  • Generación de música o audio a través de la herramienta compartida music_generate
  • Descarga de salida desde un nodo configurado o todos los nodos de salida coincidentes

Elija entre ejecutar ComfyUI en su propia máquina o usar Comfy Cloud.

Lo mejor para: ejecutar tu propia instancia de ComfyUI en tu máquina o red local.

  1. Iniciar ComfyUI localmente

    Asegúrate de que tu instancia local de ComfyUI se esté ejecutando (por defecto en http://127.0.0.1:8188).

  2. Preparar tu JSON de flujo de trabajo

    Exporta o crea un archivo JSON de flujo de trabajo de ComfyUI. Toma nota de los IDs de los nodos para el nodo de entrada del prompt y el nodo de salida del que quieres que OpenClaw lea.

  3. Configurar el proveedor

    Establece mode: "local" y señala tu archivo de flujo de trabajo. Aquí tienes un ejemplo mínimo de imagen:

    {
    plugins: {
    entries: {
    comfy: {
    config: {
    mode: "local",
    baseUrl: "http://127.0.0.1:8188",
    image: {
    workflowPath: "./workflows/flux-api.json",
    promptNodeId: "6",
    outputNodeId: "9",
    },
    },
    },
    },
    },
    }
  4. Establecer el modelo predeterminado

    Señala OpenClaw al modelo comfy/workflow para la capacidad que configuraste:

    {
    agents: {
    defaults: {
    imageGenerationModel: {
    primary: "comfy/workflow",
    },
    },
    },
    }
  5. Verificar

    Ventana de terminal
    openclaw models list --provider comfy

Comfy admite configuraciones de conexión compartidas de nivel superior además de secciones de flujo de trabajo por capacidad (image, video, music):

{
plugins: {
entries: {
comfy: {
config: {
mode: "local",
baseUrl: "http://127.0.0.1:8188",
image: {
workflowPath: "./workflows/flux-api.json",
promptNodeId: "6",
outputNodeId: "9",
},
video: {
workflowPath: "./workflows/video-api.json",
promptNodeId: "12",
outputNodeId: "21",
},
music: {
workflowPath: "./workflows/music-api.json",
promptNodeId: "3",
outputNodeId: "18",
},
},
},
},
},
}
ClaveTipoDescripción
mode"local" o "cloud"Modo de conexión.
baseUrlcadenaEl valor predeterminado es http://127.0.0.1:8188 para local o https://cloud.comfy.org para la nube.
apiKeycadenaClave en línea opcional, alternativa a las variables de entorno COMFY_API_KEY / COMFY_CLOUD_API_KEY.
allowPrivateNetworkbooleanoPermitir una baseUrl privada/LAN en modo en la nube.

Estas claves se aplican dentro de las secciones image, video o music:

ClaveObligatorioPredeterminadoDescripción
workflow o workflowPathRuta al archivo JSON del flujo de trabajo de ComfyUI.
promptNodeIdID del nodo que recibe el mensaje de texto.
promptInputNameNo"text"Nombre de entrada en el nodo de mensaje.
outputNodeIdNoID del nodo del que leer la salida. Si se omite, se utilizan todos los nodos de salida coincidentes.
pollIntervalMsNoIntervalo de sondeo en milisegundos para la finalización del trabajo.
timeoutMsNoTiempo de espera en milisegundos para la ejecución del flujo de trabajo.

Las secciones image y video también admiten:

ClaveObligatorioPredeterminadoDescripción
inputImageNodeIdSí (cuando se pasa una imagen de referencia)ID del nodo que recibe la imagen de referencia cargada.
inputImageInputNameNo"image"Nombre de entrada en el nodo de imagen.
Flujos de trabajo de imagen

Establezca el modelo de imagen predeterminado en comfy/workflow:

{
agents: {
defaults: {
imageGenerationModel: {
primary: "comfy/workflow",
},
},
},
}

Ejemplo de edición con imagen de referencia:

Para habilitar la edición de imágenes con una imagen de referencia cargada, añada inputImageNodeId a su configuración de imagen:

{
plugins: {
entries: {
comfy: {
config: {
image: {
workflowPath: "./workflows/edit-api.json",
promptNodeId: "6",
inputImageNodeId: "7",
inputImageInputName: "image",
outputNodeId: "9",
},
},
},
},
},
}
Flujos de trabajo de video

Establezca el modelo de video predeterminado en comfy/workflow:

{
agents: {
defaults: {
videoGenerationModel: {
primary: "comfy/workflow",
},
},
},
}

Los flujos de trabajo de video de Comfy admiten texto a video e imagen a video a través del gráfico configurado.

Flujos de trabajo de música

El complemento incluido registra un proveedor de generación de música para salidas de audio o música definidas en el flujo de trabajo, expuesto a través de la herramienta compartida music_generate:

/tool music_generate prompt="Warm ambient synth loop with soft tape texture"

Utilice la sección de configuración music para apuntar a su JSON de flujo de trabajo de audio y al nodo de salida.

Compatibilidad con versiones anteriores

La configuración de imagen de nivel superior existente (sin la sección anidada image) todavía funciona:

{
plugins: {
entries: {
comfy: {
config: {
workflowPath: "./workflows/flux-api.json",
promptNodeId: "6",
outputNodeId: "9",
},
},
},
},
}

OpenClaw trata esa forma heredada como la configuración del flujo de trabajo de imagen. No necesita migrar inmediatamente, pero se recomiendan las secciones anidadas image / video / music para las nuevas configuraciones.

Pruebas en vivo

Existe una cobertura en vivo opcional para el complemento incluido:

Ventana de terminal
OPENCLAW_LIVE_TEST=1 COMFY_LIVE_TEST=1 pnpm test:live -- extensions/comfy/comfy.live.test.ts

La prueba en vivo omite los casos individuales de imagen, video o música a menos que la sección del flujo de trabajo de Comfy correspondiente esté configurada.

Generación de imágenes

Configuración y uso de la herramienta de generación de imágenes.

Generación de videos

Configuración y uso de la herramienta de generación de videos.

Generación de música

Configuración de la herramienta de generación de música y audio.

Directorio de proveedores

Resumen de todos los proveedores y referencias de modelos.

Referencia de configuración

Referencia completa de configuración, incluidos los valores predeterminados del agente.