Ir al contenido

Vydra

El complemento Vydra incluido añade:

  • Generación de imágenes mediante vydra/grok-imagine
  • Generación de videos mediante vydra/veo3 y vydra/kling
  • Síntesis de voz a través de la ruta TTS de Vydra respaldada por ElevenLabs

OpenClaw utiliza el mismo VYDRA_API_KEY para las tres capacidades.

PropiedadValor
Id. de proveedorvydra
Complementoincluido, enabledByDefault: true
Variable de entorno de autenticaciónVYDRA_API_KEY
Indicador de incorporación--auth-choice vydra-api-key
Indicador directo de CLI--vydra-api-key <key>
ContratosimageGenerationProviders, videoGenerationProviders, speechProviders
URL basehttps://www.vydra.ai/api/v1 (use el host www)

  1. Ejecutar la incorporación interactiva

    Ventana de terminal
    openclaw onboard --auth-choice vydra-api-key

    O establezca la variable de entorno directamente:

    Ventana de terminal
    export VYDRA_API_KEY="vydra_live_..."
  2. Elegir una capacidad predeterminada

    Elija una o más de las capacidades a continuación (imagen, video o voz) y aplique la configuración correspondiente.

Generación de imágenes

Modelo de imagen predeterminado:

  • vydra/grok-imagine

Establézcalo como el proveedor de imágenes predeterminado:

{
agents: {
defaults: {
imageGenerationModel: {
primary: "vydra/grok-imagine",
},
},
},
}

El soporte incluido actual es solo de texto a imagen. Las rutas de edición alojadas de Vydra esperan URLs de imágenes remotas, y OpenClaw aún no agrega un puente de carga específico de Vydra en el complemento incluido.

Generación de video

Modelos de video registrados:

  • vydra/veo3 para texto a video
  • vydra/kling para imagen a video

Establezca Vydra como el proveedor de video predeterminado:

{
agents: {
defaults: {
videoGenerationModel: {
primary: "vydra/veo3",
},
},
},
}

Notas:

  • vydra/veo3 se incluye solo como texto a video.
  • vydra/kling actualmente requiere una referencia de URL de imagen remota. Las cargas de archivos locales se rechazan de inmediato.
  • La ruta HTTP kling actual de Vydra ha sido inconsistente sobre si requiere image_url o video_url; el proveedor incluido asigna la misma URL de imagen remota a ambos campos.
  • El complemento incluido se mantiene conservador y no reenvía controles de estilo no documentados, como la relación de aspecto, la resolución, la marca de agua o el audio generado.
Pruebas en vivo de video

Cobertura en vivo específica del proveedor:

Ventana de terminal
OPENCLAW_LIVE_TEST=1 \
OPENCLAW_LIVE_VYDRA_VIDEO=1 \
pnpm test:live -- extensions/vydra/vydra.live.test.ts

El archivo en vivo de Vydra incluido ahora cubre:

  • vydra/veo3 texto a video
  • vydra/kling imagen a video utilizando una URL de imagen remota

Anule la imagen de dispositivo remota cuando sea necesario:

Ventana de terminal
export OPENCLAW_LIVE_VYDRA_KLING_IMAGE_URL="https://example.com/reference.png"
Síntesis de voz

Establezca Vydra como el proveedor de voz:

{
messages: {
tts: {
provider: "vydra",
providers: {
vydra: {
apiKey: "${VYDRA_API_KEY}",
voiceId: "21m00Tcm4TlvDq8ikWAM",
},
},
},
},
}

Valores predeterminados:

  • Modelo: elevenlabs/tts
  • ID de voz: 21m00Tcm4TlvDq8ikWAM

El complemento incluido actualmente expone una voz predeterminada comprobada y devuelve archivos de audio MP3.

Directorio de proveedores

Explore todos los proveedores disponibles.

Generación de imágenes

Parámetros compartidos de la herramienta de imágenes y selección de proveedor.

Generación de videos

Parámetros compartidos de la herramienta de videos y selección de proveedor.

Referencia de configuración

Valores predeterminados del agente y configuración del modelo.