跳转到内容

Vydra

内置的 Vydra 插件添加了:

  • 通过 vydra/grok-imagine 进行图像生成
  • 通过 vydra/veo3vydra/kling 进行视频生成
  • 通过 Vydra 的 ElevenLabs 支持的 TTS 路由进行语音合成

OpenClaw 对所有这三项功能使用相同的 VYDRA_API_KEY

属性
提供商 IDvydra
插件内置,enabledByDefault: true
认证环境变量VYDRA_API_KEY
新手引导标志--auth-choice vydra-api-key
直接 CLI 标志--vydra-api-key <key>
合约imageGenerationProviders, videoGenerationProviders, speechProviders
基础 URLhttps://www.vydra.ai/api/v1(使用 www 主机)

  1. 运行交互式新手引导

    Terminal window
    openclaw onboard --auth-choice vydra-api-key

    或直接设置环境变量:

    Terminal window
    export VYDRA_API_KEY="vydra_live_..."
  2. 选择默认功能

    选择以下一个或多个功能(图像、视频或语音)并应用匹配的配置。

图像生成

默认图像模型:

  • vydra/grok-imagine

将其设置为默认图像提供商:

{
agents: {
defaults: {
imageGenerationModel: {
primary: "vydra/grok-imagine",
},
},
},
}
```OpenClaw
当前内置支持仅为文生图。Vydra 的托管编辑路由需要远程图像 URL,而 OpenClaw 尚未在内置插件中添加 Vydra 专用的上传桥接。
视频生成

已注册的视频模型:

  • vydra/veo3 用于文本生成视频
  • vydra/kling 用于图像生成视频

将 Vydra 设置为默认视频提供商:

{
agents: {
defaults: {
videoGenerationModel: {
primary: "vydra/veo3",
},
},
},
}

注意事项:

  • vydra/veo3 捆绑时仅作为文本生成视频模型。
  • vydra/kling 目前需要远程图像 URL 引用。本地文件上传会被预先拒绝。
  • Vydra 当前的 kling HTTP 路由在要求 image_url 还是 video_url 方面表现不一致;捆绑的提供商将相同的远程图像 URL 映射到这两个字段中。
  • 捆绑的插件保持保守态度,不会转发未记录的样式调节项,例如纵横比、分辨率、水印或生成的音频。
视频实时测试

特定于提供商的实时覆盖范围:

Terminal window
OPENCLAW_LIVE_TEST=1 \
OPENCLAW_LIVE_VYDRA_VIDEO=1 \
pnpm test:live -- extensions/vydra/vydra.live.test.ts

捆绑的 Vydra 实时文件现在涵盖:

  • vydra/veo3 文本生成视频
  • vydra/kling 使用远程图像 URL 进行图像生成视频

需要时覆盖远程图像 fixture:

Terminal window
export OPENCLAW_LIVE_VYDRA_KLING_IMAGE_URL="https://example.com/reference.png"
语音合成

将 Vydra 设置为语音提供商:

{
messages: {
tts: {
provider: "vydra",
providers: {
vydra: {
apiKey: "${VYDRA_API_KEY}",
voiceId: "21m00Tcm4TlvDq8ikWAM",
},
},
},
},
}

默认值:

  • 模型:elevenlabs/tts
  • 语音 ID:21m00Tcm4TlvDq8ikWAM

捆绑的插件目前公开一个已知可用的默认语音,并返回 MP3 音频文件。

提供商目录

浏览所有可用的提供商。

图像生成

共享图像工具参数和提供商选择。

视频生成

共享视频工具参数和提供商选择。

配置参考

代理默认值和模型配置。