Web fetch
La herramienta web_fetch realiza un HTTP GET simple y extrae contenido legible
(de HTML a markdown o texto). No ejecuta JavaScript.
Para sitios con mucho JS o páginas protegidas por inicio de sesión, utilice Navegador Web en su lugar.
Inicio rápido
Sección titulada «Inicio rápido»web_fetch está habilitado de forma predeterminada — no se necesita configuración. El agente puede
llamarlo inmediatamente:
await web_fetch({ url: "https://example.com/article" });Parámetros de la herramienta
Sección titulada «Parámetros de la herramienta»Cómo funciona
Sección titulada «Cómo funciona»Fetch
Envía un HTTP GET con un User-Agent similar al de Chrome y el encabezado
Accept-Language. Bloquea nombres de host privados/internos y vuelve a verificar las redirecciones.Extract
Ejecuta Readability (extracción de contenido principal) en la respuesta HTML.
Fallback (optional)
Si Readability falla y Firecrawl está configurado, se reintentará a través de la API de Firecrawl con modo de evasión de bots.
Cache
Los resultados se almacenan en caché durante 15 minutos (configurable) para reducir las recuperaciones repetidas de la misma URL.
{ tools: { web: { fetch: { enabled: true, // default: true provider: "firecrawl", // optional; omit for auto-detect maxChars: 50000, // max output chars maxCharsCap: 50000, // hard cap for maxChars param maxResponseBytes: 2000000, // max download size before truncation timeoutSeconds: 30, cacheTtlMinutes: 15, maxRedirects: 3, useTrustedEnvProxy: false, // let a trusted HTTP(S) env proxy resolve DNS readability: true, // use Readability extraction userAgent: "Mozilla/5.0 ...", // override User-Agent ssrfPolicy: { allowRfc2544BenchmarkRange: true, // opt-in for trusted fake-IP proxies using 198.18.0.0/15 allowIpv6UniqueLocalRange: true, // opt-in for trusted fake-IP proxies using fc00::/7 }, }, }, },}Respaldo de Firecrawl
Sección titulada «Respaldo de Firecrawl»Si la extracción de Readability falla, web_fetch puede recurrir a
Firecrawl para evitar detección de bots y mejorar la extracción:
{ tools: { web: { fetch: { provider: "firecrawl", // optional; omit for auto-detect from available credentials }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webFetch: { apiKey: "fc-...", // optional if FIRECRAWL_API_KEY is set baseUrl: "https://api.firecrawl.dev", onlyMainContent: true, maxAgeMs: 86400000, // cache duration (1 day) timeoutSeconds: 60, }, }, }, }, },}plugins.entries.firecrawl.config.webFetch.apiKey es compatible con objetos SecretRef.
La configuración heredada tools.web.fetch.firecrawl.* se migra automáticamente mediante openclaw doctor --fix.
Comportamiento actual en tiempo de ejecución:
tools.web.fetch.providerselecciona explícitamente el proveedor de reserva de recuperación.- Si se omite
provider, OpenClaw detecta automáticamente el primer proveedor de web-fetch listo a partir de las credenciales disponibles.web_fetchsin sandbox puede usar complementos instalados que declarencontracts.webFetchProvidersy registren un proveedor coincidente en tiempo de ejecución. Hoy el proveedor incluido es Firecrawl. - Las llamadas
web_fetchen sandbox se limitan a los proveedores incluidos. - Si Readability está deshabilitado,
web_fetchomite directamente al proveedor alternativo seleccionado. Si no hay ningún proveedor disponible, falla de forma cerrada.
Proxy de entorno confiable
Sección titulada «Proxy de entorno confiable»Si su implementación requiere que web_fetch pase a través de un proxy HTTP(S)
saliente de confianza, configure tools.web.fetch.useTrustedEnvProxy: true.
En este modo, OpenClaw todavía aplica comprobaciones SSRF basadas en el nombre de host antes de enviar la solicitud, pero permite que el proxy resuelva el DNS en lugar de hacer el anclaje de DNS local. Habilite esto solo cuando el proxy esté controlado por el operador y haga cumplir la política de salida después de la resolución del DNS.
Límites y seguridad
Sección titulada «Límites y seguridad»maxCharsestá limitado atools.web.fetch.maxCharsCap- El cuerpo de la respuesta está limitado a
maxResponseBytesantes del análisis; las respuestas excesivamente grandes se truncarán con una advertencia - Los nombres de host privados/internos están bloqueados
tools.web.fetch.ssrfPolicy.allowRfc2544BenchmarkRangeytools.web.fetch.ssrfPolicy.allowIpv6UniqueLocalRangeson opciones de participación limitada para pilas de proxy de IP falsas de confianza; déjelos sin configurar a menos que su proxy sea dueño de esos rangos sintéticos y haga cumplir su propia política de destino- Los redireccionamientos se verifican y limitan mediante
maxRedirects useTrustedEnvProxyes una opción de participación explícita y solo debe habilitarse para proxys controlados por el operador que todavía apliquen la política de salida después de la resolución de DNSweb_fetches de mejor esfuerzo; algunos sitios necesitan el Web Browser
Perfiles de herramientas
Sección titulada «Perfiles de herramientas»Si utiliza perfiles de herramientas o listas de permitidos, agregue web_fetch o group:web:
{ tools: { allow: ["web_fetch"], // or: allow: ["group:web"] (includes web_fetch, web_search, and x_search) },}Relacionado
Sección titulada «Relacionado»- Web Search: busque en la web con varios proveedores
- Web Browser: automatización completa del navegador para sitios con mucho JavaScript
- Firecrawl: herramientas de búsqueda y extracción de Firecrawl