Firecrawl
Firecrawl
Sección titulada «Firecrawl»OpenClaw puede usar Firecrawl de tres maneras:
- como el proveedor
web_search - como herramientas de complemento explícitas:
firecrawl_searchyfirecrawl_scrape - como un extractor de alternativa para
web_fetch
Es un servicio alojado de extracción/búsqueda que admite la evasión de bots y el almacenamiento en caché, lo cual ayuda con sitios con mucho JS o páginas que bloquean las recuperaciones HTTP simples.
Obtener una clave de API
Sección titulada «Obtener una clave de API»- Cree una cuenta de Firecrawl y genere una clave de API.
- Guárdela en la configuración o establezca
FIRECRAWL_API_KEYen el entorno de la puerta de enlace.
Configurar la búsqueda de Firecrawl
Sección titulada «Configurar la búsqueda de Firecrawl»{ tools: { web: { search: { provider: "firecrawl", }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webSearch: { apiKey: "FIRECRAWL_API_KEY_HERE", baseUrl: "https://api.firecrawl.dev", }, }, }, }, },}Notas:
- Elegir Firecrawl en la incorporación o
openclaw configure --section webhabilita automáticamente el complemento Firecrawl incluido. web_searchcon Firecrawl admitequeryycount.- Para controles específicos de Firecrawl como
sources,categories, o el raspado de resultados, usefirecrawl_search.
Configurar raspado de Firecrawl + alternativa web_fetch
Sección titulada «Configurar raspado de Firecrawl + alternativa web_fetch»{ plugins: { entries: { firecrawl: { enabled: true, }, }, }, tools: { web: { fetch: { firecrawl: { apiKey: "FIRECRAWL_API_KEY_HERE", baseUrl: "https://api.firecrawl.dev", onlyMainContent: true, maxAgeMs: 172800000, timeoutSeconds: 60, }, }, }, },}Notas:
firecrawl.enabledpor defecto estruea menos que se establezca explícitamente enfalse.- Los intentos de alternativa de Firecrawl se ejecutan solo cuando hay una clave de API disponible (
tools.web.fetch.firecrawl.apiKeyoFIRECRAWL_API_KEY). maxAgeMscontrola la antigüedad máxima de los resultados en caché (ms). El valor predeterminado es 2 días.
firecrawl_scrape reutiliza la misma configuración y variables de entorno de tools.web.fetch.firecrawl.*.
Herramientas del complemento Firecrawl
Sección titulada «Herramientas del complemento Firecrawl»firecrawl_search
Sección titulada «firecrawl_search»Use esto cuando desee controles de búsqueda específicos de Firecrawl en lugar de web_search genérico.
Parámetros principales:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Sección titulada «firecrawl_scrape»Use esto para páginas con mucho JS o protegidas por bots donde el web_fetch simple es débil.
Parámetros principales:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Sigilo / evasión de bots
Sección titulada «Sigilo / evasión de bots»Firecrawl expone un parámetro de modo proxy para la evasión de bots (basic, stealth o auto).
OpenClaw siempre usa proxy: "auto" más storeInCache: true para las solicitudes de Firecrawl.
Si se omite el proxy, Firecrawl usa por defecto auto. auto reintentará con proxies sigilosos si falla un intento básico, lo que puede usar más créditos
que el scraping básico únicamente.
Cómo web_fetch usa Firecrawl
Sección titulada «Cómo web_fetch usa Firecrawl»Orden de extracción de web_fetch:
- Readability (local)
- Firecrawl (si está configurado)
- Limpieza básica de HTML (último recurso)
Relacionado
Sección titulada «Relacionado»- Resumen de búsqueda web — todos los proveedores y detección automática
- Web Fetch — herramienta web_fetch con respaldo Firecrawl
- Tavily — herramientas de búsqueda y extracción