Firecrawl
Firecrawl
Section intitulée « Firecrawl »OpenClaw peut utiliser Firecrawl de trois manières :
- en tant que fournisseur
web_search - en tant qu’outils de plugin explicites :
firecrawl_searchetfirecrawl_scrape - en tant qu’extracteur de repli pour
web_fetch
C’est un service d’extraction/recherche hébergé qui prend en charge la contournement des bots et la mise en cache, ce qui aide pour les sites lourds en JS ou les pages qui bloquent les récupérations HTTP simples.
Obtenir une clé API
Section intitulée « Obtenir une clé API »- Créez un compte Firecrawl et générez une clé API.
- Stockez-la dans la configuration ou définissez
FIRECRAWL_API_KEYdans l’environnement de la passerelle.
Configurer la recherche Firecrawl
Section intitulée « Configurer la recherche Firecrawl »{ tools: { web: { search: { provider: "firecrawl", }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webSearch: { apiKey: "FIRECRAWL_API_KEY_HERE", baseUrl: "https://api.firecrawl.dev", }, }, }, }, },}Notes :
- Choisir Firecrawl lors de l’intégration ou
openclaw configure --section webactive automatiquement le plugin Firecrawl inclus. web_searchavec Firecrawl prend en chargequeryetcount.- Pour les contrôles spécifiques à Firecrawl comme
sources,categories, ou le scraping de résultats, utilisezfirecrawl_search.
Configurer le scraping Firecrawl + le repli web_fetch
Section intitulée « Configurer le scraping Firecrawl + le repli web_fetch »{ plugins: { entries: { firecrawl: { enabled: true, }, }, }, tools: { web: { fetch: { firecrawl: { apiKey: "FIRECRAWL_API_KEY_HERE", baseUrl: "https://api.firecrawl.dev", onlyMainContent: true, maxAgeMs: 172800000, timeoutSeconds: 60, }, }, }, },}Notes :
firecrawl.enabledest par défauttruesauf s’il est défini explicitement àfalse.- Les tentatives de repli Firecrawl ne s’exécutent que lorsqu’une clé API est disponible (
tools.web.fetch.firecrawl.apiKeyouFIRECRAWL_API_KEY). maxAgeMscontrôle l’ancienneté des résultats mis en cache (ms). La valeur par défaut est de 2 jours.
firecrawl_scrape réutilise les mêmes paramètres tools.web.fetch.firecrawl.* et variables d’environnement.
Outils du plugin Firecrawl
Section intitulée « Outils du plugin Firecrawl »firecrawl_search
Section intitulée « firecrawl_search »Utilisez ceci lorsque vous souhaitez des contrôles de recherche spécifiques à Firecrawl au lieu de web_search générique.
Paramètres principaux :
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Section intitulée « firecrawl_scrape »Utilisez ceci pour les pages riches en JS ou protégées par des bots où le simple web_fetch est faible.
Paramètres principaux :
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Furtivité / contournement de bots
Section intitulée « Furtivité / contournement de bots »Firecrawl expose un paramètre de mode proxy pour le contournement des bots (basic, stealth ou auto).
OpenClaw utilise toujours proxy: "auto" plus storeInCache: true pour les requêtes Firecrawl.
Si le proxy est omis, Firecrawl utilise par défaut auto. auto réessaie avec des proxies furtifs si une tentative de base échoue, ce qui peut utiliser plus de crédits
que le scraping basique uniquement.
Comment web_fetch utilise Firecrawl
Section intitulée « Comment web_fetch utilise Firecrawl »Ordre d’extraction web_fetch :
- Lisibilité (local)
- Firecrawl (si configuré)
- Nettoyage HTML basique (dernier recours)
Connexes
Section intitulée « Connexes »- Vue d’ensemble de la recherche web — tous les fournisseurs et la détection automatique
- Web Fetch — tool web_fetch avec repli vers Firecrawl
- Tavily — tools de recherche et d’extraction