Outil PDF
Outil PDF
Section intitulée « Outil PDF »pdf analyse un ou plusieurs documents PDF et renvoie le texte.
Comportement rapide :
- Mode de fournisseur natif pour les fournisseurs de modèles Anthropic et Google.
- Mode de repli sur l’extraction pour les autres fournisseurs (extrait le texte d’abord, puis les images de page si nécessaire).
- Prend en charge les entrées uniques (
pdf) ou multiples (pdfs), maximum 10 PDF par appel.
Disponibilité
Section intitulée « Disponibilité »L’outil n’est enregistré que lorsque OpenClaw peut résoudre une configuration de modèle capable de gérer le PDF pour l’agent :
agents.defaults.pdfModel- repli vers
agents.defaults.imageModel - repli vers les valeurs par défaut du fournisseur de meilleure tentative en fonction de l’authentification disponible
Si aucun modèle utilisable ne peut être résolu, l’outil pdf n’est pas exposé.
Référence d’entrée
Section intitulée « Référence d’entrée »pdf(string) : un chemin ou une URL PDFpdfs(string[]) : plusieurs chemins ou URL PDF, jusqu’à 10 au totalprompt(string) : invite d’analyse, défautAnalyze this PDF document.pages(string) : filtre de page comme1-5ou1,3,7-9model(string) : substitution de modèle facultative (provider/model)maxBytesMb(number) : limite de taille par PDF en Mo
Notes sur l’entrée :
pdfetpdfssont fusionnés et dédupliqués avant le chargement.- Si aucune entrée PDF n’est fournie, l’outil génère une erreur.
pagesest analysé comme des numéros de page commençant à 1, dédupliqués, triés et limités au nombre maximum de pages configuré.maxBytesMbest par défautagents.defaults.pdfMaxBytesMbou10.
Références PDF prises en charge
Section intitulée « Références PDF prises en charge »- chemin de fichier local (y compris l’expansion
~) - URL
file:// - URL
http://ethttps://
Notes sur les références :
- Les autres schémas d’URI (par exemple
ftp://) sont rejetés avecunsupported_pdf_reference. - En mode bac à sable, les URL distantes
http(s)sont rejetées. - Avec la stratégie de fichiers d’espace de travail uniquement activée, les chemins de fichiers locaux en dehors des racines autorisées sont rejetés.
Modes d’exécution
Section intitulée « Modes d’exécution »Mode du fournisseur natif
Section intitulée « Mode du fournisseur natif »Le mode natif est utilisé pour le fournisseur anthropic et google.
L’outil envoie les octets PDF bruts directement aux API du fournisseur.
Limites du mode natif :
pagesn’est pas pris en charge. Si défini, l’outil renvoie une erreur.
Mode de repli par extraction
Section intitulée « Mode de repli par extraction »Le mode de repli est utilisé pour les fournisseurs non natifs.
Flux :
- Extraire le texte des pages sélectionnées (jusqu’à
agents.defaults.pdfMaxPages, par défaut20). - Si la longueur du texte extrait est inférieure à
200caractères, rend les pages sélectionnées en images PNG et les inclut. - Envoyer le contenu extrait ainsi que l’invite au modèle sélectionné.
Détails du repli :
- L’extraction d’image de page utilise un budget de pixels de
4,000,000. - Si le modèle cible ne prend pas en charge l’entrée d’image et qu’il n’y a pas de texte extractible, l’outil génère une erreur.
- Le repli par extraction nécessite
pdfjs-dist(et@napi-rs/canvaspour le rendu d’image).
{ agents: { defaults: { pdfModel: { primary: "anthropic/claude-opus-4-6", fallbacks: ["openai/gpt-5-mini"], }, pdfMaxBytesMb: 10, pdfMaxPages: 20, }, },}Voir Référence de configuration pour plus de détails sur les champs.
Détails de la sortie
Section intitulée « Détails de la sortie »L’outil renvoie le texte dans content[0].text et les métadonnées structurées dans details.
Champs details courants :
model: référence de modèle résolue (provider/model)native:truepour le mode de fournisseur natif,falsepour le repliattempts: tentatives de repli ayant échoué avant le succès
Champs de chemin :
- saisie PDF unique :
details.pdf - saisies PDF multiples :
details.pdfs[]avecpdfentrées - métadonnées de réécriture de chemin bac à sable (le cas échéant) :
rewrittenFrom
Comportement en cas d’erreur
Section intitulée « Comportement en cas d’erreur »- Saisie PDF manquante : génère
pdf required: provide a path or URL to a PDF document - Trop de PDF : renvoie une erreur structurée dans
details.error = "too_many_pdfs" - Schéma de référence non pris en charge : renvoie
details.error = "unsupported_pdf_reference" - Mode natif avec
pages: génère une erreurpages is not supported with native PDF providersclaire
Exemples
Section intitulée « Exemples »PDF unique :
{ "pdf": "/tmp/report.pdf", "prompt": "Summarize this report in 5 bullets"}PDF multiples :
{ "pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"], "prompt": "Compare risks and timeline changes across both documents"}Modèle de repli filtré par page :
{ "pdf": "https://example.com/report.pdf", "pages": "1-3,7", "model": "openai/gpt-5-mini", "prompt": "Extract only customer-impacting incidents"}Connexes
Section intitulée « Connexes »- Aperçu des outils — tous les outils d’agent disponibles
- Référence de configuration — configuration pdfMaxBytesMb et pdfMaxPages