Outil PDF
pdf analyse un ou plusieurs documents PDF et renvoie le texte.
Comportement rapide :
- Mode de provider natif pour les providers de modèle Anthropic et Google.
- Mode de repli sur l’extraction pour les autres providers (extraire d’abord le texte, puis les images de pages si nécessaire).
- Prend en charge une entrée unique (
pdf) ou multiple (pdfs), jusqu’à 10 PDF par appel.
Disponibilité
Section intitulée « Disponibilité »L’outil n’est enregistré que lorsque OpenClaw peut résoudre une configuration de modèle compatible PDF pour l’agent :
agents.defaults.pdfModel- replier sur
agents.defaults.imageModel - replier sur le modèle de session/défaut résolu de l’agent
- si les providers natifs-PDF sont pris en charge par l’authentification, les privilégier par rapport aux candidats de repli d’images génériques
Si aucun modèle utilisable ne peut être résolu, l’outil pdf n’est pas exposé.
Notes de disponibilité :
- La chaîne de repli est consciente de l’authentification. Un
provider/modelconfiguré ne compte que si OpenClaw peut réellement authentifier ce provider pour l’agent. - Les providers PDF natifs sont actuellement Anthropic et Google.
- Si le provider de session/défaut résolu possède déjà un modèle de vision/PDF configuré, l’outil PDF réutilise celui-ci avant de se replier sur d’autres providers pris en charge par l’authentification.
Référence d’entrée
Section intitulée « Référence d’entrée »Notes sur l’entrée :
pdfetpdfssont fusionnés et dédupliqués avant le chargement.- Si aucune entrée PDF n’est fournie, l’outil renvoie une erreur.
pagesest analysé comme des numéros de page commençant à 1, dédupliqués, triés et limités au nombre maximal de pages configuré.maxBytesMba pour valeur par défautagents.defaults.pdfMaxBytesMbou10.
Références PDF prises en charge
Section intitulée « Références PDF prises en charge »- chemin de fichier local (y compris l’expansion
~) - URL
file:// - URL
http://ethttps:// - références entrantes gérées par OpenClaw telles que
media://inbound/<id>
Notes de référence :
- D’autres schémas d’URI (par exemple
ftp://) sont rejetés avecunsupported_pdf_reference. - En mode sandbox, les URL distantes
http(s)sont rejetées. - Avec la stratégie de fichiers d’espace de travail uniquement activée, les chemins de fichiers locaux situés en dehors des racines autorisées sont rejetés.
- Les références entrantes gérées et les chemins rejoués sous le stockage de médias entrant de OpenClaw sont autorisés avec la stratégie de fichiers limitée à l’espace de travail.
Modes d’exécution
Section intitulée « Modes d’exécution »Mode de fournisseur natif
Section intitulée « Mode de fournisseur natif »Le mode natif est utilisé pour le fournisseur anthropic et google.
L’outil envoie les octets PDF bruts directement aux API du fournisseur.
Limites du mode natif :
pagesn’est pas pris en charge. Si défini, l’outil renvoie une erreur.- L’entrée multi-PDF est prise en charge ; chaque PDF est envoyé sous forme de bloc de document natif / partie PDF en ligne avant l’invite.
Mode de repli par extraction
Section intitulée « Mode de repli par extraction »Le mode de repli est utilisé pour les fournisseurs non natifs.
Flux :
- Extraire le texte des pages sélectionnées (jusqu’à
agents.defaults.pdfMaxPages, par défaut20). - Si la longueur du texte extrait est inférieure à
200caractères, restituer les pages sélectionnées en images PNG et les inclure. - Envoyer le contenu extrait plus l’invite au modèle sélectionné.
Détails du repli :
- L’extraction d’image de page utilise un budget de pixels de
4,000,000. - Si le modèle cible ne prend pas en charge l’entrée d’image et qu’il n’y a pas de texte extractible, l’outil renvoie une erreur.
- Si l’extraction de texte réussit mais que l’extraction d’images nécessiterait la vision sur un modèle texte uniquement, OpenClaw abandonne les images rendues et continue avec le texte extrait.
- Le repli d’extraction utilise le plugin intégré
document-extract. Le plugin possèdepdfjs-dist;@napi-rs/canvasest utilisé uniquement lorsque le repli de rendu d’images est disponible.
{ agents: { defaults: { pdfModel: { primary: "anthropic/claude-opus-4-6", fallbacks: ["openai/gpt-5.4-mini"], }, pdfMaxBytesMb: 10, pdfMaxPages: 20, }, },}Voir Configuration Reference pour plus de détails sur les champs.
Détails de la sortie
Section intitulée « Détails de la sortie »L’outil renvoie le texte dans content[0].text et les métadonnées structurées dans details.
Champs details courants :
model: référence de modèle résolue (provider/model)native:truepour le mode de fournisseur natif,falsepour le repliattempts: tentatives de repli ayant échoué avant le succès
Champs de chemin :
- entrée PDF unique :
details.pdf - entrées PDF multiples :
details.pdfs[]avecpdfentrées - métadonnées de réécriture de chemin bac à sable (si applicable) :
rewrittenFrom
Comportement en cas d’erreur
Section intitulée « Comportement en cas d’erreur »- Entrée PDF manquante : lance
pdf required: provide a path or URL to a PDF document - Trop de PDF : renvoie une erreur structurée dans
details.error = "too_many_pdfs" - Schéma de référence non pris en charge : renvoie
details.error = "unsupported_pdf_reference" - Mode natif avec
pages: lance une erreurpages is not supported with native PDF providersclaire
Exemples
Section intitulée « Exemples »PDF unique :
{ "pdf": "/tmp/report.pdf", "prompt": "Summarize this report in 5 bullets"}PDF multiples :
{ "pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"], "prompt": "Compare risks and timeline changes across both documents"}Modèle de repli filtré par page :
{ "pdf": "https://example.com/report.pdf", "pages": "1-3,7", "model": "openai/gpt-5.4-mini", "prompt": "Extract only customer-impacting incidents"}Connexes
Section intitulée « Connexes »- Vue d’ensemble des outils - tous les outils d’agent disponibles
- Référence de configuration - configuration de pdfMaxBytesMb et pdfMaxPages