Envoyer un PDF directement à Claude est intuitif mais inefficace. Claude doit interpréter la mise en page, les colonnes, les en-têtes, les pieds de page — du bruit qui consomme des tokens sans apporter de valeur. En convertissant d'abord en Markdown, tu envoies uniquement le contenu utile.
Un PDF de 10 pages envoyé directement peut consommer 8 000 à 15 000 tokens selon sa mise en page. Le même contenu en Markdown propre tourne autour de 2 000 à 4 000 tokens. Sur des documents techniques longs, la différence est énorme.
De plus, le Markdown est le format natif de Claude. Il le comprend mieux, extrait l'information plus précisément et génère des réponses plus pertinentes.
Si ton PDF contient des graphiques ou schémas importants, utilise marker qui préserve les images et les convertit en références Markdown. Les autres outils ignorent les images.
Ajoute une étape de nettoyage après la conversion : supprime les numéros de page, les en-têtes répétitifs et les références bibliographiques si elles ne t'intéressent pas. Ça réduit encore 20-30% du contenu.