

Si votre activité implique le traitement de documents à grande échelle, vous faites probablement face à des problèmes liés à la mauvaise qualité des données.
Les problèmes de qualité peuvent prendre de nombreuses formes : images floues, types de fichiers incorrects, informations manquantes… mais l’un des problèmes les plus courants et frustrants reste la rotation incorrecte des documents.
Que vous traitiez des reçus, factures, formulaires ou autres types de pièces, des pages mal orientées peuvent ralentir les flux de travail, réduire la précision des données et augmenter les coûts de main-d’œuvre en raison des corrections manuelles nécessaires.
C’est là que Doxis et sa plateforme interviennent. Grâce à la puissance de l’Intelligence Artificielle (IA) et de la Reconnaissance Optique de Caractères (OCR), Doxis se spécialise dans le traitement intelligent des documents et est capable de résoudre ces problèmes pour vous.
Dans ce blog, nous expliquerons comment Doxis peut vous aider à corriger automatiquement l’orientation des documents à grande échelle. Cette fonctionnalité optimise l’efficacité du traitement et réduit les coûts associés.
Points clés
- Les documents mal orientés constituent un problème récurrent dans les flux de traitement de documents à grande échelle. Ils nuisent à la qualité des données, ralentissent les processus de vérification et nécessitent souvent des corrections manuelles.
- La correction manuelle à grande échelle est coûteuse. Par exemple, faire pivoter manuellement seulement 10 % de 100 000 documents mensuels peut coûter environ 20 000 € par an en main-d’œuvre. L’automatisation de cette tâche peut réduire ces coûts jusqu’à 90 %.
- L’approche de Doxis utilise l’OCR et l’IA pour détecter l’orientation du texte et faire pivoter les documents avec précision, quelle que soit leur forme ou leur taille. Le processus automatisé de rotation se compose de trois étapes principales : optimisation d’image, extraction de texte via OCR et rotation intelligente.
- La plateforme Doxis AI.dp offre bien plus que la rotation : fonctionnalités d’OCR, classification, anonymisation et extraction de données font de cette solution un véritable outil d’Intelligent Document Processing (IDP) complet.
Exemple de cas d’usage
Imaginons que vous travaillez pour une entreprise qui traite des documents financiers à grande échelle, par exemple des reçus et des factures dans le cadre de programmes de fidélité. C’est un cas d’usage courant dans l’automatisation du cashback.
Votre équipe de saisie de données doit vérifier les reçus dans une interface, extraire certaines données ou procéder à certaines approbations. La vérification manuelle des documents est déjà chronophage pour des pièces normales, mais elle l’est encore davantage pour des documents de mauvaise qualité.
Si vous traitez 100 000 documents par mois et que 10 % d’entre eux sont mal orientés, faire pivoter manuellement 10 000 documents mensuels devient une tâche fastidieuse.
Le coût annuel de la rotation manuelle de 120 000 documents peut facilement atteindre 20 000 € rien qu’en main-d’œuvre. Heureusement, l’automatisation peut réduire ce coût de 90 %, vous faisant économiser environ 18 000 € par an. Un excellent cas économique !
Ci-dessous un exemple du type de données que vous pouvez attendre de vos utilisateurs.


Comme vous le voyez, il existe un solide argument commercial pour automatiser une tâche aussi simple que la rotation de documents. Mais comment mettre cela en œuvre ? Voyons de plus près comment détecter et corriger automatiquement l’orientation de reçus et factures de manière intelligente et évolutive.
Comment corriger automatiquement l’orientation des documents et images ?
Comme vous pouvez le constater, les documents peuvent présenter de nombreux types de problèmes. Dans ce blog, nous nous concentrons sur la rotation automatisée des reçus et des factures, mais cette méthode s’applique à tout type de document.
Si vous vous intéressez à d’autres solutions de traitement documentaire, comme le tri automatisé, la classification des documents, la conversion d’image en texte ou la transformation en PDF consultable, consultez nos articles dédiés à ces sujets.
Alors, concentrons-nous sur la rotation automatique des images incorrectes vers la bonne orientation. Une approche simple, que beaucoup envisageraient en premier, consiste à vérifier la hauteur et la largeur des documents et à les orienter verticalement afin que la hauteur soit supérieure à la largeur.
Bien que cela paraisse simple et efficace, malheureusement, cette méthode est sujette à erreurs. Les reçus et les factures se présentent sous de nombreuses formes et tailles : parfois rectangulaires, parfois carrées.
Cette approche peut amener à faire pivoter des documents qui sont déjà dans la bonne orientation vers une mauvaise orientation. Elle peut également amener à faire pivoter des documents de 180 °, donc à l’envers. Heureusement, il existe une autre solution : se baser sur le contenu textuel d’un document.
Pour arriver à ce résultat, notre logiciel suit 3 étapes importantes :
Étape 1 : Optimiser la qualité de l’image
Cette étape consiste à recadrer les photos de reçus, corriger la perspective et améliorer le contraste. Cela nous donne déjà des images plus lisibles, ce qui est pertinent pour la deuxième étape. Vous pouvez voir un exemple du résultat de la première étape ci-dessous :


Étape 2 : Convertir les documents et images en texte à l’aide de l’OCR
La conversion des documents et images en texte est la deuxième étape. Si le document est un PDF, il sera d’abord converti en image, puis en texte. Cela crée un document consultable et révèle l’orientation du texte.
Bien sûr, personne ne lit une phrase de haut en bas, mais généralement de gauche à droite et, dans certains cas, de droite à gauche. Sur certains documents, vous trouverez du texte dans plusieurs orientations. Dans ces cas, nous effectuons un comptage du texte et choisissons la rotation correspondant à l’orientation où il y a le plus de texte.
Étape 3 : Faire pivoter le document
Maintenant que nous connaissons l’orientation du texte, nous pouvons presque faire pivoter le document. Le document doit être orienté de manière à ce que l’on puisse lire de gauche à droite pour la plupart des langues, mais pour certaines langues, il faut lire de droite à gauche. Cela constitue un facteur déterminant pour la rotation.
Nous utilisons donc un classifieur à apprentissage automatique pour déterminer le pays d’origine et la langue du document. Une fois cela fait, l’image ou le document peut être pivoté et enregistré dans le format souhaité.
Dans de nombreux cas, il s’agit du format de fichier original, donc pour les images, ce serait souvent un JPEG, mais nous pouvons aussi le convertir dans un format au choix, par exemple un PDF. Une fois que vous disposez d’images de bonne qualité et correctement orientées, vous avez probablement déjà tout ce qu’il vous faut. Le résultat ressemble à ceci :


Étape bonus
Nous pouvons même aller un ou deux pas plus loin : nous pouvons vous donner les résultats OCR au format TXT, mais aussi au format structuré comme JSON. Ci-dessous, vous pouvez voir un exemple simplifié de ces deux étapes supplémentaires :


Aller au-delà des logiciels OCR de conversion image‑vers‑texte avec Doxis


Comme vous pouvez le constater, la rotation automatique des documents est un processus technique qui implique la vision par ordinateur, l’OCR et des techniques de conversion de documents.
Heureusement, vous n’avez pas besoin de concevoir ces outils vous‑même grâce à la plateforme Doxis.
Doxis AI.dp est une solution OCR basée sur l’IA, également connue sous le nom d’Intelligent Document Processing (IDP), qui automatise l’ensemble de vos flux de travail liés aux documents, y compris les conversions image‑vers‑texte.
La rotation automatique des images, documents et pages n’est que la partie émergée de l’iceberg. Utiliser une solution moderne comme AI.dp vous permet de :
- Numérisation mobile : Scanner des documents à partir d’appareils mobiles, partout et à tout moment.
- OCR : Transformer des documents et images numérisés en texte et en formats de données structurés.
- Extraction de données : Extraire en temps réel des points de données importants.
- Classification : Classer et trier les documents selon vos besoins.
- Data Parsing : Transformer les fichiers JPG, PNG et PDF en texte consultable et les exporter vers des formats comme PDF ou des formats structurés CSV, XLSX, XML et JSON.
- Anonymisation : Masquer les données sensibles, de l’anonymisation à la suppression.
- Vérification : Vérifier l’authenticité et la validité des documents et des données.
Cela semble correspondre à vos besoins ? Planifiez une démonstration ou contactez nos spécialistes pour plus d’informations. Nous serons ravis de voir comment nous pouvons vous aider à atteindre vos objectifs.
FAQ
Une orientation correcte permet aux logiciels OCR de détecter et lire le texte avec précision. Des documents mal orientés peuvent entraîner une reconnaissance de caractères incorrecte, une identification erronée des champs ou des résultats totalement illisibles.
L’OCR extrait le texte des images. En analysant la direction et l’alignement des lignes de texte détectées, le logiciel peut déterminer la direction de lecture la plus probable (par ex. : de gauche à droite ou de haut en bas) et faire pivoter le document en conséquence.
Doxis utilise la reconnaissance optique de caractères (OCR) combinée à l’intelligence artificielle (IA) pour détecter l’orientation du texte dans un document. En analysant la direction du texte, le système peut faire pivoter le document vers la bonne orientation, garantissant ainsi sa lisibilité et un traitement optimal.
Oui. La technologie OCR pilotée par l’IA de Doxis est conçue pour gérer une grande variété de types de documents, de mises en page et de formats. Elle peut s’adapter à différentes structures sans nécessiter la création manuelle de modèles, ce qui la rend idéale pour des besoins divers en traitement documentaire.
Pour corriger automatiquement l’orientation d’un document avec Doxis, l’OCR est utilisé pour extraire le texte contenu dans l’image ou le fichier PDF. Une fois le texte détecté, le logiciel analyse la direction et l’alignement des lignes
Chez Doxis, ce processus est optimisé grâce à l’IA :
Optimisation de l’image : recadrage, correction de perspective et amélioration du contraste.
Conversion en texte via OCR : détection précise de l’orientation dominante.
Rotation intelligente : application de la bonne orientation selon la langue et le pays, avec conservation ou conversion du format de fichier (JPEG, PDF, etc.).