Un passeport est un document que tout le monde détient à un moment ou un autre. Il est délivré par le gouvernement d’un pays à ses citoyens et est principalement utilisé pour voyager. Il sert également de preuve de la nationalité, du nom, du prénom, du sexe, etc. Les entreprises acceptent depuis longtemps les passeports comme documents d’identification de leurs clients. Dans la plupart des cas, ils notent les détails et en font une copie scannée. Bien sûr, cela semble être une solution satisfaisante si vous devez préparer un contrat pour un seul client. Cependant, les choses peuvent devenir vraiment compliquées si vous avez des centaines de contrats à préparer, mais également si vos clients sont de nationalités différentes. Rapidement, vous vous retrouverez noyé sous des copies physiques de passeports dans différentes langues que vous ne comprenez pas. Sans parler des problèmes juridiques potentiels que vous pouvez rencontrer avec des copies de passeport qui traînent au bureau.
Existe-t-il une solution pour traiter automatiquement les passeports ?
La réponse courte est oui ! Dans cet article, nous allons présenter l’API d’analyse des passeports de Klippa, une API pouvant convertir n’importe quelle image ou PDF d’un passeport en données structurées via l’OCR. L’API susmentionnée a un temps de mise en œuvre de quelques heures et peut analyser les données d’un passeport en quelques secondes seulement !
Comment fonctionne notre API de traitement des passeports ?
L’analyse des passeports en données s’effectue en quelques étapes importantes. Tout d’abord, un utilisateur prend la photo d’un passeport ou soumet un fichier PDF à notre API. Le premier contrôle qui sera effectué concerne la qualité du document. Si cela répond à nos critères et que la qualité est suffisamment bonne, les photos sont transformées en fichier texte à l’aide de l’OCR. Pour les documents PDF, nous extrayons le texte lisible. Le fichier texte extrait peut être comparé à un fichier bloc-notes sur votre ordinateur. Du texte, rien de plus ! Nous sommes maintenant en mesure de vérifier la langue et le pays d’origine grâce à des algorithmes basés sur des années de données d’apprentissage automatique. Lorsque nous savons d’où vient le document, un modèle d’apprentissage automatique spécifique à la langue trouve les champs de données pertinents. Ensuite, nous pouvons extraire des données telles que le nom, le prénom, la date de naissance, le sexe, etc. Lorsque toutes les informations importantes ont été identifiées, nous convertissons les documents en JSON et renvoyons une réponse à l’utilisateur.
Une image vaut mille mots
La simple description d’un processus technique dans le texte ne donne pas toujours une image mentale claire pour tout le monde. Heureusement, nous pouvons montrer un exemple des étapes que nous suivons pour transformer une photo de passeport en données. Étant une société néerlandaise, nous utilisons un passeport néerlandais comme exemple, mais l’API ne se limite pas aux passeports néerlandais :


Quels champs sont facilement extrayables par l’OCR de Klippa ?
Notre moteur d’analyse est très flexible. Cela signifie que nous traitons des champs prêts à l’emploi, mais que nous pouvons également ajouter des champs personnalisés ou en supprimer sur des clés API spécifiques. Nous pouvons même personnaliser la structure de sortie ou anonymiser certains champs et images. Chaque client de Klippa dispose de sa propre clé API, de sorte que vos personnalisations n’affecteront jamais les autres clients. Chez Klippa, chaque client reçoit la solution idéale pour sa situation. Ci-dessous, nous avons listé les champs prêts à l’emploi. L’entrée peut être JPG, PNG, et PDF et la sortie par défaut est un fichier JSON.
Champs par défaut :
- Pays
- Langue
- Nom
- Second prénom
- Nom de famille
- Initiales
- Date de naissance
- Lieu de naissance
- Sexe
- Date de délivrance
- Date d’expiration
Et si vous lisiez le MRZ avec l’OCR ?
À partir des années 1980, les pays ont commencé à délivrer des passeports contenant une MRZ (abréviation de “machine-readable zone”). Les passeports qui en contiennent une sont appelés MRP, passeports lisibles à la machine. La structure de la MRZ est normalisée par le document 9303 de l’OACI et par la Commission électrotechnique internationale (ISO/CEI 7501-1). La MRZ est une zone du document qui peut être facilement lue par une machine utilisant la ROC (reconnaissance optique de caractères). La plupart des passeports modernes comportent une MRZ, qui est une chaîne de caractères, au recto du document. Nous avons ajouté ci-dessous un exemple de MRZ. Il n’est pas important pour vous de comprendre son fonctionnement, mais si vous l’examinez attentivement, vous verrez qu’il contient la plupart des informations pertinentes du document, combinées à des caractères supplémentaires et à une somme de contrôle. Klippa peut lire automatiquement le passeport MRZ avec l’OCR. Cela fait en fait partie du processus. Nous comparons le MRZ avec les données que nous trouvons sur le document lui-même. Cela nous donne l’assurance que les informations que nous avons trouvées sont correctes et cela peut également aider à détecter d’éventuels documents frauduleux.


Pourquoi l’analyse des passeports est-elle si importante ?
L’époque dans laquelle nous vivons est plus numérisée que jamais. Les tâches répétitives sont lentement automatisées. Dans de nombreux cas, cela est plus fiable et à moindre coût. Chez Klippa, nous nous concentrons sur la création de logiciels destinés à remplacer le travail manuel répétitif dans les processus administratifs. Le traitement et la vérification des passeports peuvent prendre beaucoup de temps. L’utilisation de l’OCR pour automatiser le traitement de vos passeports vous permettra de réduire les coûts, d’embarquer les clients plus rapidement et de réduire les erreurs dans les processus administratifs.
À propos Klippa
En 2014, Klippa a commencé avec une application de numérisation de reçus incluant l’OCR. Rapidement, nous avons décidé que nous ne devions pas limiter notre technologie à une API OCR pour les reçus. Aujourd’hui, nous avons beaucoup de produits OCR allant de l’analyse des factures et des reçus, aux passeports, aux cartes d’identité et même aux contrats.
Vous souhaitez en savoir plus ? Vous trouverez ci-dessous un calendrier vous permettant de réserver une démonstration de 30 minutes avec l’un de nos experts dans le domaine de l’OCR. Pendant la démonstration, nous pouvons vous guider à travers les possibilités de notre moteur et vous fournir une réponse sur mesure à toutes vos demandes uniques, concernant les passeports. Vous préférez commencer à tester l’API OCR Passeports par vous-même ? Contactez-nous pour demander une clé API !