Parsing API διαβατηρίων ως υπηρεσία με OCR

Parsing API διαβατηρίων ως υπηρεσία με OCR

Ένα διαβατήριο είναι ένα έγγραφο που σχεδόν όλοι έχουν κάποια στιγμή στη ζωή τους. Εκδίδεται από την κυβέρνηση της χώρας στους πολίτες της και χρησιμοποιείται κυρίως για ταξίδια. Χρησιμεύει επίσης ως απόδειξη της εθνικότητας, του ονόματος, του επώνυμου, του φύλου κλπ. Οι επιχειρήσεις έχουν αποδεχθεί εδώ και πολύ καιρό τα διαβατήρια ως έγγραφα αναγνώρισης (ID – ταυτότητες) από τους πελάτες τους. Στις περισσότερες περιπτώσεις, θα καταγράψουν τα στοιχεία του και θα κάνουν ένα σαρωμένο αντίγραφο του. Αυτό, φυσικά, φαίνεται σαν μια ικανοποιητική λύση αν χρειαστεί να προετοιμάσετε μια σύμβαση για έναν πελάτη, για παράδειγμα. Ωστόσο, τα πράγματα μπορούν να γίνουν πολύ περίπλοκα αν έχετε εκατοντάδες συμβάσεις για την προετοιμασία, αλλά και αν οι πελάτες σας διαφέρουν ως προς την εθνικότητα. Γρήγορα θα βρεθείτε να αποπνηκτική κατάσταση μεε φυσικά αντίγραφα διαβατηρίων σε διαφορετικές γλώσσες που δεν μπορείτε να καταλάβετε. Ας μη μιλήσουμε για τα πιθανά νομικά προβλήματα που μπορεί να αντιμετωπίσετε με τα αντίγραφα διαβατηρίων γύρω από το γραφείο.

Υπάρχει λύση για την αυτόματη επεξεργασία των διαβατηρίων;

Η σύντομη απάντηση είναι ναι υπάρχει! Σε αυτό το ιστολόγιο, θα παρουσιάσουμε το API ανάλυσης Klippa για διαβατήρια, ένα API που μπορεί να μετατρέψει οποιαδήποτε δεδομένη εικόνα ή PDF ενός διαβατηρίου σε δομημένα δεδομένα χρησιμοποιώντας OCR. Το προαναφερθέν API έχει χρόνο εγκατάστασης λίγων ωρών και μπορεί να αναλύσει τα δεδομένα από ένα διαβατήριο μέσα σε λίγα δευτερόλεπτα!

Πώς λειτουργεί το API επεξεργασίας διαβατηρίων;

Η ανάλυση των διαβατηρίων στα δεδομένα γίνεται σε μερικά σημαντικά βήματα. Αρχικά, ένας χρήστης λαμβάνει μια φωτογραφία ενός διαβατηρίου ή υποβάλλει ένα αρχείο PDF στο API μας. Ο πρώτος έλεγχος που θα γίνει θα αφορά την ποιότητα του εγγράφου. Αν αυτό πληρεί τα κριτήρια μας και η ποιότητα είναι αρκετά καλή, οι εικόνες μετατρέπονται σε αρχείο κειμένου χρησιμοποιώντας OCR. Για τα έγγραφα PDF εξάγουμε το αναγνωρίσιμο κείμενο. Το εξαγόμενο αρχείο κειμένου μπορεί να συγκριθεί με ένα αρχείο σημειωματάριου στον υπολογιστή σας. Απλά κείμενο, τίποτα περισσότερο! Τώρα μπορούμε να ελέγξουμε τη γλώσσα και τη χώρα προέλευσης με αλγορίθμους που βασίζονται σε χρόνια δεδομένα μηχανικής μάθησης. Όταν γνωρίζουμε από πού προέρχεται το έγγραφο, ένα συγκεκριμένο μοντέλο μηχανικής μάθησης για τη γλώσσα εντοπίζει τα σχετικά πεδία δεδομένων. Στη συνέχεια, μπορούμε να εξαγάγουμε δεδομένα όπως όνομα, επώνυμο, ημερομηνία γέννησης, φύλο κλπ. Όταν εντοπιστούν όλες οι σημαντικές πληροφορίες, μετατρέπουμε τα έγγραφα σε JSON και στέλνουμε μια απάντηση στον χρήστη.

Μια εικόνα χίλιες λέξεις

Ευτυχώς, μπορούμε να δείξουμε ένα παράδειγμα των βημάτων που κάνουμε για να επεξεργαστούμε μια εικόνα διαβατηρίου σε δεδομένα. Επειδή είμαστε ολλανδική εταιρεία, χρησιμοποιούμε ως παράδειγμα ένα ολλανδικό διαβατήριο, αλλά το API δεν περιορίζεται στα ολλανδικά διαβατήρια:

Ποια είναι τα πεδία που εξάγονται εύκολα από το OCR της Klippa;

Ο μηχανισμός ανίχνευσης είναι εξαιρετικά ευέλικτος. Αυτό σημαίνει ότι υπάρχουν από τα πεδία των κουτιών που επεξεργαζόμαστε, αλλά μπορούμε επίσης να προσθέσουμε προσαρμοσμένα πεδία ή να αφαιρέσουμε πεδία σε συγκεκριμένα κλειδιά API. Μπορούμε ακόμη να προσαρμόσουμε τη δομή εξόδου ή να κάνουμε ανώνυμα ορισμένα πεδία και εικόνες. Κάθε πελάτης στην Klippa έχει δικό του κλειδί API, οπότε οι προσαρμογές σας δεν θα επηρεάσουν ποτέ άλλους πελάτες. Στην Klippa, κάθε πελάτης παίρνει την ιδανική λύση για την κατάστασή του. Η είσοδος μπορεί να είναι JPG, PNG και PDF και η προεπιλεγμένη έξοδος είναι αρχείο JSON. Τα προεπιλεγμένα πεδία είναι:

  • Χώρα
  • Γλώσσα
  • Ονομα
  • Μεσαίο όνομα
  • Επώνυμο
  • Αρχικά
  • Ημερομηνία Γέννησης
  • Τόπος γέννησης
  • Φύλο
  • Ημερομηνία έκδοσης
  • Ημερομηνία Λήξης

Τι γίνεται με την ανάγνωση του MRZ με OCR;

Από τη δεκαετία του 1980 και εξής, οι χώρες άρχισαν να εκδίδουν διαβατήρια που περιείχαν MRZ. Το MRZ είναι η ζώνη που είναι αναγνώσιμη από μηχανές. Τα διαβατήρια που περιέχουν MRZ αναφέρονται ως MRP, διαβατήρια αναγνώσιμα από μηχανές. Η δομή του MRZ τυποποιείται από το έγγραφο ICAO 9303 και από τη Διεθνή Ηλεκτροτεχνική Επιτροπή ως ISO / IEC 7501-1. Το MRZ είναι μια περιοχή στο έγγραφο που μπορεί εύκολα να διαβαστεί από ένα μηχάνημα που χρησιμοποιεί OCR (οπτική αναγνώριση χαρακτήρων). Τα περισσότερα σύγχρονα διαβατήρια έχουν ένα MRZ, που είναι μια σειρά από χαρακτήρες, στο μπροστινό μέρος του εγγράφου. Παρακάτω έχουμε προσθέσει ένα παράδειγμα ενός MRZ. Δεν είναι σημαντικό για σας να καταλάβετε πώς λειτουργεί, αλλά αν το εξετάσετε προσεκτικά, θα δείτε ότι περιέχει τις περισσότερες σχετικές πληροφορίες στο έγγραφο, σε συνδυασμό με πρόσθετους χαρακτήρες και ένα αθροιστικό άθροισμα. Η Klippa μπορεί να διαβάσει αυτόματα το MRZ διαβατηρίου με OCR. Αυτό είναι στην πραγματικότητα μέρος της διαδικασίας. Συγκρίνουμε το MRZ με τα δεδομένα που βρίσκουμε στο ίδιο το έγγραφο. Μας παρέχει τη διαβεβαίωση ότι οι πληροφορίες που βρήκαμε είναι σωστές και μπορούν επίσης να βοηθήσουν στην ανίχνευση πιθανών παραπλανητικών εγγράφων.

Τι κάνει η ανάλυση των διαβατηρίων τόσο σημαντική;

Η εποχή μας είναι πιο ψηφιοποιημένη από ποτέ. Οι εργασίες που επαναλαμβάνονται αργά αντικαθίστανται από υπολογιστές και ρομπότ. Σε πολλές περιπτώσεις, μπορούν να εκτελούν αυτά τα καθήκοντα ταχύτερα, με μικρότερο αριθμό λαθών και με πιο οικονομικά αποδοτικό τρόπο. Στην Klippa επικεντρωνόμαστε στην κατασκευή λογισμικού για την αντικατάσταση της χειρωνακτικής επαναλαμβανόμενης εργασίας σε διοικητικές διαδικασίες. Η επεξεργασία και ο έλεγχος των διαβατηρίων μπορεί να είναι πολύ χρονοβόρος. Η χρήση του OCR για την αυτοματοποίηση της επεξεργασίας του διαβατηρίου θα σας επιτρέψει να εξοικονομήσετε κόστος, να γίνετε ταχύτεροι πελάτες και να μειώσετε τα λάθη στις διοικητικές διαδικασίες.

Σχετικά με την Klippa

Το 2014, η Klippa ξεκίνησε με μια εφαρμογή σάρωσης αποδείξεων, η οποία συμπεριέλαβε το OCR. Σύντομα αποφασίσαμε να μην περιορίζουμε την τεχνολογία μας στις αποδείξεις. Σήμερα έχουμε πολλά προϊόντα OCR που κυμαίνονται από αποδείξεις και τιμολόγια έως διαβατήρια, ταυτότητες ακόμη και συμβόλαια.

Ενδιαφέρεστε να μάθετε περισσότερα; Παρακάτω μπορείτε να βρείτε ένα πρόγραμμα όπου μπορείτε να κλείσετε μια επίδειξη 30 λεπτών με έναν από τους ειδικούς μας στους τομείς του OCR. Κατά τη διάρκεια της επίδειξης, μπορούμε να σας καθοδηγήσουμε στις δυνατότητες της μηχανή  μας και να σας προσφέρουμε μια εξατομικευμένη απάντηση σε όλα τα μοναδικά αιτήματά σας σχετικά με τα διαβατήρια. Αρχίστε μάλλον να δοκιμάσετε μόνοι σας το OCR API του διαβατηρίου; Επικοινωνήστε μαζί μας για να ζητήσετε ένα κλειδί API!

Works with AZEXO Shopify builder