Η Οπτική Αναγνώριση Χαρακτήρων (OCR – Optical Character Recognition)

Η Οπτική Αναγνώριση Χαρακτήρων (OCR – Optical Character Recognition)

Το OCR ή οπτική αναγνώριση χαρακτήρων, ήταν μια τεχνολογία που ήταν διαθέσιμη μόνο σε εταιρείες υψηλής τεχνολογίας για μεγάλο χρονικό διάστημα. Σε έναν κόσμο που αλλάζει ταχύτατα και γίνεται όλο και πιο ψηφιακός καθημερινά, οι χρήσης για OCR έχουν αυξηθεί σημαντικά. Οι οργανισμοί στον τομέα των τραπεζών, της ασφάλισης, της επεξεργασίας τιμολογίων, της διαχείρισης δαπανών, της επικύρωσης ταυτότητας και της διαχείρισης των συμβάσεων αρχίζουν να ενσωματώνουν το OCR στις λύσεις  τους που αντιμετωπίζουν οι πελάτες τους. Ωστόσο, η ανάπτυξη μιας λειτουργίας OCR είναι πολύ χρονοβόρα, δαπανηρή και γενικότερα σε κακό επίπεδο ποιότητας. Στην Klippa ξεκινήσαμε πριν από περίπου πέντε χρόνια. Με την πάροδο των ετών και με πολλά μέλη στηνομάδας, κατορθώσαμε να δημιουργήσουμε μια μηχανή υψηλής ποιότητας OCR βασισμένη σε εκατομμύρια έγγραφα και πολλούς αλγόριθμους μηχανικής και deep learning. Είμαστε πολύ υπερήφανοι για αυτό το έργο της τέχνης, αλλά τα καλά νέα είναι ότι είμαστε πρόθυμοι να μοιραστούμε! Το OCR μας είναι τώρα διαθέσιμο ως υπηρεσία μέσω του OCR API μας. Σε αυτό το ιστολόγιο θα απαντήσουμε σε μερικές γενικές ερωτήσεις και θα σας παρουσιάσουμε ορισμένα παραδείγματα.

Ποιους τύπους εγγράφων μπορεί να επεξεργαστεί το OCR της Klippa;

Αποδείξεις, τιμολόγια, εισιτήρια, συμβόλαια, εντολές αγοράς, διαβατήρια, ταυτότητες, άδειες οδήγησης- οποιοδήποτε είδος έγγραφου για οποιαδήποτε εταιρεία στον κόσμο Ο μηχανισμός OCR μας είναι πολύ ευέλικτος και μπορεί να εφαρμοστεί και σε συγκεκριμένες περιπτώσεις, γλώσσες και ακόμα και τύπους αρχείων.

Ποιες γλώσσες υποστηρίζονται από τη μηχανή OCR;

Η γλώσσα δεν είναι ένας εξαρτώμενος παράγοντας στη μηχανή μας OCR. Θεωρητικά αυτό σημαίνει ότι λειτουργεί για οποιαδήποτε γλώσσα. Αυτήν την στιγμή λειτουργεί τέλεια για τα Ελληνικά, Αγγλικά, Ολλανδικά, Γερμανικά, Ισπανικά, Ιταλικά και Γαλλικά. Στη συν-δημιουργία μπορούμε να βελτιστοποιήσουμε την μηχανή για άλλες γλώσσες. Απλά μας δώστε μια κλήση και μπορούμε να συζητήσουμε την προσέγγισή μας σχετικά με τη συν-δημιουργία.

Τι είδους αρχεία μπορούν να επεξεργαστούν;

Το Input της μηχανής είναι ευέλικτό. Θα πρέπει να είναι όσο το δυνατόν πιο εύκολο για οποιονδήποτε να χρησιμοποιήσει το OCR. Επομένως, υποστηρίζουμε οτιδήποτε από εικόνες και σαρώσεις (π.χ. JPG, PNG) σε έγγραφα (π.χ. PDF, Docx). Έχετε κάτι άλλο που θέλετε να επεξεργαστείτε; Απλά προγραμματίστε μια κλήση μαζί μας για να δείτε πώς μπορούμε να το κάνουμε να λειτουργήσει. Υπάρχει μια λύση για τα πάντα!

Πως είναι το output;

Από προεπιλογή, η απόκριση API είναι JSON. Πρόκειται για μια δομημένη μορφή δεδομένων που είναι ελαφριά και εύκολη στην ανάγνωση. Στην παρακάτω εικόνα μπορείτε να δείτε ένα παράδειγμα της εμφάνισης της απόκρισης. Το JSON είναι εύκολο να μετατραπεί σε XML, CSV ή οποιαδήποτε άλλη δομή. Εάν έχετε προσαρμοσμένες απαιτήσεις σχετικά με την παραγωγή, παρακαλούμε να μας στείλετε ένα μήνυμα και μπορούμε να συζητήσουμε.

output json ocr

Πόσο καιρό χρειάζεται για την εφαρμογή;

Το OCR Klippa ως υπηρεσία λειτουργεί μέσω ενός εύχρηστου RESTful API. Κατά μέσο όρο, ένας μόνο προγραμματιστής μπορεί να εφαρμόσει το API μας σε λιγότερο από 4 ώρες. Από εκεί και πέρα μπορείτε να ξεκινήσετε τη δοκιμή στο περιβάλλον του sandbox. Αν όλα λειτουργούν τόσο ομαλά όσο θα έπρεπε, μπορείτε μεταβείτε στην παραγωγή. Ο μέσος χρόνος από τον έλεγχο μέχρι την παραγωγή είναι μικρότερος από μία εβδομάδα.

Είναι δυνατή η δοκιμή του API OCR;

Η σύντομη απάντηση είναι ναι μπορείτε! Κατόπιν αιτήματος μπορούμε να προσφέρουμε ένα κλειδί API με ένα ορισμένο αριθμό δοκιμών credits (συνήθως 50 μονάδες). Αυτό, σε συνδυασμό με την API-Documenation, είναι το μόνο που χρειάζεστε για να ξεκινήσετε. Εάν αντιμετωπίζετε οποιαδήποτε προβλήματα, χρειάζεστε περισσότερες πιστοποιήσεις ή απλά θέλετε συμβουλές, μπορείτε να μιλήσετε με έναν από τους managers επιτυχίας των πελατών μας.

Μερικά παραδείγματα για το τι μπορεί να κάνει η μηχανή OCR Klippa

Αρκετά είπαμε, ας ο δούμε στην πράξη! Μια εικόνα είναι 1000 λόγια και παντα μιλάει από μόνη της. Στο πρώτο παράδειγμα θα υποθέσουμε ότι θέλετε να επεξεργαστείτε τιμολόγια με OCR για λογιστικούς σκοπούς. Το OCR μειώνει τον χρόνο επεξεργασίας, μπορεί να μειώσει το ποσοστό σφάλματος και θα καλητερεύσει την εμπειρία του χρήστη. To OCR μας μπορεί να αποσπάσει οποιοδήποτε πεδίο θέλετε, αλλά για να διατηρήσουμε το παράδειγμα σαφές, θα επικεντρωθούμε στην εξαγωγή της ημερομηνίας, των ποσών, των τιμών ΦΠΑ και του αριθμού τιμολογίου. Στην παρακάτω εικόνα θα δείτε ένα έγγραφο input στα αριστερά και (μέρος) της output JSON στα δεξιά.

Ίσως να μην είστε εδώ για επεξεργασία τιμολογίων, αλλά ψάχνετε για μια λύση για την εξαγωγή δεδομένων από τα διαβατήρια, ID και παρόμοια έγγραφα; Η Klippa είναι εδώ για να σας βοηθήσει! Στο παρακάτω παράδειγμα θα δείτε ένα διαβατήριο ως είσοδος στα αριστερά και την απάντηση JSON στα δεξιά:

Πιστεύουμε στη δύναμη των τριών και θα σας δώσουμε ένα ακόμη συνηθισμένο παράδειγμα. Αυτή η περίπτωση χρήσης είναι η ανάγνωση στοιχείων γραμμής παραλαβής για σκοπούς loyalty  και δεδομένων. Ενδιαφέρεστε να μάθετε τι αγοράζουν οι καταναλωτές για ποια τιμή σε ποια καταστήματα; Το OCR μας ως υπηρεσία είναι εδώ για να σας βοηθήσει. Στα αριστερά θα δείτε μια απόδειξη και στα δεξιά θα δείτε την έξοδο JSON.

Ας αρχίσουμε!

Σε αυτό το Q & A δώσαμε μια σύντομη εισαγωγή σχετικά με το τι μπορεί να κάνει ο κινητήρας μας. Πιστεύουμε ότι θα πρέπει πάντα να βρίσκουμε την καλύτερη λύση για μια περίπτωση χρήσης και πελάτη με την υπηρεσία OCR του SaaS. Ως εκ τούτου, μας αρέσει η προσωπική επαφή, η συνεργατική ανάπτυξη και η ανταλλαγή ιδεών με τους πελάτες μας. Έτσι, ας έρθουμε σε επαφή και να δούμε πού πηγαίνει! Στείλτε μας ένα μήνυμα στη διεύθυνση support@klippa.com ή σχεδιάστε ένα demo με έναν ειδικό OCR.

Image Map WordPress builder