Ob Sie nun Daten und Beträge aus Rechnungen extrahieren oder nach Produktpositionen (Line Items) auf Quittungen suchen, die erste OCR Lösung, die Sie online finden werden, ist Tesseract. Tesseract ist eine der ersten Open-Source-OCR-Engines, die es gibt. Die Software stammt eigentlich aus dem Jahr 1985, als die Entwicklung von Hewlett-Packard (HP) als kommerzielle Lösung begonnen wurde. Im Jahr 2005 wurde sie schließlich zu einem Open-Source-Projekt, und seither hat Google die Entwicklung für einige Jahre unterstützt.
In den letzten Jahren ist die Entwicklung zum Stillstand gekommen, da viele kommerzielle Alternativen aufkamen. Diese kommerziellen Lösungen sind zwar nicht kostenlos, aber wenn Sie eine leistungsfähigere Lösung suchen, die kontinuierlich verbessert wird, Technologien wie Machine Learning einbezieht und wenig bis gar keine Anpassungen erfordert, sind Alternativen zu Tesserarct mit hoher Wahrscheinlicher passender für Ihren Anwendungsfall.
Bei Klippa bieten wir eine Alternative zu Tesseract und Ihre Go-to-Lösung. Im Folgenden erläutern wir, warum wir Ihr idealer Partner sind wenn Sie eine präzise OCR-Software suchen, die auf Rechnungen, Belegen/Quittungen und vielen anderen Dokumentarten sofort einsetzbar ist.
Lokal gehostetes OCR oder Cloud OCR Lösung?
Tesseract wurde zu einer Zeit entwickelt, als die meisten Mitarbeiter von Klippa noch nicht einmal geboren waren. In der IT-Welt kann das schnell bedeuteten, dass veraltete Technologien eingesetzt werden. Das trifft auch auf Tesseract zu. Ein paar Nachteile des Systems sind, dass man es selbst hosten muss und eine Menge Anpassungen vornehmen muss, damit es mit den eigenen Schriften und Datensätzen richtig funktioniert. Dies erfordert Entwicklungskapazitäten und spezielle IT-Kompetenzen, die viele Unternehmen resource-technisch nicht aufbringen.
Tesseract ist keine Plug-and-Play-Lösung. Es wird Ihre Dokumente in Rohtext umwandeln, jedoch keine Datenextraktion für bestimmte Felder für Sie durchführen. Nachdem Sie also den Rohtext erhalten haben, müssen Sie intelligente Parsing-Algorithmen entwickeln, um die Daten zu extrahieren, die Sie benötigen. Glücklicherweise erledigt unsere Alternative all dies für Sie und wird zudem kontinuierlich verbessert.
Heute beherrschen REST-APIs die Welt. Die Cloud-Verarbeitung hat viele Vorteile, wie Flexibilität und Skalierbarkeit. Außerdem sind sie Plug-and-Play, so dass Sie schnell loslegen können. Die OCR-API von Klippa ist erstklassig, cloud-basiert und kubernetes-verwaltet, um sicherzustellen, dass uns niemand ausbremst und unsere Benutzer immer die gleiche schnelle Antwort erhalten. Unsere Cloud-Lösung kann in einer privaten Cloud an einem Standort Ihrer Wahl laufen.
Bezug auf externe Datenquellen = mehr Datengenauigkeit bei der Texterkennung
Tesseract ist in seiner Funktionalität relativ eingeschränkt, da es als eigenständiges Paket arbeitet. Es erledigt eine bestimmte Aufgabe relativ gut, aber alle anderen Bausteine, um eine komplette Lösung zu erhalten, müssen Sie selbst erstellen. Klippa hat bereits alle Bausteine entwickelt, die Sie benötigen, um Qualitätsprüfungen, OCR Texterkennung, Datenextraktion und Datenvalidierung durchzuführen. Wir sind sehr stolz auf unsere Verarbeitungszeit von Dokumenten, die unter drei Sekunden liegt und alle oben genannten Schritte beinhaltet.
Die Verarbeitungsgeschwindigkeit unserer eigenen Datenserver ist schnell, aber bei vielen Dokumenten arbeiten wir mit zusätzlichen externen Systemen. Wenn wir zum Beispiel eine EU-Umsatzsteuernummer auf einem Dokument finden, durchsuchen wir die VIES-Datenbank, um den Namen und die Adresse des Lieferanten zu ermitteln. Wenn wir eine Adresse finden, überprüfen wir die Google Maps API, um zu bestätigen, dass die Adresse korrekt ist und dass es tatsächlich ein Unternehmen an diesem Standort gibt. Neben der VIES-Datenbank und Google Maps, wir führen noch viele weitere Validierenden mit externen Systemen durch.
Die Liste mit externen Integrationen wächst jeden Monat, um uns zu helfen, mehr Informationen über das Dokument zu erhalten als nur die geschriebenen Buchstaben und Zahlen. Das bedeutet, dass die OCR Software von Klippa Ihnen tatsächlich Informationen zum Dokument liefern kann, die nicht auf dem Dokument selbst stehen, aber aus dem Dokument abgeleitet werden können. Dadurch erhalten Sie eine viel höhere Genauigkeit und alles wird immer noch innerhalb dieser wenigen Sekunden verarbeitet.
Die Vorteile von Machine Learning in der OCR-Lösung
Bei Klippa haben wir viel Aufwand in die Erstellung von Modellen für Machine Learning gesteckt. Somit hilft uns diese KI-Technologie Rechnungen und Belege besser zu erkennen. Diese Modelle helfen uns bei der Identifizierung von Unterteilungen in einem Dokument, d. h. Kopf- und Fußzeilen sowie Einzelposteninformationen. Außerdem können sie Dokumente in nutzungsfallspezifische Segmente klassifizieren. Mit diesen Modellen können wir große Annahmen für die weitere Verarbeitung treffen, z. B. Roboterbuchhaltung (Robotic Accounting) oder eine Kategorie für die Steuerrückforderung der Mehrwertsteuer. Diese Modelle können auch die Einkaufskategorie eines Produkts vorhersagen, was bei der automatischen Ermittlung von Hauptbucheinträgen hilft. Machine Learning im Allgemeinen sorgt für ein sich ständig verbesserndes System. Wir nennen das die Klippa Feedback-Schleife (Feedback Loop).
Die meisten unserer Kunden sind ambitionierte Softwareentwickler wie wir. Gemeinsam arbeiten wir daran, die beste Buchhaltungsplattform, das beste Kundentreueprogramm, beste HR-Plattform oder das beste Nischentool zu entwickeln. Klippa arbeitet eng und denkt mit dem Kunden mit. Wir bleiben in engem Kontakt zu unseren Kunden und ihrem eigenen technischem Team, um die Erkennungsraten unserer OCR kontinuierlich zu verbessern.
Der direkte Vergleich zwischen Tesseract und Klippa’s OCR Lösung
Probieren geht über Studieren, deshalb werden wir ein Beispieldokument demonstrieren und die Ausgabe von Klippa OCR-Lösung mit der von Tesseract vergleichen. Da wir in den Niederlanden ansässig sind, zeigen wir Ihnen das Beispiel anhand einer niederländischen Quittung. Unsere OCR funktioniert jedoch ebenfalls erstklassig für deutsche Dokumente.


In Tesseract müssen Sie die Sprache angeben, deshalb haben wir diese Quittung als Niederländisch verarbeitet. Bei Klippa wir die Sprache automatisch erkannt. Unten finden Sie ein Beispiel für ein OCR-Ergebnis von Tesseract, das 3,8 Sekunden für die Verarbeitung benötigte. Wie Sie sehen können, sind die Ergebnisse einigermaßen gut, aber es gibt einige Fehler in der Ausgabe. Abgesehen vom Rohtext gibt es keine strukturierten Daten. Diese müssen sie, z.b. durch eigene Algorithmen, selbst erstellen.


Verarbeiten wir nun denselben Beleg über die Klippa OCR API. Unten finden Sie das Ergebnis, das 2,9 Sekunden für die Verarbeitung benötigte. Das ist bereits 25 % schneller und wie Sie sehen können, liefert es auch ein viel genaueres Rohtextergebnis.


Wenn Sie ein wenig weiter nach unten scrollen, sehen Sie, dass Klippa zusätzlich zum Rohtext tatsächlich eine strukturierte JSON-Ausgabe liefert. Stellen Sie sich vor, wie viel Zeit Sie dadurch sparen, weil das gesamte Parsen der Daten bereits erledigt ist und externe Ressourcen überprüft wurden. Mit Klippa erhalten Sie eine Antwort, mit der Sie sofort arbeiten können. Unten sehen Sie eine vereinfachte JSON-Antwort der Quittung, die wir zu Demonstrationszwecken etwas kürzer gemacht haben:


Natürlich ist dies nur ein Beispiel, aber wir können Ihnen garantieren, dass Klippa, egal welches Dokument Sie uns schicken, Tesseract an jedem Tag der Woche schlagen wird. Suchen Sie also nach der besten Tesseract-Alternative für Quittungen, Rechnungen oder andere Dokumente? Zögern Sie nicht, uns anzusprechen und eine unverbindliche Demo zu planen. Nach einer Demo haben Sie die Möglichkeit, einige kostenlose Tests durchzuführen und selbst zu erfahren warum unsere API unschlagbar ist.