Menükarten zu analysieren kann eine nervenaufreibende und zeitintensive Aufgabe sein, vor allem wenn es hunderte bis tausende Restaurants innerhalb eines spezifischen Gebiets gibt und diese alle mit einbezogen werden sollten. Um die Daten effektiv nutzen zu können, müssen sie in ein übersichtliches System gebracht werden.
Das bedeutet jemand muss vor Ort, die Speisekarte fotografieren und diese Daten manuell in ein System eintragen, um daraus anschließend eine Übersicht zu erstellen. Erst wenn die Daten von hunderten Restaurants gesammelt sind, erhält man eine vergleichbare und wertvolle Datenmenge.
Dass der damit verbundene Arbeitsaufwand nicht kosteneffizient ist, ist ein relativ eindeutiger Fakt. Was aber, wenn ein anderer Ansatz zur Auswahl steht? In der heutigen Zeit, muss es doch Möglichkeiten geben, eine solche Aufgabe von einem Computer erledigen zu lassen, oder? Korrekt!
In diesem Blog erklären wir Ihnen, wie Sie das Scannen und Auswerten von Speisekarten mit Hilfe von optischer Zeichenerkennung (OCR) und Machine Learning automatisieren können.
Wie wurde es bisher gemacht?
Um ein klares und genaues Bild davon zu erhalten, was die Konkurrenz momentan anbietet, ist es notwendig regelmäßige Analysen in deren Preisgestaltung, Menüangebot und andere Zusatzleistungen durchzuführen. Die Betrachtung dieser Informationen dient Ihnen als wertvolle Möglichkeit, sich einen Vorteil auf dem Markt zu verschaffen.
Das Sammeln von Daten über andere Restaurants in Ihrer Nähe würde folgende Schritte beinhalten:
- Das Abfotografieren der Speisekarte eines anderen Restaurants. Dieses Foto kann verwackelt oder bei schlechten Lichtverhältnissen aufgenommen sein.
- Die Daten auf dem Foto werden manuell in eine Tabelle, häufig z.B. Excel, übertragen. Zu den gängigen Daten gehören z.B. Name des Restaurants, Gerichte, Zutaten, Preise, Allergie-Informationen, und weitere Informationen.
- Diese Tabelle wird dann von Hand in eine Datenbank mit weiteren Restaurants übertragen.
- In dieser Datenbank kann nun nach nützlichen Informationen gesucht werden, aus denen Rückschlüsse zum Beispiel zur Preisgestaltung gezogen werden können.
Wenn Sie der Konkurrenz einen Schritt voraus sein wollen, müssen Sie dies regelmäßig tun. Das bedeutet, dass dieser mühsame Prozess jeden Monat oder manchmal sogar jede Woche von vorne beginnt, was ihn zu einem kostspieligen und zeitaufwendigen Unterfangen macht.
Vielleicht tendieren Sie aus diesem Grund dazu, diese repetitive und zeitintensive Aufgabe an eine externe Firma eines Landes mit einem niedrigen Mindestlohn outzusourcen. Verständlich, jedoch gibt es auch eine Alternative.
Wie sollte es gemacht werden?
Eine automatisierte Lösung wäre der beste Weg. Sie müssten immer noch ein Foto oder eine andere Form von Aufnahme der Menükarte zur Verfügung stellen, aber somit wäre der größte Teil Ihrer Arbeit auch schon getan.
Die zuvor aufgelisteten Schritte werden von einer Künstliche Intelligenz (KI) Lösung übernommen. Sie liefern den Input, die KI-Lösung liefert den Output. Die folgenden Schritte sollten durchgeführt werden:
- Sie laden ein Foto oder PDF-Scan einer Menükarte hoch.
- Das Foto wird automatisch zurechtgeschnitten und korrekt belichtet.
- Anschließend wird das Bild mit Hilfe von OCR gelesen und in eine Textdatei umgewandelt.
- Dieser Text wird in ein Format umgewandelt, das es ermöglicht, ihn mithilfe von Machine-Learning Algorithmen zu kategorisieren.
- Sie erhalten die strukturierten Daten als JSON-Output, welche in einer Analyse-Software eingesetzt oder in einer Datenbank weiter verarbeitet werden kann.
Dieser Prozess ist vollständig automatisiert, präzise, schnell und vor allem modern. Die API wird von einer KI unterstützt, die mit realen Beispielen geschult wurde und kontinuierlich dazu lernt.
So können Sie auf die manuelle Datenerfassung und Eingabe verzichten, was Ihnen auch viele Flüchtigkeitsfehler erspart.
Was ist eine OCR-Lösung für das Scanning von Menükarten?
Beim Einsatz einer OCR-Lösung für den vorliegenden Use Case geht es darum das Scanning von einer hohen Anzahl an Speisekarten zu automatisieren. Dabei werden Fotos oder Scans von Speisekarten über eine API hochgeladen, die Menüs digitalisiert und zu strukturierten Daten verarbeitet.
Wir haben uns zuvor die klassische, manuelle Methode angesehen, und wie eine automatisierte Methode aussehen kann. Im Folgenden finden Sie eine Übersicht der konkreten Schritte:
- Sie laden ein Foto oder PDF Scan einer Speisekarte über die API hoch.
- Die API scannt das Foto und befreit das Bild von Unschärfe und schlechter Belichtung.
- Das Bild wird mit Hilfe von OCR gelesen und in eine TXT-Datei verwandelt.
- Aus dieser Textdatei werden die Daten in ein strukturiertes JSON-Format umgewandelt.
- Sie erhalten die strukturierten Daten als JSON-Output, welche anschliessend in einer Analyse-Software oder Datenbank verarbeitet werden kann.
Der JSON-Output wird automatisch gemäß der Voreinstellungen strukturiert, wodurch Sie alle Daten auf der Menükarte kategorisieren und visualisieren können. Das bedeutet, dass Sie nicht alle gefundenen Daten einzeln nach Kategorie in eine Tabelle eintragen müssen.


Für welche Zwecke eignet sich der Einsatz von OCR?
Das Ergebnis sind Daten, die Sie für Ihre spezifischen Ziele nutzen können. Es eignet sich perfekt für die folgenden Zwecke:
Marktforschung
Sie können schnell analysieren, was Restaurants und Bars innerhalb einer bestimmten Zielgruppe zu welchem Preis anbieten und welche Veränderungen es im Laufe der Zeit gibt. Diese Informationen können zum Beispiel für die Entwicklung einer Geschäftsstrategie, Analyse der Wettbewerbsfähigkeit oder zu Forschungszwecken genutzt werden.
Wettbewerbs-Analyse
Verschaffen Sie sich einen klaren Überblick über Menüangebote, Preisgestaltung oder Änderungen und Angebote direkter Konkurrenten, damit Sie Ihr Geschäftsmodell schnell anpassen und der Konkurrenz immer einen Schritt voraus sein können.
Geografische Preisanalyse
Indem Sie ein bestimmtes Gebiet oder eine Region herausgreifen, können Sie die Daten nutzen, um Recherchen über Preistrends von Restaurants und Bars in der Umgebung anzustellen. Sie können Ihr eigenes Preisschema mit genauen, spezifischen Daten anpassen.
Großflächige Digitalisierung von Speisekarten
Abgesehen von der Forschung können Sie OCR auch dazu nutzen, um Ihre Menükarten für die Online-Nutzung zu digitalisieren. Besonders wenn Sie einen Essens-Lieferdienst betreiben, kann das Erfassen und Strukturieren aller Menükarten von Restaurants den Onboarding-Prozess für neue Restaurants vereinfachen und vor allem beschleunigen.


Welche Technologie steckt hinter der OCR-Lösung für das Scannen von Speisekarten?
Bei jedem Schritt des OCR-Prozesses arbeitet ein anderer Bereich der Software. Es ist diese Zusammenarbeit zwischen verschiedenen Komponenten der Software, die den Prozess erst effektiv macht. Im Folgenden wird erläutert, wie die einzelnen Softwarekomponenten zusammenarbeiten, um Ihnen die benötigten Daten zur Verfügung zu stellen:
- Über eine einfach zu bedienende GUI (Graphical User Interface) können Sie in der App auf die Kamera zugreifen, um ein Foto aufzunehmen und hochzuladen oder ein PDF hochzuladen. Bei Bedarf werden die Dokumente automatisch zurechtgeschnitten und eine Unschärfe- und Blendung Korrektur verwendet.
- Ab hier übernimmt die API (Application Programming Interface). Dies ist die Komponente, mit der alle Informationen zwischen dem Backend, wo die Arbeit erledigt wird, und dem Frontend, also das Interface, was die Daten visuell darstellt, transportiert werden. Die API verbindet den Upload mit dem trainierten neuronalen Netzwerk im Hintergrund, welches analysiert, welche Zeichen und Daten auf dem Bild sind.
- Die optische Zeichenerkennung (OCR) wird verwendet, um ein Bild, in einen lesbaren Text umzuwandeln. Jeder einzelne Buchstabe, der auf dem Foto zu erkennen ist, wird zusammen mit allen anderen, in ein einfaches digitales TXT-Format extrahiert. Damit ist das Foto nun in digitale Daten umgewandelt worden.
- Das Gehirn hinter diesem Prozess ist ein neuronales Netzwerk in Form einer künstlichen Intelligenz (KI). Diese wurde nicht nur darauf trainiert, den Text auf einem Bild zu erkennen, sondern ist auch in der Lage zu erkennen, in welchem Kontext die Informationen auf der Textdatei zueinander stehen. Wenn ein Menü ein bestimmtes Layout mit mehreren Unterabschnitten hat, dann ist die KI in der Lage, automatisch zu bestimmen, welches Element zu welchem Abschnitt gehört und was der dazugehörige Preis ist. Mit dieser Form des Deep Learnings geht die OCR weit über die einfache Umwandlung eines Bildes in Text hinaus.
- Durch die Fähigkeiten des neuronalen Netzwerks Bildinhalte zu kategorisieren, wird ein JSON-Format gebildet. JSON eignet sich für die Darstellung von Daten und kann Datenpunkte automatisch gruppieren und verknüpfen, sowohl mit bestehenden Datenbanken als auch einfach als strukturierte Daten. Das macht JSON zu einem idealen Format, um es digital weiterzuverarbeiten.


Obwohl dieser Vorgang kompliziert und umständlich erscheint und im Backend tatsächlich komplex ist, dauert er nur ein paar Sekunden. Das einzige, was der Benutzer sieht, ist die User Interface, über die ein Foto hochgeladen werden kann und die JSON-Ausgabe im Handumdrehen erstellt wird.
Dies bedeutet, dass dieser Vorgang in hohem Volumen wiederholt werden und Ihre Recherchefunktionen dadurch über manuelle Tabelleneinträge in Excel erweitert werden kann.
Use Cases für das Scanning von Menükarten
Welche Nutzer schöpfen den grössten Wert vom Einsatz einer Menükarten OCR-Software? Obwohl Sie feststellen werden, dass die Möglichkeiten zur Verwendung dieser Daten nahezu unbegrenzt sind, bieten wir Ihnen drei konkrete Anwendungsfälle:
Restaurant Inhaber
Große Restaurantketten müssen darüber informiert sein, was die Wettbewerber in der Region unternehmen. Dies gilt insbesondere dann, wenn Sie ein Geschäftsformat verwenden, das wettbewerbsfähig sein soll und folglich viele Konkurrenten in der Region hat.
Unabhängig davon, ob Sie den Markt in Bezug auf Preisgestaltung, Einzigartigkeit des Menüs, Vielfalt oder einen anderweitigen Zweck, der das Scannen von Menükarten voraussetzt, analysieren möchten, es ist wichtig ein Auge darauf zu werfen, was die Konkurrenz betreibt. Dies verschafft Ihnen einen Wettbewerbsvorteil gegenüber den anderen.
Am besten planen Sie in regelmäßigen Intervallen Fotos der relevanten Menükarten der Wettbewerber in der Nähe aufzunehmen. Wenn Sie das Foto in der App aufnehmen, können Sie das Bild sofort hochladen und es wird direkt verarbeitet.
Angenommen, Sie möchten in einem großen Stadtgebiet tausend Menükarten pro Monat verarbeiten und müssen schnell auf die Daten zugreifen. Jedes Mal, wenn ein Mitarbeiter ein Bild hochlädt, wird es innerhalb von Sekunden in JSON-Daten konvertiert.
Ihre Datenbank kann somit jederzeit auf dem neuesten Stand gehalten werden. Dies bedeutet, dass Sie (falls dies Teil Ihrer Preisstrategie ist) mit dem preiswertesten Menü in der Region oder im Land führen können und sicher sein können, dass Ihre Preisgestaltung auf handfesten Daten basiert ist.


Marktforschungsagenturen
Wenn Sie der Restaurantbranche genaue Daten liefern möchten, müssen Sie eine effektive Methode zur Erfassung dieser Daten einleiten. Unabhängig davon, ob es sich um eine einfache SWOT-Analyse oder eine Menüoptimierung für ein Restaurant handelt, sollten Sie Ihren Kunden auf der Grundlage einer gründlichen Untersuchung genaue und schnelle Ratschläge geben können.
Natürlich haben Sie Mitarbeiter, die in der Lage sein sollten, Daten manuell zu erfassen, oder Sie haben sich dafür entschieden, diese Backoffice-Arbeit an eine externe Firma auszulagern. Das Sammeln von Daten ist jedoch eher eine Computeraufgabe, oder?
Der Einsatz einer API zur Ausführung dieser manuellen Arbeit führt zu einem kosteneffizienten, präzisen und schnelleren Prozess. Die Konvertierung einer Menükarte in strukturierte und kategorisierte Daten erfolgt über die OCR der Menükarte innerhalb von Sekunden. Dies ist eindeutig schneller als das manuelle Erfassen durch einen Mitarbeiter in eine Tabelle.


Lieferungsservices
Insbesondere in Zeiten von COVID-19 hat die Dominanz von Lieferservices zugenommen. Wenn Sie in diesem manchmal gesättigten Markt bestehen möchten, ist es klar, dass Sie eine einfache Art des Onboardings benötigen.
Genauso wichtig ist es jedoch, Ihre Plattform auf dem neuesten Stand zu halten. Um am Wettbewerb teilnehmen zu können, müssen Sie die Lieferung von Hunderten von Restaurants und Bars anbieten, die alle ihre Menüs mit zunehmender Regelmäßigkeit anpassen.
Sie benötigen eine schnelle Methode zur Verarbeitung aller Restaurantmenüs, damit keine Informationen auf Ihrer Plattform veraltet sind.
Eine schnelle Möglichkeit besteht darin, dass teilnehmende Restaurants ein Foto jeder neuen Menükarte an unsere API senden. Mit der Menükarte OCR wird jedes Menü gescannt und gelesen, wobei alle relevanten Daten in ein JSON-Format extrahiert werden.
Mit diesem Format können Sie schnell und automatisch alle Restaurantmenüeinträge auf Ihrer Lieferplattform aktualisieren. Dies ist eine hervorragende Möglichkeit, um sowohl die teilnehmenden Restaurants als auch natürlich Ihre Kunden zufriedenzustellen.


Häufig gestellte Fragen
Funktioniert die OCR auf allen Menükarten?
Da fast alle Menükarten einem ähnlichen Format folgen, kann unsere OCR-API alle Informationen auf einer Menükarte unterscheiden und in ein JSON-Format übertragen. Sie können sich die Unterteilung in Vorspeise, Hauptgericht, Nachspeise usw. vorstellen, aber z.B. auch eine Kategorisierung je nach Ernährungspräferenz (vegetarisch oder vegan) und Preisgestaltung.
Funktioniert die OCR auch mit weniger qualitativen Bildaufnahmen?
Insbesondere, wenn die Bildaufnahme einer Menükarte in Eile erfolgt, kann die Qualität des Fotos beeinträchtigt werden. Zum Glück enthält unsere API Features zur Bildvorverarbeitung, mit denen Bilder mit schlechter Qualität für eine bessere Verarbeitung verbessert und auch rotiert werden können.
Darüber hinaus bietet Klippa ein Scan-SDK an, das in mobilen Apps implementiert werden kann. Dieses SDK enthält Bildverarbeitungsfunktionen wie die Perspektivenkorrektur sowie die Erkennung von Blendung und Unschärfe, um den Inhalt von Fotos zu verdeutlichen.
Auf diese Weise erhalten Sie nur Fotos, die gültige Informationen zur weiteren Verarbeitung enthalten.
Welche Sprachen werden unterstützt?
Klippas API funktioniert am besten mit allen westlichen Sprachen. Daher arbeiten wir am häufigsten an Use Cases in Deutsch, Englisch, Niederländisch, Französisch, Spanisch, Portugiesisch, Schwedisch, Norwegisch, Dänisch, Finnisch und Italienisch. Weitere Sprachen können auf Anfrage hinzugefügt werden.
Planen Sie eine Demo mit Klippa
Möchten Sie unsere Lösung in Aktion sehen oder benötigen Sie weitere Informationen? Unsere Produktexperten führen Sie gerne in einer 30-minütigen Online Demo durch unsere OCR-Lösung. Während der Demo können Sie spezifische Anfragen oder anderweitige Fragen zur Anwendung stellen. Unsere Produktspezialisten freuen sich Ihnen bei Ihrem Anliegen zu unterstützen.