Investigar y analizar las cartas de menú de hasta mil restaurantes de una zona geográfica determinada es una tarea agotadora. Tienes que conducir hasta el restaurante de un competidor y fotografiar el menú, conducir de vuelta, introducir manualmente el contenido y la estructura del menú en una hoja de cálculo, construir una base de datos utilizable y, finalmente, puedes utilizar los datos para tu beneficio. Si haces esto cien o mil veces, obtendrás una valiosa cantidad de datos. Las horas de trabajo que cuesta hacer esto y la cantidad de tiempo que llevará antes de tener una cantidad importante de datos no es eficiente y, desde luego, no es económico. ¿Y si adoptamos un enfoque diferente? Vivimos en una era moderna, debe haber una manera de hacer que un ordenador haga todo el trabajo por nosotros, ¿verdad? Pues sí. En este blog te explicaremos cómo puedes automatizar el proceso de escaneado de tarjetas de menú utilizando el reconocimiento óptico de caracteres (OCR) y el machine learning.
¿Cómo se hacía antes?
Para tener una idea clara y precisa de lo que hacen los competidores de tu sector del mercado, tienes que analizar constantemente cuáles son sus precios, qué platos nuevos ofrecen o cualquier otra información que pueda mejorar tus posibilidades con respecto a las de ellos. La recolección de datos sobre los competidores u otros restaurantes de tu vecindario implicaría los siguientes pasos:
- Tomar una foto del menú de un restaurante. Esta foto puede tomarse deprisa o con poca luz.
- Los datos de la foto se transfieren manualmente a una hoja de cálculo, que incluye secciones como el nombre, el plato, los ingredientes, el precio, advertencias sobre alergias, etc. Esta información se combina con el nombre y la dirección del restaurante. Esta información se combina con el nombre y la dirección del restaurante.
- A continuación, la hoja de cálculo se procesa de forma manual en una base de datos de varios restaurantes.
- Esta base de datos se explora en busca de información útil que permita sacar conclusiones sobre, por ejemplo, los precios
Si quieres mantenerte por delante de la competencia, tendrás que hacer esto regularmente. Esto significa que este meticuloso proceso comienza de nuevo cada mes, o a veces incluso cada semana, lo que lo convierte en un trabajo costoso y que requiere mucho tiempo. Este tipo de trabajo de gran volumen y frecuencia aumentará tus necesidades de trabajadores, lo que podría tentarte a buscar una externalización del trabajo interno a países con mano de obra barata. Es comprensible, pero quizá haya otra manera.
¿Cómo se debe hacer?
La mejor manera de empezar sería automatizar tu proceso. Seguiría siendo necesario proporcionar una foto u otro tipo de imagen de la carta de menú, pero eso sería básicamente todo. La IA podría encargarse a partir de ahí. Tú aportas la información y la IA el resultado. Deberían seguirse los siguientes pasos:
- Subes una foto o un PDF de un menú.
- La foto se aclara y corrige automáticamente.
- A continuación, la imagen se lee con ayuda del OCR y se convierte en texto sin procesar.
- Este texto se convierte a un formato que permite contextualizarlo y categorizarlo mediante algoritmos de machine learning.
- Al final se obtiene el resultado, que puede introducirse en el software de gestión de datos y transferirse fácil y automáticamente a los planes de investigación.
Este proceso es totalmente automático, preciso, rápido y, sobre todo, moderno. La API está respaldada por la IA, que ha sido entrenada con ejemplos prácticos y sigue aprendiendo con el tiempo. Te permite mantener todo bajo tu propio control, sin depender de la introducción manual, que tiende a generar errores.
¿Qué es el OCR de cartas de menú?
El OCR de cartas de menú consiste en automatizar el proceso de escanear numerosos menús subiendo fotos o escaneos de los menús a una API y digitalizando y procesando los menús para convertirlos en datos utilizables. Hemos visto lo que solía hacerse y lo que debería hacerse. A continuación resumimos los pasos a seguir:
- Subes una foto de un menú a la API.
- La API escanea la foto y aclara su contenido con detección y corrección de desenfoques y brillos.
- A continuación, la imagen se lee con ayuda de OCR y se extrae en un archivo TXT sin procesar.
- Este archivo TXT se convierte a un formato JSON, que permite contextualizar y categorizar los datos.
- Tú recibes la respuesta JSON, que se puede implementar en el software de gestión de datos y transferir fácil y automáticamente a los planes de investigación.
La respuesta JSON se estructura automáticamente en parámetros de datos predeterminados, lo que te permite contextualizar todos los datos de la carta de menú. Esto significa que no es necesario colocar todos y cada uno de los elementos en la casilla contextual de una hoja de cálculo.


¿Para qué puedes utilizar el OCR de cartas de menú?
Los datos resultantes pueden utilizarse para fines específicos. Es perfecto para los siguientes fines:
Estudios de mercado
Contextualiza rápidamente qué ofrecen los restaurantes y bares de un grupo concreto a qué precio y de qué manera podría cambiar esto a lo largo del tiempo. Puede ser con fines exploratorios, descriptivos o casuales y tener como objetivo determinar una estrategia empresarial, de competencia o simplemente con fines de investigación.
Análisis de la competencia
Obtener una perspectiva precisa de la oferta de menús, precios o cambios y ofertas de los competidores directos, de modo que puedas adaptarte rápidamente y mantenerte un paso por delante de la competencia en todo momento.
Análisis de precios geográfico
Seleccionando una zona o región concreta, puedes utilizar los datos para establecer una investigación sobre las tendencias de precios de los restaurantes y bares de los alrededores. Puedes adaptar tu propio esquema de precios con datos precisos y contextuales.
Digitalización de menús a gran escala
Aparte de la investigación, también puedes utilizar el OCR para digitalizar cartas de menú físicas y utilizarlas en línea. Especialmente si se trata de una plataforma de reparto de comida, procesar y estructurar todos los menús de los restaurantes puede simplificar enormemente el proceso de incorporación de nuevos restaurantes.


¿Qué tecnología hay detrás del OCR de cartas de menú?
Cada paso que se da en el proceso de OCR de las cartas de menú pone en marcha una tecnología. Es esta colaboración entre diferentes tipos de software lo que automatiza el proceso y lo hace eficaz. A continuación te explicamos cómo funciona cada software para obtener el resultado que necesitas:
- Una GUI (Interfaz Gráfica de Usuario) fácil de usar te da acceso a la cámara dentro de la aplicación, permitiéndote tomar y subir una foto o un PDF. Cuando es necesario, los documentos se corrigen automáticamente en cuanto a la perspectiva y se utiliza la detección de desenfoque y reflejos.
- La API (interfaz de programación de aplicaciones) se encarga de todo a partir de aquí. Es el servicio que hace todo el trabajo y se mueve entre el back-end, donde se realiza el trabajo, y el front-end, que se te presenta con la GUI. La API enlaza la información subida a la red neuronal entrenada que determinará qué caracteres y datos hay en la imagen.
- El reconocimiento óptico de caracteres (OCR) se utiliza para determinar qué píxeles de una imagen constituyen texto legible. Cualquier texto que sea legible en la foto se extrae en un sencillo formato digital TXT. De este modo, la foto se transforma en datos digitales.
- El cerebro detrás de este proceso es una red neuronal en forma de inteligencia artificial (IA), que ha sido entrenada no sólo para identificar el texto de una imagen, sino que también es capaz de hacer una suposición razonable sobre cuál es el contexto de un texto específico. Si un menú tiene un diseño específico con varias subsecciones, la IA es capaz de determinar automáticamente qué artículo pertenece a qué sección y qué precio le corresponde. Esta forma de deep learning permite que el OCR de tarjetas de menú vaya mucho más allá de la simple conversión de una imagen en texto.
- Utilizando las capacidades contextualizadoras de la red neuronal, se forma un formato JSON. JSON es una herramienta adecuada para la contextualización de datos y puede agrupar y vincular automáticamente puntos de datos, tanto con registros de bases de datos existentes o simplemente como datos idiosincrásicos. Esto lo hace ideal para todos los fines de la investigación.


Aunque este proceso pueda parecer complicado y tedioso, y de hecho lo es, sólo tarda un par de segundos en completarse. Lo único que ve el usuario es la GUI, a través de la cual se puede cargar una foto y generar la salida JSON en un santiamén. Esto significa que este proceso puede repetirse de forma masiva y ampliará tus capacidades de investigación mucho más que las entradas manuales en hojas de cálculo.
Casos de uso del OCR para cartas de menú
Entonces, ¿a quién beneficia exactamente el OCR para cartas de menú? Aunque las posibilidades de uso de estos datos son casi infinitas, te proponemos tres casos de uso:
Dueños de restaurantes
Las grandes cadenas de restaurantes necesitan estar al tanto de lo que hacen los competidores de la zona. Esto es especialmente cierto cuando se impulsa un formato que pretende ser competitivo y, en consecuencia, hay muchos adversarios en un área local. Tanto si estás desafiando al mercado en términos de precios, originalidad del menú, variedad o cualquier otro formato que implique lo que aparece en la carta del menú, es primordial estar siempre atento a lo que hace la competencia. Te dará una ventaja competitiva sobre el resto.
Lo mejor es planificar una foto mensual de las cartas de menú relevantes de la competencia en los alrededores. Si tomas la foto inmediatamente en la aplicación, puedes subir la imagen al instante y se procesa directamente. Supongamos que deseas procesar mil cartas de menú al mes en una gran zona urbana y necesitas acceder rápidamente a los datos. Cada vez que un empleado sube una foto, se convierte en datos JSON en cuestión de segundos. De este modo, tu base de datos puede mantenerse actualizada en todo momento. Esto significa que, por ejemplo, puedes presumir con seguridad de tener el menú más barato de la zona o del país, porque sabrás que es cierto.


Agencia de estudio del mercado
Si tu objetivo es servir a la industria de los restaurantes con datos precisos, necesitas establecer una forma eficaz de obtener esos datos. Tanto si se trata de un simple análisis SWOT o de la optimización del menú de un restaurante, debes ser capaz de ofrecerle a tus clientes un asesoramiento preciso y rápido basado en una investigación exhaustiva. Por supuesto, tienes trabajadores que deberían ser capaces de recolectar datos manualmente, o has optado por subcontratar este trabajo de back office a países con mano de obra barata. Sin embargo, la recolección de datos es un trabajo más propio de un ordenador, ¿no te parece?
Usar una API para encargarse de este trabajo resulta en un proceso más rentable, más preciso y más rápido. Transformar un menú a datos utilizables y segmentados se hace mediante OCR en cuestión de segundos, mientras que un empleado tardaría más en introducir los datos en hojas de cálculo segmentadas.


Plataformas de reparto de alimentos
Especialmente en tiempos de COVID-19, ha crecido el protagonismo de las plataformas de reparto. Si quieres competir en este mercado a veces saturado, está claro que necesitas una forma fácil de incorporación. Sin embargo, es igual de importante mantener tu plataforma actualizada. Para competir, necesitas ofrecer la entrega de cientos de restaurantes y bares, todos los cuales adaptan sus menús con una regularidad cada vez mayor. Necesitarías una forma rápida de procesar todos los menús de los restaurantes, para que ninguna información en tu plataforma esté obsoleta.
Una forma rápida es hacer que los restaurantes participantes suban una foto de cada nueva carta de menú a nuestra API. Con el OCR para cartas de menú, cada carta se escanea y se lee, extrayendo todos los datos relevantes en un formato JSON. Este formato te permite actualizar rápida y automáticamente cualquier menú de restaurante en tu plataforma de reparto. Es una forma excelente de mantener contentos tanto a los restaurantes participantes como, por supuesto, a tus clientes.


Preguntas Frecuentes
¿Funciona en todas las cartas de menú?
Dado que casi todas las cartas de menú siguen un formato similar, nuestra API de OCR puede distinguir toda la información de una carta de menú y transferirla a un formato JSON. Puedes pensar en la división en aperitivo, plato principal, postre, etc., pero también en platos vegetarianos o veganos y esquemas de precios.
¿Funciona con fotos de baja calidad?
La calidad de la foto puede verse comprometida, sobre todo si tienes que tomar rápidamente una foto de un menú al pasar por delante de un restaurante de la competencia. Afortunadamente, nuestra API incluye funciones de preprocesamiento de imágenes que mejorarán y rotarán las imágenes de mala calidad para un mejor procesamiento. Además, Klippa ofrece un SDK de escaneo que puede ser implementado en aplicaciones móviles. Este SDK incluye capacidades de procesamiento de imágenes como corrección de perspectiva y detección de reflejos y desenfoques para aclarar el contenido de las fotos. De esta forma, sólo recibirás fotos que contengan información válida para su procesamiento posterior.
¿Qué idiomas puede procesar?
La API de Klippa funciona mejor con todos los idiomas occidentales, por lo que los idiomas comunes con los que trabajamos son el Inglés, Holandés, Alemán, Francés, Español, Portugués, Sueco, Noruego, Danés, Finlandés e Italiano. Cualquier otro idioma puede ser añadido a pedido.
Planifica una reunión con Klippa
¿Te gustaría ver a nuestro producto en acción o necesitas más información técnica? Nuestros expertos estarán encantados de guiarte a través de nuestras soluciones en una demostración de 30 minutos. Más abajo encontrarás un horario. No nos molesta personalizar nuestros productos, así que si tienes alguna consulta única, no dudes en ponerte en contacto con nosotros.