Si te dedicas al procesamiento de documentos a gran escala, es probable que te enfrentes a problemas relacionados con la mala calidad de los datos. La mala calidad de los datos puede adoptar muchas formas. En el caso del procesamiento de documentos pueden ser cosas como mala calidad de imagen, formatos de archivo erróneos y documentos girados. Klippa se especializa en el procesamiento inteligente de documentos y es capaz de resolver estos problemas por ti. En este blog explicaremos cómo Klippa puede ayudar a corregir automáticamente las rotaciones de documentos a gran escala. Esto optimiza la eficiencia del procesamiento y reduce los costos del mismo.
Un ejemplo de casos de uso
Supongamos que trabajas en una empresa que procesa documentos financieros a gran escala. Por ejemplo, recibos y facturas con fines de fidelización. Este es un caso de uso común en la automatización de la devolución de dinero, por ejemplo. Tienes un equipo ingresando datos que tiene que comprobar los recibos en una interfaz y extraer ciertos datos o realizar ciertas aprobaciones. La comprobación manual de los documentos ya es una tarea que requiere mucho tiempo para los documentos normales, sin hablar de los documentos de mala calidad. Si se procesan 100.000 documentos al mes, y el 10% de los documentos se rotan, rotar manualmente 10.000 documentos al mes puede ser una tarea que consuma mucho tiempo y sea molesta. El costo anual de rotar 120.000 documentos será fácilmente de 20.000 euros sólo en mano de obra. Por suerte, la automatización puede reducir fácilmente estos costos en un 90%, ahorrando €18.000 euros al año. ¡Un excelente caso de negocio!
A continuación se muestra un ejemplo del tipo de datos que puedes esperar de los clientes:
¿Cómo corregir automáticamente la orientación del documento o imagen?
Como puedes ver, hay una variedad de problemas con estos documentos. En este blog nos centraremos en la rotación automatizada de recibos y facturas, pero esto es válido para cualquier tipo de documento. Si estás interesado en otras soluciones de procesamiento de documentos, como la clasificación automática de documentos, la conversión de imágenes a texto, la conversión a PDF con capacidad de búsqueda, el recorte de imágenes, la detección de la calidad de las imágenes, la división de imágenes o la unión de imágenes. Lee nuestros artículos sobre estos temas.
Así que vamos a centrarnos en la rotación automática de las imágenes incorrectas de arriba a la orientación correcta. Un enfoque simple que mucha gente pensaría primero, es simplemente comprobar la altura y la anchura de los documentos y rotarlos a la orientación vertical, de modo que la altura sea mayor que la anchura. Esto parece sencillo y eficaz, pero lamentablemente es propenso a errores. Los recibos y las facturas tienen muchas formas y tamaños diferentes. A veces son rectángulos, a veces son cuadrados. Este enfoque puede hacer que los documentos que realmente están en la rotación correcta se conviertan en la rotación equivocada. También puede hacer que los documentos se giren a los 180 grados opuestos, es decir, al revés. Afortunadamente hay otra solución, hacerlo basados en el contenido del texto del documento. Para conseguirlo, nuestro software sigue 3 pasos importantes:
1. Primero optimizamos la calidad de la imagen. Podemos hacerlo recortando las imágenes de los recibos, corrigiendo la perspectiva y mejorando el contraste. Esto ya nos proporciona imágenes más legibles, lo que es relevante para el segundo paso. A continuación puedes ver un ejemplo del resultado del primer paso:
2. En el segundo paso convertimos los documentos y las imágenes en texto mediante OCR . Si el documento es un PDF, primero se convierte en imagen y luego en texto. Esto crea un documento que permite realizar búsquedas y revela cuál es la orientación del texto. Por supuesto, nadie lee una frase de arriba a abajo, sino principalmente de izquierda a derecha y, en algunos casos, de derecha a izquierda. En algunos documentos habrá texto en múltiples orientaciones. En estos casos realizaremos un recuento del texto y elegiremos la rotación en la que se encuentra la mayor parte del texto.
3. Ahora que sabemos la orientación del texto podemos casi rotar el documento. El documento debe ser rotado de manera que se pueda leer de izquierda a derecha para la mayoría de los idiomas, pero para algunos idiomas de derecha a izquierda. Este es un factor determinante en la rotación. Luego clasificamos el documento determinando el país de origen y el idioma a través de algorítmos de aprendizaje automático . Una vez hecho esto, la imagen o el documento pueden ser rotados por nuestro software y almacenados en el formato deseado. En muchos casos se trata del formato de archivo original, por lo que en el caso de las imágenes suele ser un JPEG, pero también podemos convertirlo en un formato a elección, por ejemplo PDF. El resultado es algo parecido a esto:
Ahora que tienes imágenes de buena calidad en las orientaciones correctas, puede que ya tengas lo que necesitas. Pero podemos ir incluso uno o dos pasos más adelante: podemos darte los resultados del OCR en un formato TXT, o incluso podemos darte el resultado en un formato estructurado como JSON. A continuación puedes ver un ejemplo simplificado de esos dos pasos adicionales:
¿Qué puede hacer Klippa por ti?
Como puedes ver, es un proceso un poco técnico e implica técnicas de visión inteligente, OCR y conversión de documentos. Afortunadamente no tienes que construir estas herramientas tú mismo, porque Klippa ofrece sus tecnologías a través de APIs, SDKs e interfaces para que puedas implementarlo en tu flujo de trabajo existente en 1 o 2 días. La rotación automática de imágenes, documentos y páginas es sólo la punta del iceberg. Si tiene algún reto relacionado con documentos con el que necesitas ayuda, sólo tienes que ponerte en contacto con nosotros o programar una demostración gratis a continuación. Nos encantaría saber cómo podemos ayudarte a alcanzar tus objetivos.