En muchas organizaciones, tanto corporativas como gubernamentales, los documentos entrantes solían procesarse en las salas de correo. Estos documentos podían ser desde declaraciones de impuestos y multas hasta cartas de atención al cliente y facturas. Cada uno de ellos tenía que ser dirigido al departamento adecuado. Eventualmente, se procesaban manualmente y acababan en un gran archivo.
Desde que la mayoría de estas organizaciones han digitalizado sus sistemas en la última década, la cantidad de documentos impresos recibidos es cada vez menor. Muchas organizaciones ya han pasado a utilizar salas de correo digital, sistemas de gestión de casos y archivos, y reciben la mayoría de los documentos por correo electrónico. Algunas trabajan con grandes escáneres, digitalizando la parte restante del proceso.
Sin embargo, recibir y convertir los documentos a un formato digital es sólo el primer paso para reducir errores y mejorar la eficiencia operativa. Clasificar el contenido de los documentos, ordenarlos, dirigirlos al departamento adecuado y asegurarse de que estén disponibles en texto para búsquedas son pasos valiosos que pueden automatizarse e implementarse en la configuración del procesamiento de documentos.
En este blog, explicaremos cómo puedes hacer todo esto con nuestra solución de clasificación de documentos.


El secreto son los algoritmos
Klippa ha creado algoritmos de Machine Learning que se entrenan con un conjunto de más de 1 millón de documentos. Los algoritmos extraen muchas características de los documentos, como formatos, tamaños y diseños de los archivos.
El software extrae el contenido de los documentos mediante el Reconocimiento Óptico de Caracteres (OCR) y realiza un análisis de texto y estadísticas utilizando NLP para determinar grupos temáticos. Identifica patrones dentro de conjuntos de tipos de documentos que le permiten emparejar documentos desconocidos a uno de estos conjuntos.
Para cualquier documento desconocido que haya que clasificar, se extraen las características y se introducen en los algoritmos. Un algoritmo es básicamente una fórmula matemática, por lo que el resultado será una cifra determinada. A esto lo llamamos resultado de similitud. Este valor se compara con todas las categorías de documentos del conjunto de datos con el que se ha entrenado el modelo. La mejor concordancia entre el valor del documento y el valor de la categoría es el candidato más probable para la clasificación.
El siguiente gráfico muestra un ejemplo simplificado del flujo de clasificación de un documento:


Es posible alcanzar más del 99% de precisión con la clasificación automatizada de documentos, y una sola acción de clasificación tarda alrededor de una décima de segundo. La clasificación manual es mucho más lenta, las personas tardan al menos unos segundos en clasificar los documentos. Además de carecer de velocidad, las personas no suelen tener una precisión superior al 95%, dependiendo de la complejidad de la tarea de clasificación.
Así que si hablamos de grandes volúmenes, digamos clasificar 100.000 documentos al mes, la clasificación manual llevará 20 veces más tiempo y dará lugar a un 5% más de errores. Esto le costaría a una gran organización miles de euros al mes, mientras que un algoritmo sólo le costaría una fracción de esa cantidad.
La clasificación funciona para casi cualquier tipo de documento
Cualquier rasgo (característica) que una persona pueda identificar puede ser clasificado por nuestro software, y un poco más. El requisito previo más importante es que haya suficientes datos para entrenar a un modelo con el fin de que comprenda las diferencias entre determinados rasgos.
En ese sentido, los algoritmos de Machine Learning no son tan diferentes de los humanos. Aprenden las diferencias entre, por ejemplo, una factura y un recordatorio de pago a través de una cosa: la experiencia.
Esto es lo que el software de Klippa puede hacer por ti:
- Clasificación por tipo de archivo
- Clasificación por tipo de documento
- Clasificación del idioma del documento
- Clasificación por país de origen
- Clasificación de comerciantes
- Clasificación de partidas
- Clasificación de riesgo o urgencia
- Clasificación de privacidad – datos sensibles
Clasificación por tipo de archivo
Si no sabes qué archivos tienes en tu sala de correo o en tus registros, el primer paso es identificar rápidamente cada uno de los archivos almacenados. Puedes pensar en tipos de archivos como PDF, documentos de Word, hojas de Excel, correos electrónicos, imágenes, escaneados o de cualquier otro tipo.


Clasificación por tipo de documento
Los tipos de documentos también se pueden clasificar y ordenar. Por ejemplo, puedes clasificar facturas, recibos, contratos, cartas de atención al cliente, cartas de porte, órdenes de compra, albaranes, extractos bancarios, documentos de identidad, nóminas y muchos más. Klippa puede clasificar más de 30 tipos diferentes de documentos.
Clasificación del idioma del documento
También se puede clasificar y ordenar el idioma del documento. Cada documento puede clasificarse con una etiqueta que indique “Inglés”, “Holandés”, “Español” o cualquier otro idioma. Esto puede ser muy útil si tienes documentos en varios idiomas y estás buscando uno específico.
Clasificación por país de origen
Algunos documentos, como las etiquetas de envío o los pasaportes, contienen información sobre el país de origen. Esta información puede utilizarse para clasificar los documentos. Piensa en etiquetas de países como “Países Bajos”, “Reino Unido” o de regiones como “Europa”.
Clasificación de comerciantes
Los comerciantes son importantes a la hora de procesar recibos y facturas. Pueden darte información sobre el tipo de establecimiento en el que se realizó la compra. Las etiquetas de categoría pueden utilizarse para clasificar el tipo de tienda (por ejemplo, ferretería, supermercado, tienda de electrónicos o farmacia).
Clasificación de partidas
También es posible clasificar las partidas ( ej. compras de productos). Con un algoritmo inteligente que aprendió analizando 500.000 recibos y facturas, Klippa puede clasificar productos en más de 20 categorías, como ‘Alimentos y bebidas’, ‘Electrónicos’, ‘Bebidas alcohólicas’, ‘Transporte’ y más. Esto puede utilizarse para determinar la elegibilidad para la declaración de impuestos, la distribución de puntos de fidelidad, el análisis de clientes y otras cosas.


Clasificación de riesgo o urgencia
Las clasificaciones de riesgo o urgencia pueden ser importantes a la hora de establecer prioridades en solicitudes de asistencia al cliente de gran volumen. Las cartas de reclamación o los correos electrónicos de clientes enfadados o que planean iniciar acciones legales pueden clasificarse como “alta prioridad”, mientras que una pregunta de asistencia con respecto a una funcionalidad como “baja prioridad”.
Clasificación de privacidad – datos sensibles
En algunas industrias, es importante identificar y clasificar los documentos que contienen datos sensibles debido al GDPR u otras regulaciones relacionadas con la privacidad. Puedes pensar en documentos como pasaportes, documentos de identidad, licencias de conducir, tarjetas de crédito, contratos, etc. La API de OCR de Klippa puede detectar y clasificar automáticamente estos documentos. Incluso es posible anonimizarlos automáticamente eliminando o tachando líneas específicas de un documento.


Beneficios de la clasificación de documentos
Los beneficios de la clasificación de documentos basada en OCR e IA que se apliquen a tu caso dependerán de tu situación. En general, todos los beneficios se reducen a dos cosas:
- Mayor eficiencia operativa → Aumento de la velocidad de procesamiento y reducción del costo de procesamiento.
- Mejora del cumplimiento → Reducción de errores y búsqueda de indicadores de riesgos en colecciones de datos de gran tamaño.
Si sustituyes la clasificación manual de documentos por una solución de gestión de documentos basada en la clasificación, puedes reducir fácilmente tus costos operativos en un 70%.


Los siguientes pasos
Si tu organización tiene algún reto relacionado con el procesamiento eficiente de documentos, Klippa está aquí para ayudarte. Estaremos encantados de asesorarte sobre las mejores prácticas, demostrarte las capacidades de nuestro software o simplemente para conocernos. A continuación puedes encontrar un calendario de demostraciones online que podría ser el siguiente paso en tu transformación digital.
También puedes leer más sobre cómo organizar, clasificar y anonimizar archivos en otro de nuestros blogs.