API como servicio de análisis de pasaportes con OCR

API como servicio de análisis de pasaportes con OCR

El pasaporte es un documento que el gobierno emite a sus ciudadanos, por lo que todo el mundo está en posesión de uno. Se utiliza principalmente para viajar, pero al ser un documento de identidad también sirve como certificación de nacionalidad, nombre, apellido, etc. Se podría discutir, entonces, que tiene la misma función que el conocido DNI. Y así es. Las empresas llevan mucho tiempo aceptando pasaportes como documentos de identificación de sus clientes. En la mayoría de los casos, la empresa anota los detalles y se queda una copia escaneada. Esto parece una solución convincente si se tiene que preparar un contrato para un cliente. Sin embargo, si son cientos de contratos o los clientes difieren en nacionalidad, este proceso puede convertirse en una tarea muy complicada. Rápidamente te encontrarás inmerso en copias físicas de pasaportes en diferentes idiomas que, tal vez, no seas capaz de comprender.

¿Existe una solución para procesar automáticamente los pasaportes?

Sí, y es en este artículo donde te presentamos la API de análisis de pasaportes de Klippa, una API que puede convertir cualquier imagen o PDF de un pasaporte en datos estructurados mediante OCR. Esta API tiene un tiempo de implementación récord de unas pocas horas y analiza los datos de un pasaporte en tan sólo unos segundos.

¿Cómo funciona nuestra API de procesamiento de pasaportes?

El análisis de los datos de los pasaportes se realiza en unos pocos pasos. En primer lugar, el usuario hace una foto del pasaporte o envía un archivo PDF a nuestra API. La primera comprobación que se realiza es acerca de la calidad del documento, por lo que si se reúnen los criterios, las imágenes se transforman en un archivo de texto mediante OCR (para los documentos PDF se extrae el texto legible directamente). Lo siguiente que se comprueba es el idioma y el país de origen con algoritmos basados en años de aprendizaje automático. Cuando sabemos de dónde proviene el documento, los campos de datos relevantes se identifican, para posteriormente extraer dichos datos. Finalmente convertimos los documentos en formato JSON y los enviamos al usuario.

Las imágenes hablan por sí solas

Describir un proceso técnico puede ser confuso. Por suerte, podemos mostrarte un ejemplo de los pasos que seguimos para procesar un pasaporte y convertirlo en datos. Klippa es una empresa holandesa, por lo que en el ejemplo hemos utilizado un pasaporte de este país, pero nuestra API no está limitada a pasaportes holandeses.

¿Cuáles son los campos que se extraen fácilmente con el OCR de Klippa?

Nuestro motor de análisis es altamente flexible. Esto significa que hay campos pretederminados, pero también podemos añadir o eliminar campos a petición del cliente. Incluso podemos personalizar la estructura de salida o hacer anónimos ciertos campos e imágenes. En Klippa cada cliente obtiene la solución ideal adaptada a su situación, y esto es posible porque cada cliente de Klippa tiene su propia clave de API, por lo que sus personalizaciones nunca afectarán a otros clientes. Más abajo hemos enumerado los campos “predeterminados”. La entrada puede ser JPG, PNG y PDF y la salida por defecto es el archivo JSON.

Campos por defecto:

  • País
  • Idioma
  • Nombre
  • Segundo Nombre
  • Apellidos
  • Iniciales
  • Fecha de nacimiento
  • Lugar de nacimiento
  • Género
  • Fecha de emisión
  • Fecha de caducidad

¿Qué hay de la lectura del MRZ con OCR?

A partir de los años ochenta, los países comenzaron a expedir pasaportes que contenían MRZ. MRZ se refiere a la zona de lectura mecánica y aquellos pasaportes que contienen MRZ se denominan MRP (por sus siglas en inglés, machine-readable passports). La estructura de MRZ está estandarizada por el Documento 9303 de la OACI y la Comisión Electrotécnica Internacional como ISO/IEC 7501-1. El MRZ es una parte del documento que puede ser leída fácilmente por una máquina mediante OCR. La mayoría de los pasaportes modernos tienen una MRZ, una cadena de caracteres en la parte principal del documento.

Más abajo hemos añadido un ejemplo de MRZ. No es importante que entiendas cómo funciona, pero si lo miras detenidamente te darás cuenta de que contiene la mayor parte de la información relevante del documento, combinada con caracteres adicionales y una suma de comprobación. Klippa puede leer automáticamente el pasaporte MRZ con OCR: comparamos la MRZ con los datos que encontramos en el propio documento, para asegurarnos de que la información encontradas es la correcta, aunque también sirve para detectar posibles documentos fraudulentos.

¿Por qué el análisis de pasaportes es tan importante?

La era en la que nos encontramos está más digitalizada que nunca. Las tareas repetitivas están siendo reemplazadas lentamente por ordenadores y robots, ya que en la mayoría de los casos pueden realizar estas tareas más rápidamente, con una menor cantidad de errores y de una manera más rentable. En Klippa nos centramos en la creación de software para reemplazar el trabajo manual repetitivo de los procesos administrativos. La tramitación y el control de los pasaportes pueden llevar mucho tiempo, pero gracias al uso de OCR, puedes ahorrar costes, agilizar el trabajo de los trabajadores y clientes, y reducir errores.

Sobre Klippa

En 2014, Klippa comenzó con una aplicación de escaneo de recibos que incluía OCR. En poco tiempo nos dimos cuenta de que no debíamos limitar nuestra tecnología a los recibos, y es por eso que hoy en día tenemos una gran cantidad de productos de OCR, desde recibos y facturas hasta pasaportes, tarjetas de identificación e incluso contratos.

¿Estás interesado en saber más? A continuación encontrarás un calendario en el que podrás programar una demostración de 30 minutos con uno de nuestros expertos. Durante la demostración, te guiaremos a través de las posibilidades de nuestro motor y te daremos una respuesta personalizada a tus necesidades. ¿Prefieres empezar a probar la API de OCR para pasaportes por ti mismo? Contáctanos para solicitar una clave de API llamando al +31 50 2111631.

Solicite una demostración online
Obtenga más información sobre Klippa en una demostración gratuita de 30 minutos por parte de un técnico de desarrollo del producto

Image Map WordPress builder