O passaporte é um documento emitido pelo governo do país aos seus cidadãos e é usado principalmente para viagens. Também serve como prova de nacionalidade, nome, sobrenome, gênero, etc. Atualmente, as empresas aceitam passaportes como documentos de identificação de seus clientes. Na maioria dos casos, eles coletam os detalhes e fazem uma cópia digitalizada do documento. Isso, é claro, parece uma solução satisfatória se você precisar preparar um contrato para um cliente, por exemplo. No entanto, as coisas podem complicar se você tiver centenas de contratos para preparar, mas também se seus clientes possuírem nacionalidades diferentes. Você vai se encontrar sobrecarregado de cópias físicas de passaportes em diferentes idiomas. Sem falar dos problemas jurídicos que você pode enfrentar com cópias de passaporte espalhadas pelo escritório.
Existe uma solução para processar passaportes automaticamente?
Sim, existe! Neste blog, apresentaremos a API de análise Klippa, uma API que pode converter qualquer imagem ou PDF de um passaporte em dados estruturados usando OCR. A API mencionada tem tempo de implementação recorde de algumas horas e pode analisar os dados de um passaporte em apenas alguns segundos!
Como a API de processamento de passaporte funciona?
A análise de passaportes para dados é feita em alguns passos. Primeiro, um usuário tira uma foto de um passaporte ou envia um arquivo PDF para nossa API. A primeira verificação que será feita diz respeito à qualidade do documento. Se isso atender aos nossos critérios e a qualidade for boa o suficiente, as imagens serão transformadas em um arquivo de texto usando OCR. Para documentos PDF, extraímos o texto legível. O arquivo de texto extraído pode ser comparado a um arquivo do bloco de notas em seu computador. Apenas texto, nada mais! Agora podemos verificar o idioma e o país de origem com algoritmos baseados em anos de dados de machine learning. Quando sabemos de onde vem o documento, um modelo de machine learning específico da linguagem encontra os campos de dados relevantes. Depois disso, podemos extrair dados como nome, sobrenome, data de nascimento, gênero, etc. Quando todas as informações importantes forem identificadas, convertemos os documentos em JSON e enviamos uma resposta de volta ao usuário.
Imagens falam mais alto que palavras
Vamos demonstrar um exemplo das etapas que seguimos para processar uma imagem de passaporte em dados. Por sermos uma empresa holandesa, usamos um passaporte holandês como exemplo, mas a API não se limita a passaportes holandeses:


Quais campos são facilmente extraídos pelo Klippa OCR?
Nosso mecanismo de análise é altamente flexível. Isso significa que existem campos prontos para uso que processamos, mas também podemos adicionar campos personalizados ou remover campos em chaves de API específicas. Podemos até personalizar a estrutura de saída ou tornar anônimos certos campos e imagens. Cada cliente Klippa tem sua própria chave de API, então suas personalizações nunca afetarão outros clientes. Na Klippa, cada cliente obtém a solução ideal para sua situação. Abaixo, listamos os campos prontos para uso. A entrada pode ser JPG, PNG e PDF e a saída padrão é o arquivo JSON.
Campos padrão:
- País
- Idioma
- Nome
- Sobrenome
- Iniciais
- Data de nascimento
- Naturalidade
- Gênero
- Data de emissão
- Data de expiração
O Klippa pode ler o MRZ de passaportes com OCR?
A partir da década de 1980, alguns países passaram a emitir passaportes contendo MRZ. MRZ significa zona legível por máquina. Os passaportes que contêm um MRZ são chamados de MRPs, passaportes legíveis por máquina. A estrutura do MRZ é padronizada pelo Documento 9303 da ICAO e pela Comissão Eletrotécnica Internacional como ISO / IEC 7501-1. O MRZ é uma área do documento que pode ser facilmente lida por uma máquina usando OCR (reconhecimento óptico de caracteres). A maioria dos passaportes modernos tem um MRZ, que é uma sequência de caracteres, na frente do documento. Abaixo, demonstramos um exemplo de MRZ. O Klippa pode ler automaticamente o passaporte MRZ com OCR. Na verdade, isso faz parte do processo. Comparamos o MRZ com os dados que encontramos no próprio documento. Isso nos dá a garantia de que as informações que encontramos estão corretas e também pode ajudar a detectar possíveis documentos fraudulentos.


O que torna a análise de passaportes tão relevante?
A era em que vivemos está mais digitalizada do que nunca. Tarefas repetitivas estão lentamente sendo substituídas por computadores e robôs. Em muitos casos, eles podem realizar essas tarefas com mais rapidez, menos erros e de maneira mais econômica. Na Klippa, nos concentramos na construção de software para substituir o trabalho manual repetitivo em processos administrativos de negócios. O processamento e a verificação de passaportes podem consumir muito tempo. Usar o OCR para automatizar o processamento do seu passaporte permitirá que você economize custos, integre clientes com mais rapidez e reduza os erros nos processos administrativos.
Sobre a Klippa
Em 2014, a Klippa começou com um aplicativo de digitalização de recibos, incluindo OCR. Logo decidimos que não deveríamos limitar nossa tecnologia a uma API de OCR para recibos. Hoje em dia temos muitos produtos de OCR que vão desde a análise de faturas e recibos, passando por passaportes, carteiras de identidade e até contratos.
Ficou interessado em aprender mais? Abaixo, você pode encontrar um horário para reservar uma demonstração de 30 minutos com um de nossos especialistas de OCR. Durante a demonstração, podemos guiá-lo através das possibilidades do nosso motor e fornecer uma resposta personalizada a todos os seus pedidos exclusivos. Prefere começar a testar a API OCR sozinho? Entre em contato conosco para solicitar uma chave API!