Se você trabalha com o processamento de documentos em grande escala, provavelmente enfrenta problemas relacionados à má qualidade dos dados, que pode ocorrer de várias formas. No caso do processamento de documentos, pode ser um problema como a má qualidade de imagem, formatos de arquivo incorretos e documentos girados. A Klippa é especializada no processamento inteligente de documentos e é capaz de resolver esses problemas para você. Neste blog, vamos explicar como o Klippa pode ajudar a corrigir automaticamente as rotações de documentos em grande escala. Isso otimiza a eficiência do processamento e reduz os custos de processamento.
Um exemplo de caso de uso
Vamos supor que você trabalhe para uma empresa que processa documentos financeiros em grande escala. Por exemplo, recibos e faturas para fins de fidelidade. Este é um caso de uso comum em automação de cashback. Você tem uma equipe de entrada de dados que deve verificar os recebimentos em uma interface e extrair certos dados ou realizar certas aprovações. Verificar documentos manualmente já é uma tarefa demorada para documentos normais, imagine para documentos de má qualidade. Se você precisa processar 100.000 documentos por mês e 10% dos documentos estão girados, girar manualmente 10.000 documentos por mês pode ser uma tarefa demorada e chata. O custo anual de rotação de 120.000 documentos será em torno de € 20.000 apenas com mão de obra. Felizmente, a automação pode facilmente reduzir esses custos em 90%, economizando € 18.000 por ano. Um ótimo caso de negócios!
Abaixo está um exemplo de como um documento girado se parece:
Como corrigir automaticamente o documento e a orientação da imagem?
Como você pode ver, existem muitos tipos diferentes de problemas com esses documentos. Neste blog, vamos nos concentrar na rotação automatizada de recibos e faturas, mas isso vale para qualquer tipo de documento. Se você estiver interessado em outras soluções de processamento de documentos, como ordenação automática de documentos, classificação de documentos, imagem em texto, conversão de PDF pesquisável, corte de imagem, detecção de qualidade de imagem, divisão de imagem ou junção de imagem, dê uma olhada em nossos artigos relevantes sobre esses tópicos.
Portanto, vamos nos concentrar em girar as imagens incorretas acima para a orientação correta. Uma abordagem simples que muitas pessoas pensariam primeiro é verificar a altura e a largura dos documentos e girá-los na orientação vertical, de modo que a altura seja maior do que a largura. Isso parece simples e eficaz, mas, infelizmente, está sujeito a erros. Os recibos e faturas existem em muitos formatos e tamanhos diferentes. Às vezes retângulos, às vezes quadrados. Essa abordagem pode fazer com que documentos que realmente estão na rotação correta sejam transformados na rotação errada. Também pode fazer com que você gire os documentos em 180 graus opostos, de cabeça para baixo. Felizmente, existe outra solução, fazê-lo com base no conteúdo do texto de um documento. Para chegar lá, nosso software leva três etapas importantes:
Primeiro, otimizamos a qualidade da imagem. Podemos fazer isso cortando as imagens dos recibos, corrigindo a perspectiva e melhorando o contraste. Isso já nos dá imagens mais legíveis, o que é relevante para a segunda etapa. Você pode ver um exemplo de resultado da primeira etapa abaixo:
Na segunda etapa, convertemos os documentos e imagens em texto usando OCR. Se o documento for um PDF, primeiro será convertido em imagem e, em seguida, em texto. Isso cria um documento pesquisável e revela a orientação do texto. Claro que ninguém lê uma frase de cima para baixo, mas principalmente da esquerda para a direita e, em alguns casos, da direita para a esquerda. Em alguns documentos, você terá texto em várias orientações. Nesses casos, faremos uma contagem de texto e escolheremos a rotação em que a maior parte do texto está.
Agora que sabemos a orientação do texto, podemos quase girar o documento. O documento deve ser girado para que você possa ler da esquerda para a direita na maioria dos idiomas, mas para alguns idiomas da direita para a esquerda. Este é um fator determinante na rotação. Agora, primeiro usamos um classificador de machine learning para determinar o país de origem e o idioma do documento. Feito isso, a imagem ou documento pode ser girado por nosso software e armazenado no formato desejado. Em muitos casos, este é o formato de arquivo original, portanto, para imagens que normalmente seriam JPEG, também podemos convertê-lo em um formato de sua escolha, por exemplo, PDF. O resultado é mais ou menos assim:
Agora que você tem imagens de boa qualidade nas orientações corretas, talvez já tenha o que precisa. Mas podemos até dar um ou dois passos adiante: podemos realmente fornecer os resultados de OCR em um formato TXT, mas podemos até mesmo fornecer o resultado em um formato estruturado como JSON. Abaixo você pode ver um exemplo simplificado dessas duas etapas adicionais:
O que Klippa pode fazer por você
Como você pode ver, é um processo técnico e envolve visão computacional, OCR e técnicas de conversão de documentos. Felizmente, você não precisa construir essas ferramentas sozinho, porque Klippa oferece suas tecnologias por meio de APIs, SDKs e interfaces para que você possa implementá-las em seu fluxo de trabalho existente. A rotação automática de imagens, documentos e páginas é apenas a ponta do iceberg. Se você tiver qualquer desafio relacionado a documentos para o qual precise de ajuda, entre em contato conosco. Ficaremos felizes em ajudá-lo a alcançar seus objetivos.