Saisie automatisée de donnée avec l’OCR et le machine learning

Saisie automatisée de donnée avec l’OCR et le machine learning

Les logiciels de saisie automatisée de données sont de plus en plus recherchés. Vous vous demandez peut-être pourquoi. Eh bien, les entreprises d’aujourd’hui fonctionnent avec des données, et avoir un accès rapide et fiable à ces dernières est un avantage concurrentiel important. Si vous savez mieux que votre concurrent où optimiser et rationaliser les processus, vous êtes dans l’équipe gagnante.

Vous avez manqué le train en marche ? Les données de votre entreprise sont-elles encore cachées dans un fichier PDF ou, pire encore, dans des documents papier ? Consacrez-vous le temps précieux de votre équipe à copier-coller manuellement les données de ces ressources ?

Heureusement, il n’est pas trop tard pour changer ! Les récents développements technologiques en matière d’OCR et de machine learning permettent de se détourner plus facilement de la saisie manuelle des données : en utilisant des solutions logicielles intelligentes qui extraient automatiquement les données des images et des documents.

Dans cet article, nous allons expliquer le concept de la saisie automatisée des données, discuter de ses avantages et élaborer les cas d’utilisation les plus courants. Au final, vous saurez exactement comment automatiser vos processus de saisie de données avec l’OCR et le machine learning.

Manual data entry

Les entreprises saisissent-elles encore les données manuellement ?

Oui. La saisie manuelle des données est une pratique vieille de plusieurs siècles, qui s’est avérée assez persistante.

Dans une étude de 2020 sur l’état de l’automatisation dans l’industrie manufacturière, par exemple, près de la moitié (48 %) des entreprises interrogées ont indiqué qu’elles utilisaient encore des feuilles de calcul ou d’autres documents de saisie manuelle des données.

L’une des raisons pour lesquelles la saisie des données n’est pas complètement automatisée est le comportement habituel. C’est peut-être devenu une habitude de consacrer une journée par semaine à la saisie manuelle des données. D’autres raisons sont un manque de vision des coûts réels du processus et une trop faible connaissance des outils d’automatisation. Après tout, copier manuellement des données est un processus dont la mise en œuvre, l’utilisation et la maintenance demandent peu d’efforts.

Nous y voyons cependant le prix élevé des économies à court terme. Plus votre entreprise doit effectuer de saisie manuelle de données, plus cela vous coûte cher à terme. Selon Goldman Sachs, le coût total du traitement manuel des factures sur papier s’élève même à 2 700 milliards de dollars par an, ce qui représente un lourd fardeau en termes de temps et d’argent.

Avec une solution automatisée, ces coûts peuvent être réduits d’au moins 50 à 70 %, et certaines études estiment même que la réduction des coûts peut atteindre 80 %. Cela semble être une bonne affaire, alors examinons de plus près le concept d’automatisation de la saisie des données !

Save time and money

Qu’est-ce que la saisie automatisée des données ?

La saisie automatisée des données peut être décrite comme l’utilisation d’un logiciel pour éliminer les tâches administratives manuelles répétitives de la charge de travail des employés, ce qui permet aux entreprises de gagner du temps et de l’argent pour améliorer leurs performances et augmenter leurs revenus.

Les logiciels de saisie automatisée de données sont capables de lire des informations à partir d’une source difficile d’accès, comme un fichier PDF ou un document imprimé, et de transmettre les données à un autre système ou à un stockage de données (c’est-à-dire des bases de données, des tableurs, etc.).

Plusieurs techniques peuvent être utilisées dans ce processus. De manière générale, on peut distinguer deux techniques :

  • Techniques basées sur des règles
  • Techniques de machine learning

Techniques basées sur des règles

L’approche traditionnelle basée sur des règles recherche des données à des endroits très spécifiques d’un document, selon une logique et des règles prédéfinies. Ces règles sont codées dans un système sous la forme d’instructions “si-alors-sinon”.

L’idée principale d’un système à base de règles est de capturer les connaissances d’un expert humain dans un domaine spécialisé (par exemple, les comptes fournisseurs) et de les incorporer dans un système informatique. C’est tout. Ni plus ni moins. C’est un peu comme si l’être humain était né avec des connaissances fixes.

Les systèmes basés sur des règles existent depuis de nombreuses années et se sont révélés raisonnablement efficaces pour convertir les données des documents et réduire ainsi la saisie manuelle des données.

Cependant, si les techniques basées sur des règles ont bien fonctionné avec des formulaires hautement structurés, elles ont du mal avec les documents semi-structurés (par exemple, les factures et les reçus) et non structurés (par exemple, le corps d’un e-mail). Ces types de documents sont moins prévisibles et ne sont donc pas bien adaptés à l’approche basée sur les règles.

Techniques de machine learning

Contrairement à l’approche fondée sur des règles, les systèmes de machine learning ont une intelligence adaptative. Ils interprètent et identifient des modèles à partir d’énormes quantités de données, qui peuvent ensuite être utilisées pour apprendre et s’améliorer grâce à l’expérience. Cela permet aux applications logicielles de devenir plus précises dans la prédiction des résultats au fil du temps sans être explicitement programmées pour cela.

Un exemple simple serait les suggestions de mots que vous recevez sur votre téléphone pendant que vous tapez. Ces suggestions de mots sont faites sur la base des entrées passées et prédisent ce que vous pourriez vouloir dire à ce moment-là.

Si une technique de machine learning est utilisée pour un programme de saisie de données, une approche similaire est utilisée pour trouver les données à saisir. Sur la base des données saisies dans le passé, les bons points de données sont trouvés, extraits et saisis automatiquement dans le système souhaité.

En tant que telles, les techniques de machine learning peuvent prendre en charge des documents moins structurés, apprendre les modèles qu’ils contiennent et créer des méthodes pour transformer ces documents en données structurées.

Le meilleur des deux mondes

Bien sûr, la technologie n’est pas toujours parfaite, même le machine learning ne l’est pas. Bien qu’il évolue très rapidement, vous n’atteindrez généralement pas une précision de 100 %. Heureusement, il existe aussi des solutions à ce problème. En associant les logiciels au pouvoir des humains, vous pouvez combiner le meilleur des deux mondes, ce que l’on appelle l’automatisation par l’homme dans la boucle (Human In The Loop).

Avec une solution HITL, vous pouvez automatiser la plus grande partie d’une procédure, suivie d’une révision humaine pour terminer la tâche. Pendant ce temps, le logiciel apprend de tout changement apporté par l’homme et s’améliore au fil du temps.

Ainsi, alors que vous pouvez commencer à 90 % d’automatisation, ce qui est déjà très bien, le traitement HITL vous permettra de vous rapprocher le plus possible de 100 % d’automatisation. Vous trouverez ci-dessous un exemple d’un tel flux de travail :

Human in the loop workflow

Quels sont les avantages de l’automatisation de la saisie des données ?

Grâce au développement de logiciels de saisie automatisée de données qui utilisent l’OCR et le machine learning, il existe très peu de justifications pour préférer la saisie manuelle des données à l’automatisation. Les outils automatisés vous rendent plus efficace et vous donnent plus de temps pour vous concentrer sur des tâches plus importantes et sur l’orientation stratégique.

Pour vous donner une bonne compréhension des avantages de l’automatisation de la saisie des données, nous allons énumérer les plus importants ci-dessous :

  • Gain de temps (et donc d’argent)
  • Réduction des erreurs
  • Amélioration du bonheur des employés
  • Diminution de la paperasse

Gain de temps (et donc d’argent)

Le principal argument de vente d’un système de saisie automatisée des données est la réduction des heures de travail des employés. Le temps, c’est de l’argent, cela se traduit par d’importantes économies.

Il n’y a pas de formule magique pour cela, mais des études ont montré que l’automatisation intelligente permet généralement de réaliser des économies de 40 à 75 %, avec un délai de récupération allant de plusieurs mois à plusieurs années.

À titre d’exemple, considérons le temps nécessaire au traitement manuel d’une seule facture. En moyenne, un comptable expérimenté traite 50 factures par heure (soit 1,2 minute par facture). Avec un salaire horaire moyen de 35 €, cela signifie que le traitement d’une seule facture coûte environ 0,70 €.

Ce même comptable utilisant un logiciel d’OCR est capable de traiter au moins 200 factures par heure (≈ 18 secondes par facture). Cela conduit à un coût de traitement d’environ 0,18 € par facture. Ajoutez le prix du logiciel de 0,05 € par facture (c’est-à-dire le tarif de la technologie OCR de Klippa) et vous obtenez un coût total de 0,23 € par facture. Il s’agit d’une amélioration directe de plus de 60 % !

Curieux de connaître notre technologie OCR ? Essayez-la dans notre outil gratuit ci-dessous :

Réduction des erreurs

Tout le monde fait des erreurs. Les taux d’erreur dans la saisie manuelle des données varient généralement entre 0,55 % et 3,6 %, avec des valeurs aberrantes pouvant atteindre 26,9 %.

Heureusement, la saisie automatisée des données à l’aide du machine learning peut réduire considérablement ces taux d’erreur en éliminant le risque de distraction, les erreurs de frappe et autres erreurs couramment rencontrées lors de la saisie manuelle des données. Cela se traduit par des données de meilleure qualité et plus précises qui peuvent être utilisées pour prendre des décisions commerciales bien informées.

Amélioration du bonheur des employés

La saisie manuelle des données peut être un processus très chronophage et ennuyeux pour les employés. Le travail excessif de saisie de données peut également entraîner des problèmes physiques et psychologiques, tels que la fatigue oculaire, le syndrome du canal carpien, la ténosynovite et le stress émotionnel.

En revanche, il a été constaté que l’automatisation améliore la satisfaction et l’engagement des employés, leur permet de se concentrer sur des tâches plus significatives et plus utiles et leur donne une gratification instantanée de leur travail quotidien. Cela semble être une bonne affaire, non ?

Diminution de la paperasse

La gestion manuelle des données peut exiger beaucoup de ressources, car elle nécessite beaucoup de choses : des classeurs, des imprimantes, de l’encre, de l’espace de bureau, etc. Avec le bon logiciel de saisie de données, vous pouvez libérer ces ressources et les utiliser pour ce qui compte vraiment.

Tout en étant plus responsable vous préparez votre entreprise à un avenir durable.


Cas d’utilisation pour la saisie automatisée de données avec OCR et machine learning

Par défaut, toute tâche répétitive à fort volume qui inclut la saisie de données peut être automatisée. Nous allons mettre en évidence quelques cas d’utilisation ci-dessous pour vous inspirer à commencer à rechercher des procédures similaires au sein de votre propre organisation :

  • Traitement des factures et comptes fournisseurs
  • Traitement des commandes d’achat/de vente
  • RH et recrutement
  • Campagnes de fidélisation
  • Automatisation de la connaissance du client (KYC)

Traitement des factures et comptes fournisseurs

Le traitement des factures est l’exemple type d’un processus qui a besoin d’être automatisé. Sa nature répétitive, notamment pour les factures récurrentes, et ses volumes importants entraînent de nombreuses heures d’un travail ennuyeux pour les employés.

L’automatisation des comptes fournisseurs peut vous donner un coup de pouce à cet égard. Certaines solutions, par exemple, lisent les factures avec l’OCR et l’IA et extraient elles-mêmes les informations, ce qui signifie qu’il n’y a plus de saisie de données du tout.

Ces solutions traitent les factures lorsqu’elles arrivent. Toutes les données de la facture sont automatiquement analysées et placées dans les champs respectifs du logiciel de comptabilité ou d’ERP. Il est même possible de laisser le logiciel prendre des décisions en douceur pour des éléments tels que les factures de nourriture ou de voyage. Cela minimise l’intervention des employés et rend le processus moins sujet aux erreurs.

Traitement des commandes d’achat/de vente

Un autre domaine du département financier qui peut être automatisé est le traitement des commandes d’achat ou de vente. Alors que les représentants commerciaux passent beaucoup de temps à rechercher toutes les données des clients et à les saisir dans le système CRM et ERP, le département financier doit reproduire toutes les données et les saisir dans le système comptable.

Bien sûr, ce processus n’est jamais sans faille et peut entraîner des doublons, qui nuisent à la productivité. Mais si vous utilisez plutôt un système automatisé avec OCR et machine learning, vous pouvez réaliser des activités de vente de bout en bout en automatisant des tâches telles que la saisie des commandes de vente et la facturation. Vous disposerez ainsi d’une base de données propre et améliorerez l’expérience client.

Purchase order OCR by Klippa

RH et recrutement

Demandez à vos collègues des RH quelle est la tâche la plus répétitive et la plus longue qu’ils accomplissent. Ils vous répondront très probablement qu’il s’agit du traitement des salaires et des fiches de paie. Chaque mois, ils doivent s’assurer que tout le monde est payé correctement et à temps. Cela implique également de remplir des rapports et de payer les taxes sur l’emploi aux autorités fiscales.

Cependant, avec la bonne solution automatisée, ils pourront accomplir ces tâches en un clin d’œil. Ils seront assurés de disposer de données cohérentes sur les employés dans tous les différents systèmes d’entreprise, et ils pourront valider les feuilles de temps et charger ou facilement mettre à jour les gains et les déductions.

De même, pour les documents moins structurés, comme les CV, une solution logicielle peut être d’une grande utilité. Si elle inclut l’OCR et le machine learning, vous pouvez filtrer et classer les CV entrants en fonction d’un ensemble de règles et de mots-clés. Identifiez les applications les plus intéressantes en un coup d’œil, débarrassez-vous des applications indésirables ou effectuez toute autre tâche.

Et ce n’est pas tout. Même le processus d’embarquement peut aller beaucoup plus vite. Avec l’aide de l’OCR et de l’apprentissage automatique, vous pouvez extraire toutes les données des formulaires et des documents d’identité que les nouveaux employés envoient, et les placer directement dans votre système RH.

Campagnes de fidélisation

Les programmes de fidélisation se présentent sous de nombreuses formes, mais ils ont tous un point commun : ils impliquent beaucoup de travail de back-office. Le plus souvent, il s’agit de vérifier et de valider un reçu, de saisir les données dans un système et de libérer la récompense. Dans le cas d’un processus manuel à l’ancienne, cela peut prendre des jours, voire des semaines, avant d’être effectué.

Avec le Klippa OCR SDK, en revanche, vous pouvez simplement utiliser votre téléphone portable pour prendre une photo du reçu et laisser le logiciel faire le travail. Les données du reçu sont extraites, interprétées et traitées en quelques secondes !

Non seulement les paiements seront plus rapides et les clients plus satisfaits, mais vous serez également plus à même de faire face aux pics de trafic, de commettre moins d’erreurs et de connaître moins d’incidents de fraude, comme l’acceptation de reçus dupliqués ou photoshopés.

Si vous souhaitez en savoir plus sur l’automatisation des campagnes de fidélisation, nous vous recommandons vivement l’un de nos autres articles entièrement consacré à ce sujet.

Automatisation de la connaissance du client (KYC)

De nombreuses entreprises, notamment dans le secteur de la location, des télécoms, de la banque et de l’assurance, ont l’obligation de vérifier l’identité de leurs clients. Elles doivent le faire pour se conformer aux réglementations KYC.

Un exemple old-school de ce processus consiste à se rendre dans une banque, à présenter sa carte d’identité et à signer quelques formulaires. Par la suite, un employé de la banque vérifiera ces données et les saisira dans ses systèmes. Comme vous pouvez l’imaginer, il s’agit d’un processus très coûteux et difficile à mettre en œuvre. L’externalisation vers des pays à bas salaires pourrait être une option, mais des questions se posent alors sur les réglementations en matière de protection de la vie privée et le risque de fuites de données.

L’automatisation des contrôles KYC est bien sûr le meilleur choix. Plutôt que de saisir les données manuellement, vous pouvez scanner la pièce d’identité ou le passeport d’un client en prenant une photo avec votre smartphone, combiner cela avec un selfie et une signature et le logiciel fera le reste. L’authenticité des scans est automatiquement déterminée et tous les points de données requis sont extraits.

Pour en savoir plus sur le contrôle KYC basé sur des documents avec l’OCR et l’IA, consultez l’un de nos autres articles.

Ce ne sont là que quelques-unes des nombreuses applications pratiques des logiciels d’automatisation de la saisie des données. Nous espérons que cela vous a donné envie d’explorer comment une telle solution pourrait fonctionner pour votre entreprise. Dans la dernière section de cet article, nous verrons comment vous pouvez automatiser vos tâches de saisie de données avec Klippa.


Comment automatiser votre saisie de données avec Klippa

L’OCR et le machine learning sont à la base de notre logiciel d’automatisation de la saisie de données. Avec l’OCR, nous pouvons identifier le texte dans les documents et les images. Dès que nous avons le texte, nous pouvons commencer à en tirer une compréhension.

En utilisant le machine learning, nous pouvons identifier les points de données intéressants dans le texte et imiter le comportement humain en apprenant des exemples précédents.

Reconnaissance de texte OCR

Voyons un exemple de ce que notre technologie est capable de faire :

Simplify credit card payments

Grâce à l’OCR, les pixels contenant du texte sont identifiés et extraits en texte numérique. La copie manuelle des données est remplacée directement par l’OCR. Avec une précision de plus de 95 %, tout le texte est extrait, alors que la copie manuelle des données aurait une précision nettement inférieure et prendrait beaucoup plus de temps.

Extraction de données et sortie structurée

Ensuite, notre modèle de machine learning entre en jeu :

Comme nous l’avons souligné, le machine learning gagne en efficacité lorsqu’il est alimenté par des exemples de plus en plus nombreux. Une IA est entraînée avec de nombreux exemples de documents et des ensembles de données spécifiques afin qu’elle puisse automatiquement localiser et identifier un texte spécifique à un endroit précis du document. Au fil du temps, notre modèle de machine learning ne peut donc que s’améliorer.

Dans l’exemple ci-dessus, toutes les données sont automatiquement contextualisées et converties en un format JSON structuré.

Saisie automatisée des données

Enfin et surtout, il faut que ces données soient saisies dans les bons champs de votre système. Vous pouvez voir ci-dessous un exemple de l’une de nos interfaces de saisie de données que votre équipe peut utiliser pour traiter l’abandon dans une configuration “human-in-the-loop”. Dans ce cas, toutes les données pertinentes de la facture sont lues, extraites et déjà saisies dans les champs correspondants. Elles sont prêtes pour une dernière vérification humaine.

Cette interface peut déjà à elle seule améliorer considérablement vos procédures actuelles de saisie de données, car elle intègre la prévention des erreurs et des suggestions automatisées :

Comme nous disposons de nombreuses intégrations avec les principaux systèmes ERP et de comptabilité, et que nous pouvons nous relier à n’importe quel système grâce à des fonctionnalités d’importation et d’exportation intelligentes, vous pouvez facilement transmettre les données à d’autres systèmes que vous pouvez utiliser.

Il est également possible d’intégrer nos technologies dans vos flux de travail existants. De nombreuses entreprises utilisent déjà des fournisseurs de RPA comme AutomationAnywhere, BluePrism, UiPath, Mendix ou d’autres pour automatiser certains flux de travail. Du point de vue des flux de travail, ces solutions sont toutes bonnes. Mais ce que vous constaterez souvent si vous examinez leurs capacités d’OCR et d’apprentissage automatique, c’est que leurs solutions intégrées ne sont pas suffisamment adaptables pour atteindre un haut degré d’automatisation pour votre cas d’utilisation de niche.

C’est pourquoi Klippa propose ses technologies sous forme de plugins pour tous les principaux fournisseurs de RPA, comme Automation Anywhere, UiPath ou Mendix. Il suffit d’activer notre plugin et de l’intégrer dans vos flux de travail. Nos solutions peuvent être utilisées pour la classification, la saisie et la vérification des données dans de nombreux cas d’utilisation différents. Quelques exemples sont le traitement automatisé des reçus, la numérisation automatisée des cartes bancaires et les vérifications KYC basées sur des documents.


Prenez contact avec Klippa

Nous espérons avoir suscité votre intérêt avec cet article, mais vous avez peut-être encore des questions. Klippa est-il la bonne solution pour votre entreprise ? Pouvons-nous vous aider avec votre cas d’utilisation unique ? Est-il difficile de mettre en œuvre et de commencer à utiliser notre logiciel ?

Nos spécialistes produits expérimentés se feront un plaisir de répondre à toutes vos questions. Ils peuvent tout vous dire sur ce que notre solution peut faire pour votre entreprise.

Contactez-nous directement ou planifiez une démonstration gratuite de 30 minutes ci-dessous, au cours de laquelle nous vous montrerons le fonctionnement de notre logiciel et les avantages qu’il présente pour votre organisation.

Planifiez une démonstration en ligne

Découvrez nos produits en 30 minutes.

Works with AZEXO page builder