Une collecte précise des données à partir d’un grand nombre de reçus de supermarchés exige du temps et de la précision. Sans compter la volonté des acheteurs de les envoyer. Une fois les données recueillies, vous avez besoin d’une armée de collègues pour transformer les reçus en données utilisables.

Vous envisagez peut-être de recourir à l’externalisation du back-office ou au crowdsourcing, comme le fait Amazon Mechanical Turk, pour mener à bien ce travail fastidieux. Malheureusement, quelle que soit l’étendue des efforts humains, les ordinateurs sont plus performants.

Comme dit le proverbe, “Ce sont nos erreurs qui font de nous des êtres humains”. Mais outre la précision, le coût du traitement et le temps d’exécution sont également importants. Sur ces deux sujets, les ordinateurs dépassent les humains. La question est donc la suivante : comment faire pour que les logiciels traitent les reçus à votre place ? Klippa a une solution astucieuse pour vous.

Qu’est-ce que le balayage des reçus de supermarché et quel est son objectif ?

La numérisation des tickets de caisse des supermarchés consiste à lire les tickets avec l’OCR (Reconnaissance Optique de Caractères), à identifier tous les champs de données pertinents et à convertir le texte en un format de données structuré utilisable.

Avec l’API Klippa, la majeure partie de ce processus est automatisée. Ainsi, vous obtiendrez facilement et rapidement un grand nombre de données disponibles et utilisables immédiatement. Vous pouvez les utiliser pour effectuer des recherches sur les produits, les améliorer, analyser le comportement des acheteurs, étudier les stratégies de prix, mettre en place des campagnes de marketing, et bien plus encore. 

Comment fonctionne l’OCR sur les reçus de supermarché ?

Vous savez que les clients envoient une photo à l’API et que les données ressortent structurées, mais que se passe-t-il entre temps ? L’API est comme le serveur, qui prend votre commande, se rend à la cuisine où la commande est préparée, et apporte les aliments à votre table. Voici un aperçu simplifié des étapes de l’API :

  1. Le client télécharge la photo d’un reçu en un clic.
  2. L’API numérise la photo. 
  3. L’image est corrigée par une IA utilisant la détection de flou et d’éblouissement afin d’améliorer la qualité de la photo.
  4. Grâce à notre logiciel de OCR, le texte est lu et extrait dans un document TXT. 
  5. Grâce au machine learning (ou l’apprentissage de la machine), les points et catégories importants sont identifiés et ces données sont ensuite transformées en JSON.
  6. L’API fournit les données JSON en quelques secondes. Elles sont maintenant à votre disposition.

Alors, qui est le cuisinier qui se tient dans la cuisine pour préparer votre repas ? Dans ce cas, le cuisinier est une IA, formée avec de nombreux exemples de reçus, tickets, factures et autres formes de documents. L’IA apprend à déterminer ce que constitue un champ de données : par exemple si ce dernier est une ligne de produits, un prix, une adresse de commerçant ou autre chose.

Au fil du temps, cette IA est devenue un chef très habile, car elle a perfectionné sa capacité à détecter automatiquement des données spécifiques. Cette forme de machine learning a permis au moteur d’obtenir une capacité de précision de 95% sur les gros volumes.

L’IA produit automatiquement vos données JSON en quelques secondes. Cela permet à l’API de vous servir un plat parfait.

Quelles données pouvez-vous extraire des reçus ?

En principe, toutes les données figurant sur un reçu peuvent être extraites et utilisées selon vos besoins spécifiques. Vous trouverez ci-dessous un bref aperçu d’exemples de données, qui peuvent toutes être combinées pour former un ensemble complet à des fins de recherche approfondie.

Données sur les produits

Les produits figurant sur le reçu ne se composent pas seulement d’un nom. Ils peuvent comporter toutes sortes d’informations contextuelles telles que des descriptions, des marques, des ingrédients ou même le pays d’origine. Ces descriptions sont généralement accompagnées d’informations tels que la quantité ou le montant.

Classification des produits

Les produits peuvent être divisés en catégories, comme les aliments et les boissons (légumes, snacks, produits laitiers, sodas, jus), mais aussi l’électronique, le nettoyage, les soins personnels, les vêtements, etc. Sur commande, ces catégories peuvent également être définies en termes de valeurs nutritionnelles ou d’ingrédients spécifiques.

Localisation et données sur les commerçants

Le nom, l’adresse, le site web et les autres coordonnées du commerçant peuvent être extraits du reçu, ce qui vous donne un aperçu général de l’emplacement et de la marque des magasins qui y figurent. 

Données sur les prix

Le prix du produit, le montant total du panier, les montants et pourcentages de TVA ainsi que la monnaie font partie de l’ensemble de données qui peut être extrait d’un reçu. Toutes les données relatives à la tarification sont substantielles à des fins de recherche. 

Repérer les différents types de fraude

Malheureusement, la fraude fait partie intégrante du scannage des reçus de supermarchés, surtout lorsqu’elle est mise en œuvre dans le cadre de programmes de fidélité. Les fraudeurs peuvent être très créatifs lorsqu’il s’agit de manipuler les reçus en leur faveur.

Heureusement, l’API de Klippa est capable de détecter de tels cas de fraude. La détection des fraudes est personnalisée sur demande, mais voici trois exemples du type de fraude que Klippa peut détecter :

Détecter les doubles de reçus

L’API est en mesure de déterminer si un reçu a déjà été saisi auparavant. Les fraudeurs peuvent essayer de tromper le système en réclamant plusieurs récompenses avec un seul reçu (par exemple, croiser plusieurs comptes), mais cela peut aussi se produire accidentellement.

Le système est capable de détecter une telle entrée par un hachage des images et des données, en identifiant les informations qui se répètent entre les différentes entrées. 

Détecter les manipulations de Photoshop

De nos jours, il n’est pas difficile de manipuler une photo avec des programmes tels que Adobe Photoshop. Il est donc plus facile pour les fraudeurs de tenter de remplacer des articles ou de modifier le prix, la date ou l’heure de l’achat. L’API de Klippa est à même de détecter des structures de pixels incohérentes et de reconnaître une image “photoshoppée”.

Faux reçus

Il est possible pour une personne mal intentionnée de créer un faux reçu ou de se baser sur un reçu existant. Quelle que soit la qualité de la manipulation des pixels, l’API est capable de recouper les informations figurant sur un reçu, telles que les adresses, les numéros de chambre de commerce, les numéros de téléphone, etc. Toute erreur commise par un fraudeur peut être détectée. 

Quels sont les bénéfices de la numérisation des reçus de supermarché ?

Une fois que les données sont disponibles, il existe de nombreuses possibilités de les appliquer à vos besoins. Voici quelques exemples d’utilisation :

Scanner des reçus pour l’analyse du panier de consommation

Afin de comprendre le comportement de vos clients, l’une de vos tâches consistera à effectuer une analyse du panier de consommation. Pour recueillir toutes les données des produits dont vous avez besoin pour une analyse précise, mettez en place une campagne qui encouragera les clients à fournir leurs informations démographiques et une photo de leurs reçus de supermarché.

Ces dernières doivent être transformées en données utilisables et précises, telles que les types de produits, les marques ou toute autre qualité de produit. Simplifiez votre procédé avec Klippa. Chaque photo téléchargée par un client sera automatiquement scannée et transformée en texte segmenté. Ce format TXT sera ensuite traité dans un format structuré (JSON), ce qui vous donne la possibilité d’effectuer une analyse efficace.

Vous pourrez ainsi découvrir des modèles de comportement d’achat, ou des produits souvent achetés ensemble. Un grand détaillant pourrait alors lancer des promotions et des campagnes de marketing pour augmenter ses ventes. 

Scannez les tickets de caisse pour recueillir des données géographiques sur les prix

Pour déterminer la stratégie de prix de votre entreprise, vous devrez analyser les prix pratiqués par les concurrents dans votre région. Par exemple, vous pouvez analyser les prix des concurrents de votre quartier ou votre région et déterminer quel prix représentera le mieux votre marque et attirera les clients vers votre entreprise.

Recueillez les reçus des clients et les traitez via l’API Klippa. L’API est capable de lire et d’en extraire automatiquement tous les champs, y compris le nom du produit, le prix, la TVA et le nom du commerçant. La combinaison de ces éléments vous permettra de déterminer le prix le plus bas et le plus élevé offert pour un produit spécifique dans votre voisinage.

En optant pour une API plutôt que pour l’externalisation et le crowdsourcing, vous serez récompensé par un processus plus rapide, plus précis et moins coûteux.

Cashback et campagnes de fidélisation

Le balayage des reçus de supermarché est idéal pour le traitement automatisé des cashbacks ou un système de points de fidélité. Vous pouvez mettre en place une campagne pour accroître l’exposition des clients à un nouveau produit et augmenter les ventes directes.

Les clients téléchargeront un reçu contenant le produit faisant partie de la campagne marketing afin de recevoir un cashback. Lorsque vous recevrez ces photos par milliers, voire par millions, vous devrez trouver un moyen rapide et précis de les traiter afin que les clients reçoivent leur remboursement rapidement.

L’API déploiera l’OCR pour lire les lignes des reçus et les extraire dans un format JSON. Ce qui vous permettra de détecter automatiquement les produits de la campagne et de déclencher la compensation du paiement. Le tout avec la rapidité et la fiabilité qui ne manqueront pas de satisfaire vos clients.

Foire aux questions 

Quels sont les champs que Klippa peut extraire des reçus de supermarché ?

Les champs de données extraits par défaut sont énumérés ci-dessous. Ils peuvent être personnalisés pour chaque client. Des champs supplémentaires peuvent être extraits sur demande.

  • Type de document
  • Qualité de l’image
  • Pays d’origine
  • Langue de réception
  • Nom du commerçant
  • Adresse du commerçant
  • Coordonnées des commerçants
  • Site marchand
  • Mode de paiement
  • Numéro de carte
  • Montant de la variation
  • Date d’achat
  • Montant total et devise
  • Montants de la TVA
  • Pourcentages de TVA
  • Description des postes, quantité, prix et catégorie
  • Numéro du reçu
  • Numéro de la chambre de commerce
  • Numéro de TVA
  • Et bien d’autres domaines

Fonctionne-t-il sur des photos de mauvaise qualité ?

Notre API comprend déjà des capacités de prétraitement d’images qui améliorent et pivotent celles de mauvaise qualité pour un meilleur traitement. En outre, Klippa propose un SDK de numérisation qui peut être implémenté dans des applications mobiles.

Ce SDK comprend des capacités de traitement d’image comme la correction de la perspective et la détection des reflets et des flous pour clarifier le contenu des photos. Ainsi, vous ne recevrez que les photos contenant les informations valables pour un traitement ultérieur. Il empêchera le principe “garbage in, garbage out” du côté du client au moment où la photo est prise. 

Quelle est la précision de l’API OCR ?

Les reçus de supermarché peuvent être scannés et les données extraites avec une précision de plus de 95 %. Cela signifie que l’IA est en mesure de reconnaître toutes les lignes d’un reçu. Vous pouvez donc être sûr qu’elle les traitera avec précision.

Si vous constatez certaines possibilités d’améliorations, nous pouvons former nos modèles sur mesure afin de soutenir votre utilisation et d’apporter la meilleure optimisation à votre entreprise. 

Cela fonctionne-t-il pour tous les produits ?

Il peut y avoir une variété de produits sur un ticket de caisse de supermarché. Il peut s’agir non seulement de vos courses habituelles, mais aussi d’une brosse à dents électrique ou d’une poêle.

Quel que soit le type de produit, Klippa peut identifier chaque ligne de produits sur un ticket de caisse en utilisant l’OCR et le machine learning.

Klippa pourra également reconnaître les catégories de produits telles que les aliments et les boissons, les soins personnels, le nettoyage, les vêtements, l’électronique…

Qu’en est-il du respect de la vie privée et de la RGPD ?

Comme pour tous les autres services proposés par Klippa, le balayage des reçus de supermarché est entièrement sécurisé et conforme à la norme RGPD (Règlement Général pour la Protection des Données). Par défaut, nous utilisons des serveurs certifiés ISO au sein de l’Union européenne pour le traitement des reçus.

Vous êtes situé en dehors de l’UE ? Nous pouvons mettre en place un serveur personnalisé dans votre région très rapidement. Un accord sur le traitement des données est en place. Nous ne stockons aucune données, ni les vôtres ni celles de vos clients.

Dans quels pays pouvez-vous l’API OCR ?

Le moteur de Klippa fonctionne mieux pour les langues occidentales. Les langues courantes avec lesquelles nous travaillons sont l’anglais, le néerlandais, l’allemand, le français, l’espagnol, le portugais, le suédois, le norvégien, le danois, le finnois et l’italien.

Toute autre langue peut être prise en charge sur demande. Nous sommes en mesure d’utiliser l’apprentissage automatique pour toutes les langues existantes.

Faites connaissance avec Klippa

Klippa est à même de vous aider dans vos besoins de traitement de documents. Si vous avez un défi à relever en ce qui concerne le traitement de document, n’hésitez pas à nous envoyer un message ou à planifier une démonstration en ligne avec l’un de nos experts ci-dessous.

Works with AZEXO page builder
Index