La meilleure API de capture de reçus pour les développeurs

La meilleure API de capture de reçus pour les développeurs

Les développeurs sont constamment mis au défi par leurs organisations d’ajouter des fonctionnalités aux logiciels existants ou de construire des solutions complètement nouvelles. Heureusement, nous vivons à l’ère de l’open source et des APIs, et les développeurs n’ont donc plus besoin de construire toutes ces fonctionnalités à partir de zéro.

Il y a 5 ans, Klippa s’est attelé à développer une solution de gestion des dépenses et de traitement des factures. La saisie automatique des tickets de caisse était une fonctionnalité très importante dans notre application, car nous pensons que la saisie manuelle des données appartient au passé. Nous croyons en l’économie de l’API, et c’est pourquoi nous avons commencé par chercher la meilleure API de capture de reçus à intégrer dans notre logiciel. Pourquoi mettre au point une fonctionnalité qui existe déjà ailleurs, n’est-ce pas ? Nous avons testé pendant des mois plus de 10 solutions différentes, sur plus de 10.000 reçus. Malheureusement, aucune des solutions que nous avons utilisées n’a su nous convaincre. Beaucoup ne sont même pas allées au-delà de l’OCR de base, qui ne vous donne qu’un fichier texte brut. Nos exigences étaient que les résultats soient fournis en temps réel (dans les 5 secondes), précis (plus de 75% des données extraites), évolutifs, automatisés (donc pas de personnes impliquées), de préférence en JSON et adaptés aux langues européennes courantes comme le néerlandais, l’allemand, le français, l’espagnol, l’italien et l’anglais.

Certaines API de capture de tickets de caisse que nous avons testées n’ont pas été aussi rapides que souhaité, beaucoup n’ont pas été performantes en termes de précision, et presque toutes ont échoué sur l’aspect multilingue. Nous soulevions à l’époque un vrai problème : aucune option ne répondait réellement à nos exigences et ne pouvait permettre à nos clients d’en finir avec la saisie manuelle des données. Que faire ? Grâce à une bonne maitrise des langues dans notre équipe, et à l’aide des expressions régulières (REGEX) et du machine learning, une nouvelle quête s’offrait à nous, celle de construire ce dont nous avions vraiment besoin : la meilleure API pour la capture de reçus en Europe. En 2018, la première version de notre API vit le jour, et nous l’améliorons encore quotidiennement. Elle est aujourd’hui disponible pour des tiers et mise en œuvre dans divers domaines tels que la comptabilité, les ERP, la banque, la fidélisation et bien d’autres.

Comment fonctionne notre moteur de capture de reçus ?

Le processus peut être divisé en trois étapes de base.

  1. La première étape consiste à envoyer une image à notre API via une requête. De là, nous transformerons l’image ou le PDF d’un reçu en un fichier texte de base. Cette partie n’est que l’OCR de base que de nombreux acteurs proposent aujourd’hui sur le marché. L’image ci-dessous montre un exemple de cette étape pour un reçu néerlandais :
Ticket de caisse reconnaissance de texte

Mais un simple fichier texte ne vous permet pas grand chose. Pour être efficace, il faudrait que notre technologie interprète ces informations et vous communique des données structurées sous format JSON par exemple, n’est-ce pas ? Heureusement, on s’occupe de vous.

  1. Après l’étape d’OCR, notre moteur d’analyse intelligent entre en action. Il analyse le fichier texte et interprète ce que représente chaque élément. Dates, montants, adresses et bien d’autres. L’analyse des expressions régulières (REGEX) et le machine learning lui permet d’identifier pour chaque champ de données les informations possibles qui y sont renseignées. A partir de là, les meilleurs suggestions sont sélectionnées, comme par exemple les montants totaux, la date d’achat et plus encore.
  2. Maintenant que nous savons quelles informations comptent pour vous, nous convertissons le ticket de caisse en un fichier JSON, qui structure le résultat en plusieurs points pour répondre précisément à votre demande. Vous trouverez ci-dessous un exemple de réponse JSON simplifiée pour l’exemple de reçu :

Comment l’API a-t-elle été construite ?

Chez Klippa, nous construisons tous nos services backend en langage GO. Ceci garantit un traitement rapide et également la qualité des réponses. L’analyseur qui effectue l’extraction des données a quant à lui été construit en Python, qui possède de très bonnes capacités de machine learning et d’analyse des expressions régulières (REGEX).

Quels champs l’API capture de reçus Klippa extrait-elle ?

Nombreuses sont les informations contenues dans un reçu qui potentiellement présentent un intérêt. Nous faisons en sorte que notre API soit très flexible, en rendant possible l’extraction d’informations diverses et variées. Au total, nous extrayons plus de 50 champs différents des reçus. Cela inclut bien sûr des éléments de base tels que le montant total, les dates, les informations TVA et l’adresse, mais aussi des éléments plus complexes tels que la reconnaissance des champs de données sur les reçus. Vous trouverez tous ces éléments dans notre documentation API.

Quels sont ces cas d’utilisation ?

Excellente question ! Il y a beaucoup de cas spécifiques pour lesquels l’OCR, et en particulier l’extraction des données, peuvent se révéler être d’un grand intérêt. Nous constatons que la plupart de nos clients intègrent l’API de capture de reçus dans leur logiciel de gestion comptable et leurs solutions ERP, mais aussi les compagnies d’assurance, les banques et les solutions de fidélisation l’utilisent. Dans certains cas, nous créons même des fonctionnalités supplémentaires pour aider nos clients à atteindre leurs objectifs. Dans un démarche de fidélisation de la clientèle par exemple, nous avons ajouté la détection des doublons afin qu’ils puissent facilement prévenir la fraude lors des campagnes de fidélité basées sur les reçus.

Quelles sont les langues prises en charge par l’API de ticket de caisse?

Par défaut, notre API de reconnaissance de texte est agnostique. Cela signifie qu’il n’a pas été conçu pour servir une langue spécifique, mais pour extraire certains types d’informations telles que les montants, les dates, les heures, les valeurs de TVA, les pourcentages de TVA, les numéros de chambre de commerce, les informations de paiement et les postes individuels. Cela ne veut pas dire que la précision est la même dans toutes les langues, car une dimension d’apprentissage entre en jeu. Plus nous traitons de documents dans une langue donnée, plus nous sommes performants. L’API est fonctionnelle et prête à l’emploi pour les langues européennes telles que l’anglais, le français, l’allemand, l’espagnol, l’italien, le portugais et le néerlandais. D’autres langages sont supportés mais peuvent nécessiter plus d’optimisation pour des cas d’utilisation spécifiques.

Qu’en est-il de la documentation et du support API?

Comme nous l’expliquions au début de cet article, plus de 50% de notre équipe est composée de développeurs. Ces derniers adorent utiliser les API, surtout lorsqu’elles sont bien documentées. Nous estimons qu’il est important de mettre en pratique ce que l’on prêche, c’est pourquoi nous avons bien sûr documenté notre API avec soin et fournissons une assistance à la fois commerciale et technique à la mise en œuvre si nécessaire. Vous trouverez ici la documentation OCR Klippa et vous pouvez nous contacter ici pour toute question.

Obtenez une démo pour en savoir plus

Bien sûr, quand il s’agit de solutions techniques, il vaut mieux voir que croire ! Pour se faire, nous débutons généralement par une démonstration en ligne de ce que notre API peut faire pour vous. Ensuite, nous continuons par une démonstration de faisabilité avec nos clients : vous obtiendrez ainsi une clé API et des crédits de test afin que vous puissiez réaliser tous les tests qui vous sont nécessaires pour prendre une décision, toujours avec le support technique et commercial de notre côté.

Donc, si vous êtes prêt à voir la meilleure API de capture de ticket de caisse en action, contactez-nous ou planifiez une démonstration en ligne !

Image Map WordPress builder