La reconnaissance des factures "par lignes" grâce à l'OCR

La reconnaissance des factures "par lignes" grâce à l'OCR

La reconnaissance automatique des factures est un sujet d’actualité dans la comptabilité depuis quelques années déjà. Lentement mais sûrement, ce secteur évolue vers une comptabilité robotisée et la reconnaissance des factures en est un élément essentiel. Pendant longtemps, cette dernière était uniquement disponible pour déceler les informations principales telles que le créancier, le débiteur, la date, le numéro de facture, le montant total, etc. Cependant, le développement de la technologie a rendu possible des systèmes d’apprentissage machine (ou machine learning) de plus en plus intelligents. Chez Klippa par exemple, nous améliorons sans cesse notre technologie grâce à l’apprentissage profond. Cette technique permet d’extraire des documents des informations de plus en plus spécifiques avec une précision grandissante. C’est pourquoi la reconnaissance automatique des factures par lignes est également possible avec l’API d’analyse des factures par OCR Klippa !

Qu’entend-t-on par reconnaissance “par lignes” ? En quoi est-ce utile ?

L’extraction automatique des informations clés d’une facture est bien sûr déjà très utile pour convertir de nombreuses factures en une proposition de réservation automatisée. En particulier avec les ledgers standardisés, l’automatisation de ces suggestions de réservation devient de plus en plus simple. Pour autant, il n’est pas toujours possible de faire une proposition de réservation complète avec les informations de base. Après tout, les factures (et les reçus) ont souvent plusieurs lignes, chacune correspondant à un montant qui ne doit pas toujours être enregistré au niveau du même compte général, centre de coûts ou projet. En reconnaissant les factures au niveau de chaque ligne indépendamment, notre logiciel d’auto-apprentissage dispose d’un contexte plus large et presque toutes les propositions peuvent être faites avec précision.

Comment fonctionne la reconnaissance par lignes sur les factures ?

Nous utilisons un modèle d’apprentissage automatique pour reconnaître les lignes sur une facture. C’est une histoire quelque peu technique, mais nous utilisons ce qui s’appelle “l’apprentissage profond” pour cela : il s’agit d’une forme d’apprentissage automatique par laquelle le logiciel lui-même peut déterminer une signification à partir d’un ensemble de données étiquetées. Chez Klippa, nous avons développé un vaste ensemble de données dans lequel les lignes sont clairement marquées pour chaque facture et reçu. Le logiciel d’auto-apprentissage opère sur cet ensemble de données afin de reconnaître les schémas qui s’y trouvent pour finalement en dégager un modèle. Chaque fois qu’un document arrive chez Klippa pour être traité, il est comparé à ce dit modèle. Sur la base d’une analyse statistique, nous examinons la structure du document pour ensuite désigner l’emplacement des lignes de la facture. Cela peut être en quelque sorte comparé à un surlignage au marqueur, comme vous le feriez avec sur papier.

Dès que vous avez les marqueurs de la région des lignes de facturation en place, un autre programme informatique sera mis en service. On appelle ça un analyseur. Cet analyseur examine toutes les informations de la zone surlignée et attribue un sens à chaque information. Par exemple, la description, les montants, les numéros et les valeurs de TVA sur la facture sont conservés séparément et stockés dans la base de données pour chaque ligne de facture. Ces informations, ainsi que les informations d’en-tête, sont éventuellement utilisées pour inclure la proposition d’inscription au niveau ligne.

A quoi ressemble la reconnaissance des lignes de facture?

Il est parfois difficile de faire une bonne visualisation du fonctionnement d’un programme informatique. Après tout, le logiciel fait l’essentiel de son travail en arrière-plan, et seule la sortie est visualisée dans une interface. Pour vous donner une idée du fonctionnement du logiciel, vous pouvez regarder la visualisation ci-dessous. Ici vous pouvez voir comment le logiciel, en plus des données clés, a également mis une case verte sur une facture, c’est là que les lignes de factures peuvent être trouvées. Ensuite, des blocs noirs sont dessinés autour des valeurs individuelles qui sont pertinentes et celles-ci sont reliées entre elles par des lignes noires. De cette façon, les données sont extraites et reliées les unes aux autres, sans utiliser de modèles.

Pour quelles langues cela fonctionne-t-il?

Bonne question! Heureusement, la réponse est plutôt bonne aussi. Notre logiciel peut fonctionner sur à peu près n’importe quelle langue. Il fonctionne mieux dans les langues européennes comme le néerlandais, l’allemand, le français, l’italien, l’espagnol, l’anglais, l’italien et bien d’autres encore. Il peut également être formé pour être plus performant sur des langues spécifiques si les résultats prêts à l’emploi ne sont pas à la hauteur des exigences.

Parlons!

Chez Klippa, nous implémentons nos solutions intelligentes dans notre propre logiciel, par exemple dans le module de facturation des achats, mais aussi dans des logiciels tiers. Nous disposons à cet effet d’API conviviales. Vous avez un problème avec la numérisation et la reconnaissance des lignes de factures ? N’hésitez pas à nous le faire savoir en nous contactant ! Nous aimons réfléchir avec vous.

Image Map WordPress builder