Comparatif des OCR de factures à l’heure de l’IA générative

Dernière mise à jour :

15.10.2024

5 minutes

🔍 À la recherche de la meilleure façon d'analyser en détail vos factures ? Chaque ligne de votre facture contient des données vitales pour votre activité : l'analyse des dépenses, la vérification de l'exactitude des tarifs, ou le suivi des variations de prix selon les articles. Extraire ces informations peut s'avérer complexe, les outils d'OCR (Reconnaissance Optique de Caractères) sont essentiels pour ce processus, mais lequel est le plus adapté ?

Le détail ligne par ligne des factures, c’est-à-dire le détail de chaque bien et service facturé, contient des montagnes de données granulaires sur vos achats. Mais aujourd’hui ces données restent souvent inexploitées car souvent restructurées et variables selon le fournisseur. Pourtant, les entreprises peuvent débloquer des avantages décisifs grâce au détail ligne par ligne :

  • En comptabilité, afin de connaitre le bon traitement de chaque facture,
  • En contrôle de gestion, afin de vérifier la conformité avec la grille tarifaire ou détecter la fraude,
  • En gestion des achats, afin de suivre les variations de prix et disposer des données pour négocier avec ses fournisseurs, comparer le prix payé pour chaque référence.
L’enjeu: convertir cette donnée de facturation non structurée en une base de données structurée pour exploiter et analyser les informations facilement.

Les logiciels reposant sur la technique d’OCR (Optical Character Recognition) sont la première brique technologique permettant d’accéder à ces données. La majorité des logiciels ont aujourd’hui des résultats très satisfaisants pour l'extraction des informations générales telles que le nom du fournisseur, le montant total HT et TTC, les adresses et les numéros de TVA.

Mais le détail ligne par ligne, crucial, reste encore à la traine. Nous avons testé différents logiciels d’OCR sur deux jeux de factures afin de comprendre leurs performances :

  • 15 factures “faciles” ne présentant pas de difficultés particulières, en PDF natifs, avec une ligne à ligne propre dans un tableau clairement découpé, sans information parasite ;
  • 15 factures “difficiles”, avec des difficultés comme des PDF scannés, des descriptions sur plusieurs lignes ou tronquées sur plusieurs pages, des informations parasites comme des lignes de totaux et des champs non standards.

Afin de remplir l’objectif de structuration de la donnée de facturation, l’OCR doit avoir d’excellents résultats sur deux axes :

  • Le taux de réussite, c’est-à-dire la capacité à reconnaitre et extraire les différents champs du ligne à ligne. Ce taux doit être proche de 100% - un taux même un peu plus bas, par exemple de 95%, rend la donnée inexploitable, car il faut la vérifier.
  • La paramétrabilité, afin de reconnaitre les champs vraiment pertinents pour le cas d’usage (par exemple, les SKU, les EAN, les codes métiers, la période concernée, l’unité de quantité, etc.), et constituer une base de donnée uniforme malgré la diversité des factures reçues.

Pourquoi Koncile ?

Pour reconnaitre le ligne à ligne, Koncile combine les technologies de reconnaissance visuelle pour détecter l’organisation des factures et l’IA générative pour affiner la compréhension. Afin de s’adapter parfaitement à votre environnement métier, l’OCR Koncile permet de personnaliser dynamiquement certains champs à extraire et donner des instructions.é

Amazon Textract Analyse Expense

Reconnaissance des champs principaux. L’outil d’AWS permet de reconnaitre 43 champs de la facture incluant des éléments principaux comme les noms, adresses, montants totaux HT et TTC, et même certains champs prédéfinis plus spécifiques tels que le montant des frais de transport ou les termes de paiement. Le taux de réussite est proche des 100% pour ces champs principaux, lorsqu’ils sont présents dans la facture.

Reconnaissance du ligne à ligne ⭐⭐✨✨✨ (2/5). L’outil propose une section line item fields qui reconnait le ligne à ligne des factures. Pour les factures “simples”, les informations du ligne à ligne ressortent sans erreur dans un tableau Excel pour 14 d’entre elles. Le tableur est spécifique au titre des champs présents dans chaque facture. En revanche, sur les 15 factures “complexes”, plus de 10 comportaient des erreurs importantes : des oublis de ligne, ou de descriptions ou encore l’ajout de lignes non pertinentes. La difficulté vient du fait que la reconnaissance de champ est surtout basée sur de la computer vision et non sur de la compréhension linguistique. On doit privilégier l’utilisation de l’outil sur des factures avec une organisation simple en format PDF natif, et non les PDF scannés.

Paramétrabilité ⭐⭐⭐✨✨ (3/5). L’outil ne permet pas d’extraire des champs spécifiques de la facture, par exemple, un numéro spécifique à votre environnement métier. Il faut utiliser une autre fonctionnalité AnalyzeDocument - Queries qui permet de faire de formuler des demandes d’extraction spécifiques. De même, si vous avez plusieurs fournisseurs avec plusieurs types de factures différentes à extraire, l’outil ne permettra pas d’obtenir un fichier Excel consolidé avec les mêmes champs extraits du ligne à ligne extrait, afin ensuite d’analyser la donnée.

Mindee Invoice parser

Mindee propose un OCR de facture sur étagère détectant 16 champs principaux. Sur le panel testé, le taux de succès sur ces informations de base est proche de 100%, notamment sur les factures scannées.

Reconnaissance du ligne à ligne ⭐⭐⭐✨✨ (3/5). Mindee prévoit une liste de champs “par défaut” de champs à extraire du ligne à ligne : la description, le code produit, la quantité, le prix unitaire, le prix total et la TVA. Sur 9 des 15 factures “complexes”, des erreurs sont détectées dès que les formats des tableaux sont moins standardisés. Des informations clefs sont parfois non prises en compte : par exemple, un code produit pris à la place d’un SKU ou d’un code EAN. L’utilisation de cette donnée nécessitera encore un post-traitement important sous Excel et une vérification de la donnée.

Paramétrabilité ⭐⭐⭐✨✨ (3/5). Mindee prévoit la possibilité d’extraire des informations spécifiques grâce à son module API Builder. Il vous faudra “entrainer” l’outil à extraire l’information recherchée en annotant quelques dizaines de documents identiques. Il n’est pas possible de seulement “demander” sous forme de prompt une demande en langage naturel pour obtenir le résultat.

Rapidité et facilité d’utilisation ⭐⭐⭐⭐⭐ (5/5). Sur les 30 factures testées, le temps moyen par page est d’environ 5 secondes.

Affinda

L’outil d’Affinda propose une série de champs généraux à extraire par défaut des factures. Sur les 30 factures testées, 5 d’entre elles présentaient des erreurs sur au moins un champ clef, comme le numéro SIRET du client ou le montant total de la facture.

Reconnaissance du ligne à ligne ⭐⭐✨✨✨ (2/5). Affinda propose un système de détection du ligne à ligne grâce à un système de détection de tableaux. Sur les 15 factures “complexes”, 7 donnent des résultats exploitables. En revanche, dès lors que les descriptions dépassent plusieurs lignes, de nombreuses lignes parasites sont créées, ce qui rend l’information non standardisée et difficilement exploitable.

Paramétrabilité ⭐⭐⭐⭐⭐ (5/5). L’outil propose de paramétrer les champs à extraire, d’en ajouter ou d’en supprimer sur la base d’un grand modèle de langage (GPT). Il n’est en revanche pas possible de paramétrer l’extraction du ligne à ligne.

Rapidité et facilité d’utilisation ⭐⭐⭐⭐⭐ (5/5). L’outil propose une fonctionnalité de correction de l’information erronée et une capacité d’apprentissage sur la donnée de l’entreprise (non testée).

Google Document AI

Reconnaissance des champs principaux ⭐⭐⭐⭐⭐ (5/5). L’outil Invoice Parser propose 37 champs à extraire des factures via la console Document AI. Ces champs ne sont pas modifiables ou éditables.

Reconnaissance du ligne à ligne ⭐⭐⭐✨✨ (3/5). L’outil extrait une liste fixe de 7 informations du ligne à ligne : quantité, description, code produit, bon de commande, nombre, unité et prix unitaire. Ces champs sont fixes ce qui ne permet pas d’adapter à des informations métiers spécifiques, ou gérer la multiplicité des codes. Si le taux de réussite est élevé pour les factures “simples”, de nombreuses informations clefs pour les factures complexes ne sont pas extraites et des lignes entières sont parfois oubliées.

Paramétrabilité ⭐⭐✨✨✨ (2/5). Document AI permet de créer un data set de factures et d’entrainer à la reconnaissance de certaines informations (non testé).

Nanonets

Reconnaissance des champs principaux ⭐⭐⭐⭐✨ (4/5). Nanonets est une solution dédiée à l’OCR de documents, qui inclut les factures dans le panel de documents traités. 28 champs sont extraits par défaut. L’outil permet de paramétrer les formats d’extraction pour chaque champ (date, devises, etc.).

Reconnaissance du ligne à ligne ⭐⭐✨✨✨ (2/5). Nanonets extrait le ligne à ligne sur la base de la reconnaissance de tableaux, sur un fonctionnement proche de celui d’Affinda. Sur les 15 factures “complexes”, certains colonnes sont parfois exclues de la reconnaissance, concernant parfois des données clefs comme le code produit ou le prix unitaire hors taxe.

Paramétrabilité ⭐⭐⭐✨✨ (3/5). La version pro permet de créer des datasets d’entrainement pour préciser où les informations sont localisées. Cette fonctionnalité est pertinente pour les documents longs, mais est plutôt difficile d’application pour le ligne à ligne des factures.

Facilité d’utilisation ⭐⭐⭐⭐⭐ (5/5). Nanonets prévoit des intégrations avec Google Drive, des facilités d’export sous format Excel, et des workflows d’approbation des factures.

Parsio

L’outil PDF-parser (pre-trained model) prévoit un nombre fixe de champs à extraire des factures. Sur ces champs généraux hors ligne à ligne, il donne des résultats d’extraction avec une précision proche de 100% pour les factures “faciles” et de 97% pour les factures “complexes”.

Reconnaissance du ligne à ligne ⭐⭐⭐✨✨ (3/5). Sur les 15 factures complexes, le ligne à ligne est extrait avec précision sur 10 d’entre elles. La difficulté demeure néanmoins pour les PDF non scannés. Comme le paramétrage par ligne n’est pas possible, un numéro peut être pris à la place d’un autre, sans que l’utilisateur puisse corriger les erreurs ou apprendre à la machine à chercher le bon élément. Il est donc difficile de constituer une base uniforme de prix avec la donnée extraite.

Paramétrabilité ⭐⭐⭐✨✨ (3/5). Parsio prévoit une fonctionnalité de recherche de champs par prompt se basant sur GPT-4. Elle permet d’extraire des données spécifiques d’informations dans des documents. En revanche, il n’est pas possible d’utiliser cette fonctionnalité pour reconnaitre le ligne à ligne, et identifier par exemple des champs pertinents dans tous les services et biens facturés. De plus, elle n’est pas encore combinée avec un OCR, donc elle ne peut lire que des PDF source, et ne tient pas compte de l’organisation de la page.

Facilité d’utilisation. La web-app génère une adresse courriel sur laquelle les documents peuvent être envoyés. Un grand nombre d’intégrations sont possibles.

Airparser

L’outil s’appuie sur la technologie de GPT-4 pour extraire des champs spécifiques de tout type de documents. Il est construit par le même éditeur que Parsio.

Reconnaissance du ligne à ligne et paramétrabilité ⭐⭐⭐✨✨ (4/5).

L'outil permet de paramétrer les champs que l'on souhaite extraire. Grâce a la fonction “liste et table”, on peut extraire des lignes de facturation en définissant les différents attributs de chaque ligne. Pour chaque champs, on ajoute une description qui permet à l'outil d'affiner la précision d'extraction. Les factures “simples” Donne des résultats satisfaisants lorsqu'on précise suffisamment les descriptions de chaque attributs. En revanche, pour les factures complexes, nous avons marqué des confusions entre les colonnes. Le risque d'erreur et notamment plus important en présence de facture scanner.

Base64.ai

Base64 propose un outil d’extraction de facture sur étagère, avec un ensemble de champs extraits de manière systématique.

Reconnaissance du ligne à ligne ⭐⭐⭐✨✨ (3/5). 14 parmi les 15 factures “simples” sont extraites avec un bon taux de succès. S’agissant des factures complexes, les difficultés concernant la multiplicité des numéros, les sauts de page ou encore les informations contenues dans le titres ne sont pas relevées pour 5 factures.

Paramétrabilité ⭐⭐⭐✨✨ (3/5). L’outil permet de poser une question sur le document ou ajouter un champ extrait. Il ne permet pas de modifier les champs extraits dans chaque ligne, ni de donner des instructions spécifiques.

Facilité d’utilisation. Le temps de réponse peut être d’une minute pour des factures longues. De nombreuses intégrations sont prévues dans les “flows” de gestion de documents.

Docsumo

Docusumo propose un outil sur étagère qui extrait les principaux champs des factures.

Reconnaissance du ligne à ligne ⭐⭐✨✨✨ (2/5). L’outil extrait le ligne à ligne grâce à la détection de tableaux, ressemblant à l’OCR de Nanonets ou Affinda. Cela fonctionne bien lorsque toutes les informations se rapportant à une ligne sont bien alignées. En revanche, pour les tableaux complexes, il n’est pas possible de capter les informations pertinentes.

Paramétrabilité ⭐⭐✨✨✨ (2/5). Une fonctionnalité “ChatAI” permet de poser des questions au document. Cependant, les réponses ne peuvent à ce stade être intégrées de manière systématique aux champs extraits. L’outil ne prévoit pas de fonction pour préciser ou modifier les différents champs extraits ou le ligne à ligne.

Commencez à économiser aujourd’hui.

C

Les ressources Koncile

T

Maîtriser la Détection et l'Extraction de Tableaux dans des Documents

Cet article présente des méthodes utilisées aujourd'hui pour extraire des tableaux de documents numérisés

Blog

10/10/2024

F

Les 8 fonctionnalités primordiales pour bien choisir son ERP BTP

Article présentant une liste de 8 fonctionnalités intéressante à avoir dans son ERP si l'on travaille dans le BTP

Fiche pratique

9/10/2024

&

Contrôle des Factures Fournisseurs pour les entreprises du BTP

Grâce à la technologie, automatisez les contrôles de vos factures fournisseurs.

Fiche pratique

8/10/2024