Comparatif des OCR de factures à l’heure de l’IA générative
par
Raphaël Balbous
Dernière mise à jour :
December 30, 2024
5 minutes
À la recherche de la meilleure façon d'analyser en détail vos factures ?
Chaque ligne de votre facture contient des données vitales pour votre activité :
L'analyse des dépenses
La vérification de l'exactitude des tarifs
Le suivi des variations de prix selon les articles
Extraire ces informations peut s'avérer complexe, les outils d'OCR (Reconnaissance Optique de Caractères) sont essentiels pour ce processus, mais lequel est le plus adapté ?
Pourquoi extraire le ligne-à-ligne de vos factures
Le détail ligne par ligne des factures, c’est-à-dire le détail de chaque bien et service facturé, contient des montagnes de données granulaires sur vos achats. Mais aujourd’hui ces données restent souvent inexploitées car souvent déstructurées et variables selon le fournisseur.
Pourtant, les entreprises peuvent débloquer des avantages décisifs grâce au détail ligne par ligne :
En comptabilité, afin de connaitre le bon traitement de chaque facture,
En contrôle de gestion, afin de vérifier la conformité avec la grille tarifaire ou détecter la fraude,
En gestion des achats, afin de suivre les variations de prix et disposer des données pour négocier avec ses fournisseurs, comparer le prix payé pour chaque référence.
L’enjeu: convertir cette donnée de facturation non structurée en une base de données structurée pour exploiter et analyser les informations facilement.
Ce que permet la technologie OCR
Les logiciels reposant sur la technique d’OCR (Optical Character Recognition) sont la première brique technologique permettant d’accéder à ces données.
La majorité des logiciels ont aujourd’hui des résultats très satisfaisants pour l'extraction des informations générales telles que le nom du fournisseur, le montant total HT et TTC, les adresses et les numéros de TVA.
Mais le détail ligne par ligne, crucial, reste encore à la traine.
Ce que nous avons testé
Nous avons testé différents logiciels d’OCR sur deux jeux de factures afin de comprendre leurs performances :
15 factures “faciles”
Des factures “faciles” ne présentant pas de difficultés particulières, en PDF natifs, avec une ligne à ligne propre dans un tableau clairement découpé, sans information parasite ;
15 factures “difficiles”
Des factures “difficiles”, avec des difficultés comme des PDF scannés, des descriptions sur plusieurs lignes ou tronquées sur plusieurs pages, des informations parasites comme des lignes de totaux et des champs non standards.
Afin de remplir l’objectif de structuration de la donnée de facturation, l’OCR doit avoir d’excellents résultats sur deux axes :
Le taux de réussite
La capacité à reconnaitre et extraire les différents champs du ligne à ligne. Ce taux doit être proche de 100% - un taux même un peu plus bas, par exemple de 95%, rend la donnée inexploitable, car il faut la vérifier.
La paramétrabilité
Critère majeur pour reconnaitre les champs vraiment pertinents pour le cas d’usage (par exemple, les SKU, les EAN, les codes métiers, la période concernée, l’unité de quantité, etc.), et constituer une base de donnée uniforme malgré la diversité des factures reçues.
Pourquoi Koncile ?
Pour reconnaitre le ligne à ligne, Koncile combine les technologies de reconnaissance visuelle pour détecter l’organisation des factures et l’IA générative pour affiner la compréhension. Afin de s’adapter parfaitement à votre environnement métier, l’OCR Koncile permet de personnaliser dynamiquement certains champs à extraire et donner des instructions.
Notre comparatif
Amazon Textract Analyse Expense
Reconnaissance des champs principaux
L’outil d’AWS permet de reconnaitre 43 champs de la facture incluant des éléments principaux comme les noms, adresses, montants totaux HT et TTC, et même certains champs prédéfinis plus spécifiques tels que le montant des frais de transport ou les termes de paiement. Le taux de réussite est proche des 100% pour ces champs principaux, lorsqu’ils sont présents dans la facture.
Reconnaissance du ligne à ligne⭐⭐✨✨✨ (2/5)
L’outil propose une section line item fields qui reconnait le ligne à ligne des factures. Pour les factures “simples”, les informations du ligne à ligne ressortent sans erreur dans un tableau Excel pour 14 d’entre elles. Le tableur est spécifique au titre des champs présents dans chaque facture. En revanche, sur les 15 factures “complexes”, plus de 10 comportaient des erreurs importantes : des oublis de ligne, ou de descriptions ou encore l’ajout de lignes non pertinentes. La difficulté vient du fait que la reconnaissance de champ est surtout basée sur de la computer vision et non sur de la compréhension linguistique. On doit privilégier l’utilisation de l’outil sur des factures avec une organisation simple en format PDF natif, et non les PDF scannés.
Paramétrabilité⭐⭐⭐✨✨ (3/5)
L’outil ne permet pas d’extraire des champs spécifiques de la facture, par exemple, un numéro spécifique à votre environnement métier. Il faut utiliser une autre fonctionnalité AnalyzeDocument - Queries qui permet de faire de formuler des demandes d’extraction spécifiques. De même, si vous avez plusieurs fournisseurs avec plusieurs types de factures différentes à extraire, l’outil ne permettra pas d’obtenir un fichier Excel consolidé avec les mêmes champs extraits du ligne à ligne extrait, afin ensuite d’analyser la donnée.
Mindee
Mindee propose un OCR de facture sur étagère détectant 16 champs principaux. Sur le panel testé, le taux de succès sur ces informations de base est proche de 100%, notamment sur les factures scannées.
Reconnaissance du ligne à ligne⭐⭐⭐✨✨ (3/5)
Mindee prévoit une liste de champs “par défaut” de champs à extraire du ligne à ligne : la description, le code produit, la quantité, le prix unitaire, le prix total et la TVA. Sur 9 des 15 factures “complexes”, des erreurs sont détectées dès que les formats des tableaux sont moins standardisés. Des informations clefs sont parfois non prises en compte : par exemple, un code produit pris à la place d’un SKU ou d’un code EAN. L’utilisation de cette donnée nécessitera encore un post-traitement important sous Excel et une vérification de la donnée.
Paramétrabilité⭐⭐⭐✨✨ (3/5)
Mindee prévoit la possibilité d’extraire des informations spécifiques grâce à son module API Builder. Il vous faudra “entrainer” l’outil à extraire l’information recherchée en annotant quelques dizaines de documents identiques. Il n’est pas possible de seulement “demander” sous forme de prompt une demande en langage naturel pour obtenir le résultat.
Rapidité et facilité d’utilisation⭐⭐⭐⭐⭐ (5/5)
Sur les 30 factures testées, le temps moyen par page est d’environ 5 secondes.
Affinda
L’outil d’Affinda propose une série de champs généraux à extraire par défaut des factures. Sur les 30 factures testées, 5 d’entre elles présentaient des erreurs sur au moins un champ clef, comme le numéro SIRET du client ou le montant total de la facture.
Reconnaissance du ligne à ligne⭐⭐✨✨✨ (2/5)
Affinda propose un système de détection du ligne à ligne grâce à un système de détection de tableaux. Sur les 15 factures “complexes”, 7 donnent des résultats exploitables. En revanche, dès lors que les descriptions dépassent plusieurs lignes, de nombreuses lignes parasites sont créées, ce qui rend l’information non standardisée et difficilement exploitable.
Paramétrabilité⭐⭐⭐⭐⭐ (5/5)
L’outil propose de paramétrer les champs à extraire, d’en ajouter ou d’en supprimer sur la base d’un grand modèle de langage (GPT). Il n’est en revanche pas possible de paramétrer l’extraction du ligne à ligne.
Rapidité et facilité d’utilisation⭐⭐⭐⭐⭐ (5/5)
L’outil propose une fonctionnalité de correction de l’information erronée et une capacité d’apprentissage sur la donnée de l’entreprise (non testée).
Google Document AI
Reconnaissance des champs principaux⭐⭐⭐⭐⭐ (5/5)
L’outil Invoice Parser propose 37 champs à extraire des factures via la console Document AI. Ces champs ne sont ni modifiables ni éditables.
Reconnaissance du ligne à ligne⭐⭐⭐✨✨ (3/5)
L'outil extrait une liste fixe de 7 détails d’articles : quantité, description, code produit, bon de commande, numéro, unité et prix unitaire. Ces champs sont fixes, ce qui ne permet pas de s’adapter à des informations spécifiques aux entreprises ni de gérer plusieurs codes. Bien que le taux de réussite soit élevé pour les factures « simples », de nombreux détails clés pour les factures complexes ne sont pas extraits, et certaines lignes sont parfois ignorées.
Paramétrabilité⭐⭐✨✨✨ (2/5)
Document AI permet de créer un ensemble de données de factures et de l’entraîner à reconnaître certaines informations (non testé).
Nanonets
Reconnaissance des champs principaux⭐⭐⭐⭐✨ (4/5)
Nanonets est une solution dédiée à l’OCR de documents, qui inclut les factures dans le panel de documents traités. 28 champs sont extraits par défaut. L’outil permet de paramétrer les formats d’extraction pour chaque champ (date, devises, etc.).
Reconnaissance du ligne à ligne⭐⭐✨✨✨ (2/5)
Nanonets extrait le ligne à ligne sur la base de la reconnaissance de tableaux, sur un fonctionnement proche de celui d’Affinda. Sur les 15 factures “complexes”, certains colonnes sont parfois exclues de la reconnaissance, concernant parfois des données clefs comme le code produit ou le prix unitaire hors taxe.
Paramétrabilité⭐⭐⭐✨✨ (3/5)
La version pro permet de créer des datasets d’entrainement pour préciser où les informations sont localisées. Cette fonctionnalité est pertinente pour les documents longs, mais est plutôt difficile d’application pour le ligne à ligne des factures.
Rapidité et facilité d’utilisation⭐⭐⭐⭐⭐ (5/5)
Nanonets prévoit des intégrations avec Google Drive, des facilités d’export sous format Excel, et des workflows d’approbation des factures.
Parsio
L’outil PDF-parser (pre-trained model) prévoit un nombre fixe de champs à extraire des factures. Sur ces champs généraux hors ligne à ligne, il donne des résultats d’extraction avec une précision proche de 100% pour les factures “faciles” et de 97% pour les factures “complexes”.
Reconnaissance du ligne à ligne⭐⭐⭐✨✨ (3/5)
Pour les 15 factures complexes, l'extraction ligne par ligne est précise pour 10 d’entre elles. Cependant, des difficultés persistent pour les PDF non scannés. Étant donné que la configuration des éléments ligne par ligne n'est pas possible, un numéro peut être confondu avec un autre, et les utilisateurs ne peuvent pas corriger les erreurs ni entraîner le système à trouver le bon élément. Il est donc difficile de créer une base de données de prix uniforme avec les données extraites.
Paramétrabilité⭐⭐⭐✨✨ (3/5)
Parsio offre une fonctionnalité de recherche de champs par requête basée sur GPT-4, permettant l’extraction de données spécifiques à partir des documents. Cependant, cette fonctionnalité ne peut pas être utilisée pour la reconnaissance des éléments ligne par ligne, rendant impossible l’identification des champs pertinents pour tous les services et produits facturés. De plus, elle n’est pas encore combinée avec l’OCR, elle ne peut donc lire que les PDF sources et ne tient pas compte de l’organisation des pages.
Facilité d’utilisation
L’application web génère une adresse email à laquelle les documents peuvent être envoyés. Une large gamme d’intégrations est possible.
Airparser
L’outil s’appuie sur la technologie de GPT-4 pour extraire des champs spécifiques de tout type de documents. Il est construit par le même éditeur que Parsio.
Reconnaissance du ligne à ligne et paramétrabilité⭐⭐⭐✨✨ (4/5)
L'outil permet de paramétrer les champs que l'on souhaite extraire. Grâce a la fonction “liste et table”, on peut extraire des lignes de facturation en définissant les différents attributs de chaque ligne. Pour chaque champs, on ajoute une description qui permet à l'outil d'affiner la précision d'extraction. Les factures “simples” Donne des résultats satisfaisants lorsqu'on précise suffisamment les descriptions de chaque attributs. En revanche, pour les factures complexes, nous avons marqué des confusions entre les colonnes. Le risque d'erreur et notamment plus important en présence de facture scanner.
Base64.ai
Base64 propose un outil d’extraction de facture sur étagère, avec un ensemble de champs extraits de manière systématique.
Reconnaissance du ligne à ligne⭐⭐⭐✨✨ (3/5)
14 parmi les 15 factures “simples” sont extraites avec un bon taux de succès. S’agissant des factures complexes, les difficultés concernant la multiplicité des numéros, les sauts de page ou encore les informations contenues dans le titres ne sont pas relevées pour 5 factures.
Paramétrabilité⭐⭐⭐✨✨ (3/5)
L’outil permet de poser une question sur le document ou ajouter un champ extrait. Il ne permet pas de modifier les champs extraits dans chaque ligne, ni de donner des instructions spécifiques.Facilité d’utilisation. Le temps de réponse peut être d’une minute pour des factures longues. De nombreuses intégrations sont prévues dans les “flows” de gestion de documents.
Docsumo
Docusumo propose un outil sur étagère qui extrait les principaux champs des factures.
Reconnaissance du ligne à ligne⭐⭐✨✨✨ (2/5)
L’outil extrait le ligne à ligne grâce à la détection de tableaux, ressemblant à l’OCR de Nanonets ou Affinda. Cela fonctionne bien lorsque toutes les informations se rapportant à une ligne sont bien alignées. En revanche, pour les tableaux complexes, il n’est pas possible de capter les informations pertinentes.
Paramétrabilité⭐⭐✨✨✨ (2/5)
Une fonctionnalité “ChatAI” permet de poser des questions au document. Cependant, les réponses ne peuvent à ce stade être intégrées de manière systématique aux champs extraits. L’outil ne prévoit pas de fonction pour préciser ou modifier les différents champs extraits ou le ligne à ligne.
Apprenez rapidement comment transformer vos documents contenant des tableaux, des données ligne par ligne ou d'autres structures complexes en données prêtes à être utilisées dans des feuilles de calcul ou Excel. Convertissez les informations non structurées en données organisées et exploitables.