Dans un contexte de digitalisation croissante de la comptabilité, entreprises et professionnels du chiffre misent sur la reconnaissance optique des caractères pour gagner du temps dans la saisie et le traitement des factures. Mais cette technologie a aussi ses limites. Ajout ou confusion de caractères, mauvaise interprétation des données… les systèmes OCR comportent un risque d’erreurs non négligeable susceptible de conduire à des trop-payés. En avoir conscience permet d’envisager des solutions pour récupérer les montants en jeu.
Si le cerveau humain n’est pas infaillible, les machines ne le sont pas non plus. De plus en plus utilisés dans le cadre des processus de dématérialisation des factures, les systèmes de reconnaissance optique des caractères (OCR), certes très utiles, présentent ainsi des limites. Des failles susceptibles de provoquer des erreurs, parfois coûteuses…
→ Lire aussi notre article La dématérialisation comptable n'exclut pas le contrôle
Les OCR, des solutions plébiscitées pour automatiser les processus comptables
L’OCR (Optical Character Recognition, ou Reconnaissance Optique de Caractères) est une technologie permettant de « traduire » une image en un fichier texte. Elle sert notamment à automatiser la saisie des factures dans un contexte de dématérialisation croissante où les acteurs économiques ont à traiter à la fois des factures papier et des factures numériques.
La facture est scannée puis analysée par le système, qui va y reconnaître les caractères. Grâce à des technologies d’extraction intelligente des données et au machine learning, l’OCR est capable de retrouver les différentes informations de la facture et d’en effectuer la traduction comptable.
En investissant dans de telles solutions, les entreprises et les cabinets comptables cherchent donc à gagner en temps et en efficacité dans le traitement des factures.
Une efficacité imparfaite qui entraîne un risque d’erreur
Les solutions OCR ne sont cependant pas infaillibles. Des erreurs sont susceptibles de se produire si le scan est de mauvaise qualité, par exemple si des poussières sont présentes sur la vitre du scanner, ou lorsque des froissements perturbent la lecture du document.
En outre, ces technologies peinent encore à convertir de l’écriture manuscrite. Et même pour des caractères numériques, certaines polices peuvent poser problème.
Pour bien fonctionner, l’OCR a notamment besoin de répétitions dans les schémas de présentation des documents. Certains systèmes sont paramétrés pour identifier des mots-clefs en face desquels ils s’attendent à trouver telle ou telle information. Or si plusieurs données sont présentes sur un document, ce sont les premières données répondant au format attendu qui seront enregistrées…
Si le paramétrage du système peut éviter certains contresens, une période d’adaptation demeure nécessaire et des erreurs peuvent toujours avoir lieu si le document soumis ne correspond pas au schéma habituel. Par exemple, le paramétrage peut être calibré pour reconnaître les différents éléments clés sur un formalisme de facture d’un fournisseur spécifique. Il suffit alors que le fournisseur modifie le modèle de facturation et les éléments qui le composent pour risquer une erreur.
Des erreurs fréquentes et variées
L’expérience de Runview prouve que le risque d’erreur de l’OCR, souvent sous-estimé, est pourtant bien réel. De nombreuses anomalies repérées dans les écritures comptables de nos clients trouvent leur origine dans des défaillances de leur OCR.
Le système confond parfois certains caractères et interprète par exemple un I pour un l, un 0 pour un O, un 8 pour un B... Une poussière sur la vitre du scanner peut aussi se transformer en un point ajouté à la donnée.
Les consultants Runview ont aussi constaté qu’un même numéro de facture pouvait être intégré une fois avec des espaces, et une autre sans tenir compte des espaces.
Il arrive aussi fréquemment que le système confonde des références. Chez l’un de nos clients, pour un même fournisseur et sur des factures affichant une présentation identique, un OCR a ainsi parfois intégré le numéro de facture, renseigné classiquement en haut à droite du document, dans le champ correspondant. Mais, une autre fois, il a saisi à la place le numéro de commande pourtant situé dans le corps de la facture.
Ces confusions peuvent ainsi être source de trop-payés fournisseurs ou d’erreur sur le traitement de la TVA. Alors que les solutions OCR empêchent théoriquement de saisir deux fois la même facture, les failles de retranscription rendent cela possible. Dans le cadre d’une mission récemment menée chez un client, 500 000€ de doubles paiements identifiés étaient liés à des erreurs de son OCR.
Des vérifications nécessaires
Si le système OCR est une technologie facilitatrice qui présente de nombreux avantages pour la profession comptable, quel que soit l’éditeur de la solution, des erreurs peuvent se produire… Et elles ne sont pas toujours repérées. Que la comptabilité soit gérée en interne ou tenue par un cabinet d’expertise comptable, les professionnels doivent traiter un nombre considérable de pièces dans des délais très courts, et ont rarement la possibilité de vérifier l’intégralité des factures. Ils n’ont, en outre, pas toujours connaissance des failles potentielles d’un système OCR.
En prendre conscience permet d’accentuer les contrôles. Certains défauts peuvent en effet être corrigés. On peut ainsi supprimer les erreurs liées à la prise en compte aléatoire des espaces en interdisant leur saisie dans les numéros de facture via le paramétrage de l’OCR. Mais le risque zéro n’existe pas et d’autres anomalies peuvent subsister. La mise en œuvre régulière d’une analyse exhaustive des écritures comptables peut alors être envisagée afin de les identifier.
A propos de l'auteur
Managing Director - Opérations
Après son diplôme à l’EDHEC Business School, Yasmine occupe plusieurs postes en tant que Commissaire aux Comptes dans des cabinets d’audit. Elle rejoint Runview en 2012 et prend la tête des Opérations des missions d’audit.
Tous ses articles