LAD RAD OCR : De quoi parle-t-on ?

lad rad ocr
> ged > numerisation

LAD (lecture automatique de documents), RAD (reconnaissance automatique de documents) et OCR (reconnaissance optique de caractères) sont des notions faisant partie intégrante de la numérisation documentaire et de la gestion électronique de documents (GED). L’objectif de ces applications, outils et technologies est de rendre la GED plus performante et adaptée aux utilisateurs. Mais en quoi cela consiste réellement ?

Un projet de numérisation ? Demandez votre devis

LAD : Une numérisation par lecture automatique de documents

La lecture automatique de documents, aussi appelée LAD est un ensemble des technologies (OCR, RAD, ICR…) qui permet lors de la numérisation de lire et de récupérer de multiples informations et contenus sur tout type de document physique. Cet ensemble de technologies, complémentaire à la gestion électronique de documents, rend possible une capture très rapide des données. Les informations extraites peuvent alors être utilisées comme métadonnées dans un système de GED, facilitant ainsi leurs recherches.

La LAD regroupe trois technologies indispensables à son fonctionnement :

  • La RAD : reconnaissance automatique de documents
  • L’OCR : reconnaissance optique des caractères
  • L’IRC : reconnaissance intelligente de caractères

RAD : Une reconnaissance automatique pour un classement efficace des documents

La RAD ou reconnaissance automatique de documents est une application qui permet de numériser un document à l’aide d’un scanner via le principe de la LAD et d’un logiciel d’OCR. La technologie LAD RAD consiste à reconnaitre le type du document à traiter en s’appuyant sur différents critères et contraintes (reconnaissance caractères numérique, alpha, codes barre…) définis par la GED. Ces critères peuvent renvoyer à des logos des codes-barres, l’emplacement d’image ou d’encadré présents sur le document. Cette technologie permet alors de déterminer la nature des documents numérisés (devis, facture, commande…) pour un classement efficace des informations.

Les bénéfices :

  • Accroissement de votre productivité : Les opérations manuelles qui vous font perdre du temps sont remplacées par des processus de capture de données entièrement automatisés.
  • Réduction des coûts opérationnels : Les coûts de gestion manuelle des documents sont réduits. Il en est de même des efforts liés à l’extraction.

Découvrez nos solutions numérisation

OCR : Une technologie intelligente de capture de données

La technologie OCR, ou autrement appelé vidéocodage, consiste à lire et à analyser un texte (formes des mots, des caractères…) pour en produire une version informatique au format d’un fichier texte. La reconnaissance optique de caractères permet de capturer les informations, de les analyser (détection des formes et comparaison à des bibliothèques de formes pour en faire correspondre un caractère ou un mot), de les traiter pour enfin en comprendre les données. Ainsi, toutes les lignes du texte sont définies en mots et en caractères. Cette saisie peut soit être réalisée à partir d’un scanner lorsque le texte est au format papier soit être directement reconnue s’il s’agit d’une image numérique.

Les bénéfices :

  • Des documents reconnus ont la même mise en page que les originaux.
  • Création rapide de vos propres documents sans devoir les ressaisir manuellement.
  • Possibilité de capturer des textes sur tous types de documents rencontrés : affiches, posters, panneaux de signalisation, articles de presse…

Attention : Ne pas confondre OCR et ICR (reconnaissance intelligente de caractères). Dans le cas d’un document manuscrit, on favorisera davantage la technologie ICR à l’OCR. En effet, L’IRC intègre la reconnaissance de caractères manuscrits. Elle peut reconnaitre une multitude de matrices potentielles (toutes les lettres de l’alphabet, ainsi tous les styles calligraphiques même les plus maladroits) grâce à sa base de caractère qui peut continuellement être enrichie par l’apprentissage.