Wizidee a dit...
Posté le
Wizidee décrypte l’info
Lecture : 5 min.

Comment les solutions de traitement documentaire utilisent-elles l’IA pour garantir la conformité des documents ?

Depuis ChatGPT, Midjourney, Sparrow et autres logiciels d’open AI, les prouesses de l’intelligence artificielle sont au cœur de l’actualité et fascinent le grand public pour leur capacité à créer des contenus à partir de « rien ». Pour y parvenir, ces technologies s’appuient sur des réseaux de neurones profonds, tout comme de nombreuses solutions digitales utilisées au quotidien par tous types de secteurs d’activité : banque, assurance, mobilité, jeux en ligne, etc. Pour les entreprises, l’intelligence artificielle (et ses sous-disciplines) est un outil efficace pour laisser la technologie gérer en toute autonomie les démarches clients. C’est le cas notamment pour la digitalisation du traitement documentaire et de la vérification d’identité. Je vous explique comment fonctionnent ces solutions digitales intégrées au parcours client, pour parvenir à analyser des documents et leurs données avec autant, parfois plus, de précision que l’œil humain.

Le Machine Learning pour entrainer la solution

Une solution de traitement documentaire performante est une solution conçue à partir de technologies apprenantes capables d’évoluer en toute autonomie pour devenir de plus en plus efficaces. C’est le principe du Machine Learning. Cette forme d’intelligence artificielle permet à la solution de s’adapter à tous les types de documents rencontrés et d’apprendre en toute autonomie les éléments caractéristiques d’un type de document. Pour y parvenir, elle va d’abord s’entrainer avec un référentiel de documents donné. Puis la structure de chaque nouveau document rencontré va venir compléter et étoffer ce corpus d’apprentissage.

Cette adaptabilité est un véritable atout pour les entreprises. Prenons l’exemple d’un assureur qui choisit une solution de RAD-LAD dotée de cette technologie pour vérifier les justificatifs de domicile de ses clients. S’il souhaite, 6 mois plus tard, vérifier également les RIB, la solution n’a pas besoin d’être mise à jour ou redéveloppée par son éditeur. Bien qu’elle n’ait pas été « pré-programmée » pour vérifier un RIB, elle est capable de s’adapter et d’apprendre un nouveau document en toute simplicité.

Le Deep Learnig pour exploiter des données non structurées

Le Deep Learning est l’une des technologies du Machine Learning. Cet algorithme est composé de plusieurs réseaux de neurones artificiels capables d’intégrer des informations et de les interpréter pour en tirer des conclusions.

L’objectif est de parvenir à extraire des données de n’importe quel document. Par exemple, la difficulté sur un justificatif de domicile est qu’il n’existe pas de modèle type, chaque client va présenter un justificatif différent en fonction de son fournisseur d’électricité, d’Internet, etc. Le Deep Learning va donc permettre d’identifier des données non structurées sur des documents complexes, quelle que soit leur mise en page.

Pour cela, l’algorithme n’a besoin que de très peu de données. La technologie utilisée se base davantage sur un mécanisme d’attention et sur la « Key information extraction » : elle peut autant se focaliser sur la forme d’un document, l’agencement des informations, que sur la recherche de certains mots, sur la position d’un mot dans une phrase, sur l’agencement des informations autour d’un mot, etc. Ce sont donc les éléments de contexte environnants qui priment dans l’analyse du document pour, in fine, extraire et interpréter de façon extrêmement ciblée des données.

L’OCR pour transformer un document numérisé en texte

La reconnaissance optique de caractères (OCR) est complémentaire aux technologies précédentes et permet de reconnaitre du texte sur une image, ou tout document numérisé. Dès ses débuts, l’OCR a permis aux entreprises de gagner un temps fou en numérisant leur courrier entrant pour en exploiter les données. Le système permet par exemple aux banques de numériser en quelques secondes tous les chèques reçus et d’en extraire le montant, le numéro de compte du détenteur et du destinataire.

Cette technologie utilise également des algorithmes pour reconnaitre les mots, tels des motifs, et les extraire. Elle est très performante pour des documents structurés mais se limite à l’extraction des données. Elle n’intervient donc pas pour comparer les informations entre plusieurs documents et vérifier leur cohérence et leur conformité.

Le face matching pour comparer photo et visage

Enfin, la dernière technologie généralement utilisée par une solution d’onboarding complète est le face matching. Ce procédé permet de vérifier l’identité d’une personne à distance en comparant son visage (via la caméra d’un téléphone par exemple) à la photo présente sur la carte d’identité fournie.

Ce système repose sur une intelligence artificielle, mais chaque solution digitale possède ses propres méthodes de vérification, avec des IA plus ou moins puissantes. Pour faire la preuve du vivant, c’est-à-dire vérifier qu’il ne s’agit pas d’une photo ou d’une vidéo, mais bien de la personne concernée, certaines solutions vont par exemple s’appuyer sur l’exécution de mouvements et d’autres vont pousser plus loin l’analyse pour se focaliser uniquement sur un ensemble de micro-détails.

Toutes ces technologies sont donc complémentaires et permettent aux solutions de traitement documentaire et de vérification d’identité d’extraire instantanément des données issues de tous types de documents tout en garantissant leur conformité. Une prouesse de plus sur le CV de l’intelligence artificielle !

Vous avez aimé cet article ?
Partagez-le
FacebookTwitterLinkedIn