RTFlash

Les ordinateurs apprennent à lire

Un formulaire de la Sécu, ça se remplit avec soin ! D'autant plus qu'aujourd'hui, c'est un ordinateur qui est chargé de la lecture. Un exploit que ces machines parviennent à réaliser grâce à un « réseau de neurones artificiels ». Explication : les ordinateurs classiques, en déroulant bêtement leurs algorithmes, suites d'instructions logiques, sont trop obtus pour raisonner sur le flou artistique de l'écriture manuelle. Si on lui demande de reconnaître un 8 écrit à la main, le pauvre ordinateur classique ne comprendra même pas la question. Car il existe autant de façons d'écrire le chiffre 8 qu'il y a de personnes sur notre planète. Or il n'est pas question d'apprendre à un ordinateur la façon de faire les 8 de plusieurs milliards d'individus. C'est là qu'interviennent les fameux réseaux neuronaux. Eux vont déduire la signification d'une forme nouvelle en la comparant à une forme qu'ils connaissent déjà et qui lui ressemble. Ce travail est réalisé par de petits sous-programmes, que les informaticiens ont appelés « neurones », car, comme les neurones du cerveau, ils sont reliés les uns aux autres et communiquent entre eux en s'échangeant une grande quantité d'informations. Grosso modo, ils procèdent, pas à pas, de la façon suivante : « J'ai une forme non connue ! », « Cette forme ressemble à quelque chose que j'ai déjà vu ! », « On dirait un 8 ou un B ! », « Il y a 90 % de chances que ce soit un 8 et 10 % que ce soit un B ! », « Je pense alors qu'il s'agit d'un 8 ! ». C'est donc après cette rapide « concertation » qu'une solution est proposée. Généralement, ces « neurones virtuels » s'en sortent plutôt bien. Mais quelquefois cela peut capoter. Par exemple, entre un 0 (zéro) et la lettre O, tout deux écrits à la main, ils ne sauront choisir. Sauf si on leur a appris qu'il y a plus de chances de trouver un chiffre dans un ensemble de chiffres, et une lettre au milieu d'autres lettres. « S'il y a un doute entre plusieurs solutions, les réseaux neuronaux regardent ce qu'il y a autour pour trouver d'autres indices. Ils prennent en compte le contexte », commente Jean-Marc Pédréno, directeur de recherche et développement chez Itesoft, un des leaders européens sur le marché des logiciels de reconnaissance de caractères. Mieux encore, ayant eu beaucoup de 8 différents à décrypter lors de l'utilisation du programme, la machine se perfectionne. Avec le temps, elle évolue. « Elle s'ouvre l'esprit », assure Jean-Marc Pédréno. Parmi les clients d'Itesoft, outre la Sécu, beaucoup d'entreprises ou d'institutions qui reçoivent quotidiennement des milliers de commandes, de formulaires et de documents divers dont le traitement était laborieux. Les banques aussi utilisent ces réseaux neuronaux pour la gestion des chèques. « Dans cette application, le plus dur fut la reconnaissance de la somme en lettres, car elle est composée de mots, explique Jean-Marc Pédréno. Heureusement, il ne faut guère plus d'une quarantaine de mots pour écrire une somme. » Si performants qu'ils soient, les réseaux de neurones des informaticiens sont donc encore loin de lire une lettre manuscrite comme sait le faire un élève en fin de CP. Avant d'y parvenir, ils devront apprendre à jongler avec les quelques milliers de mots du dictionnaire.

Le Point : http://www.lepoint.fr/data/PNT1473/7304601P.html

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

Recommander cet article :

back-to-top