RTFlash

Les IA d’Alibaba et Microsoft battent les humains à la lecture

L’intelligence artificielle a franchi une nouvelle étape : deux système développés par Alibaba et Microsoft ont en effet réussi à battre l’être humain à un test de lecture.

Le Stanford Question Answering Dataset (SQuAD) est un test de lecture de référence qui consiste à poser plus de 100 000 questions à partir de 500 articles Wikipédia. Il s'agit de questions fermées, ne faisant pas appel à l'interprétation : “En quelle année Genghis Khan est mort ?” ou bien “Combien de huguenots ont fui la France dans les années 1700 ?” Le site recense les meilleurs performances des IA et l’on peut constater que d’autres acteurs sont dans la course : Salesforce, Samsung ou encore Tencent.

Selon l’Institute of Data Science and Technologies (iDST) d’Alibaba, l’IA qu’ils ont développé a obtenu un score de 82,44 contre 82,304 pour l’humain si on considère la notation Exact Match (qui ne prend en compte que les réponses exactes). Sur le même test, l’IA de Microsoft Research Asia a obtenu un résultat de 82,65.

Pranav Rajpurkar, doctorant à l’Université de Stanford travaillant dans le projet SQuAD, s’enthousiasme de ces résultats et pose déjà un nouveau défi aux intelligences artificielles : battre l’humain sur la notation F1 qui prend en compte la précision mais aussi le rappel, c’est-à-dire la capacité à retrouver de nombreux documents pertinents pour la question posée.

Alibaba souhaite exporter cette technologie à ses clients dans un futur proche et vante la valeur commerciale de son IA : “Alibaba a utilisé cette technologie plusieurs années pour son 11.11 Global Shopping Festival, avec des machines répondant à de larges quantités de demandes des clients”.

D’autres applications commerciales sont envisageables pour le traitement du langage naturel, notamment dans les services à la clientèle : l’élaboration de tutoriels pour les visiteurs de musées ou la réponse aux questions médicales de patients.

Microsoft souligne les avantages d’une telle technologie pour les métiers de la recherche, de l’expertise ou de la justice. Un avocat pourrait ainsi retrouver rapidement toutes les occurences d’un mot dans une montagne de documents. Et, à la manière du logiciel d’analyse criminelle Anacrim, qui balaye de grandes quantités d’informations pour déceler de nouvelles pistes d’enquête, une IA bien dressée pourrait faire émerger dans les textes les plus classiques des sens auxquels l’humain n’aurait pas songé.

Article rédigé par Georges Simmonds pour RT Flash

L'Usine Digitale

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

Recommander cet article :

back-to-top