RTFlash

Quand l’intelligence artificielle apprend à flairer des molécules inédites

La nature recèle une infinité de molécules potentiellement utiles (médicaments, arômes, matériaux…) et nombre d’entre elles n’ont encore jamais été identifiées. Mais les découvrir, c’est un peu chercher une aiguille… dans une botte de données ! Les chimistes en quête de nouvelles molécules naturelles s’appuient sur la spectrométrie de masse, une technique qui mesure la masse des fragments d’une molécule lorsqu’elle se décompose après ionisation. La manière dont une molécule se casse et la masse de ses fragments, mesurée très finement par l’appareil, dépendent directement de sa structure chimique.

En comparant ces "signatures spectrales" à celles de molécules connues, on peut déduire la composition de l’échantillon et parfois même identifier de nouveaux composés. Ces analyses génèrent des montagnes de données qu’il faut interpréter. Jusqu’ici, les scientifiques devaient comparer manuellement les résultats de plusieurs logiciels qui assignent un signal à une structure, chacun fondé sur des bases de données et des modèles différents, qui ne s’accordent pas toujours, au risque de passer à côté d’une découverte.

Pour sortir de cette impasse, une équipe interdisciplinaire1 de chimistes et informaticiens du CNRS, de l’Université Paris-Saclay et de l’Université Paris Sciences & Lettres2 a conçu MS2DECIDE, un programme qui joue le rôle d’arbitre intelligent entre ces outils. Inspiré de la théorie de la décision, il apprend à combiner les résultats des différents logiciels en tenant compte de leur fiabilité et de leur degré d’accord, comme le ferait un expert humain. Le programme calcule ainsi un score de "knownness", qui permet de classer toutes les molécules présentes dans un échantillon naturel selon leur probabilité d’être déjà connues et répertoriées dans les bases de données. Plus ce score est faible, plus la molécule a des chances d’être nouvelle.

Testé sur une centaine de composés mélangés dans un échantillon "artificiel", dont six jamais identifiés, MS2DECIDE a classé toutes les nouvelles molécules dans les dix premières positions. Dans un second essai, cette fois réel, il a été appliqué à un échantillon d’une plante africaine, Pleiocarpa mutica, connue pour contenir des alcaloïdes indolomonoterpéniques, molécules naturelles complexes aux propriétés biologiques souvent remarquables (antitumorales, antipaludiques, analgésiques...). Le programme a mis en avant un alcaloïde inédit dont les propriétés pourront à présent être évaluées.

L’outil, présenté dans la revue Chemistry-Methods, pourrait transformer la prospection chimique. À terme, chaque laboratoire pourrait même ajuster MS2DECIDE, en accès libre, à son propre savoir-faire, pour que la machine adopte le “regard” du chimiste. Une alliance prometteuse entre raisonnement humain et intelligence algorithmique.

CNRS du 28.10.2025 : https://www.inc.cnrs.fr/fr/cnrsinfo/quand-lintelligence-artificielle-apprend-flairer-des-molecules-inedites

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

Recommander cet article :

back-to-top