RTFlash

l'Institut Curie veut prédire l'efficacité des traitements contre le cancer du sein grâce à l'IA

L'Institut Curie à Paris et le Centre Léon Bérard à Lyon – tous deux spécialisés dans les traitements contre les cancers – ont développé un modèle prédictif applicable au cancer du sein dit "triple négatif". Il s'agit d'un groupe de tumeurs caractérisées par l'absence de récepteurs hormonaux (progestérone et œstrogènes) et de la protéine HER2 à la surface de leurs cellules.

Les deux structures viennent de présenter les résultats de ce projet à l'histoire assez particulière. Dans les détails, ce projet s'inscrit dans l'initiative "HealthChain" (anciennement baptisée Substra) qui a bénéficié d'un financement de 10 millions d'euros de la part de Bpifrance dans le cadre des Grands Défis du Numérique du Programme d’Investissement d’Avenir (PAI).

Le projet "HealthChain" a été officiellement lancé en juin 2018. Il rassemble 9 partenaires : les start-up Owkin et Apricity, l'Institut Curie, le Centre Léon Bérard, le CHU de Nantes, l'Université Paris Descartes, l'Assistance Publique – Hôpitaux de Paris avec trois hôpitaux impliqués (Saint-Louis, Antoine-Béclère et Jean Verdier) et l'association Labelia Labs (ex Substra Foundation).

L'objectif de ce projet, dont le financement de Bpifrance vient de se terminer, était de "développer une technologie d'apprentissage fédéré" appliquée à des cas d'usage dans la santé, détaille Anne-Laure Moisson, chef de produit au sein d'Owkin et coordinatrice du projet, sollicitée par L'Usine Digitale. En pratique, « cette technologie permet d'entraîner des modèles de machine learning sur des données sans les regrouper », ajoute-t-elle. « Autrement dit, les modèles sont entraînés localement ».

Cette pratique est particulièrement adaptée à la manipulation des données de santé. En effet, les hôpitaux ou instituts peuvent être réfractaires à l’idée de partager leurs données avec des tiers. Ici, les modèles voyagent d'un centre à l'autre mais les données restent stockées sur des serveurs en local. Ainsi, au travers d’un système sécurisé, HealthChain fédère les fournisseurs de données comme les hôpitaux pour valoriser leurs informations et les utiliser à des fins de recherches médicales dans un cadre protecteur de la confidentialité des données.

Pour réussir ce pari ambitieux, les partenaires ont endossé chacun un rôle bien précis. Owkin et Labelia Labs ont été chargés de développer la plate-forme open source de traitement sécurisé des données médicales. La jeune pousse, accompagnée par Apricity, a aussi travaillé sur le développement de systèmes d'apprentissage prédictifs à partir des données mises à disposition par les centres médicaux. En pratique, pour chaque partenaire, Owkin a installé des serveurs pour développer les algorithmes de deep learning sans que les données ne soient regroupées au sein d'une base unique.

Pour développer des modèles reposant sur l'apprentissage fédéré, trois cas d'usages ont été sélectionnés par les partenaires. Le CHU de Nantes et l'AP-HP ont travaillé sur le mélanome (cancer de la peau). L'hôpital nantais a également collaboré avec l'entreprise Apricity sur le sujet de la fertilité. Le premier projet porte sur la prédiction du nombre d'ovocytes recueillis dans le cadre d'une stimulation hormonale. Le second vise à identifier les embryons viables.

Le projet le plus avancé, dont les travaux ont été soumis à la revue scientifique Nature Medicine pour publication, reste celui mené par l'Institut Curie et le Centre Léon Bérard situé à Lyon. Ils se sont intéressés au cancer du sein "triple négatif" car « ce sont des tumeurs de mauvais pronostic et de pronostics très différents », détaille Alain Livartowski, oncologue et chargé des programmes d'e-santé à la direction des données de l'Institut Curie.

Les équipes des centres médicaux cherchent à comprendre pourquoi « dans certains cas, des patients vont guérir rapidement et d'autres vont récidiver », ajoute le médecin. Qu'est-ce qui différencie ces patientes, se demandent-elles ? Pour essayer de trouver une réponse à cette question qui pourrait considérablement améliorer le traitement de ces personnes, une cohorte de "500 à 600" patientes a été sélectionnée.

Plus précisément, le modèle a été développé et entraîné à partir des données issues des lames histologiques des tumeurs (coupe d'un tissu biologique observé au microscope). « Dans de nombreux cas, il a été démontré que le phénotype [ensemble des caractères observables chez un individu, résultant de l'interaction entre son génotype et les effets de son environnement, ndlr] des lames histologiques pourrait donner des informations très importantes pour mieux classifier les cancers et prédire l'efficacité des traitements », explique Alain Livartowski.

Le modèle en cours de développement « permettra de différencier le phénotype des lames histologiques », note le médecin. Le but : "créer des clusters de patientes" ayant des caractéristiques communes et leur proposer le traitement le plus adapté. A titre d'exemple, il explique que lorsque sont mis en évidence "des récepteurs aux œstrogènes" dans le cas d'un cancer du sein, des thérapies ciblées existent permettant d'agir efficacement contre la cellule cancéreuse.

Le défi est de taille car ce sont des données dites de "vie réelle", c'est-à-dire des données qui ont été générées à l'occasion de soins réalisés en routine, par opposition aux données "cliniques" plus simples à exploiter. « Dans la vie réelle, contrairement à des recherches menées en laboratoire, personne n'a les mêmes techniques ni les mêmes outils pour numériser les lames », dépeint l'oncologue. « Les données ne sont pas non plus structurées de la même façon et les médecins n'utilisent pas les mêmes traitements ».

Article rédigé par Georges Simmonds pour RT Flash

L'Usine Digitale

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

Recommander cet article :

back-to-top