RTFlash

Des chercheurs de Nvidia et de Harvard utilisent l'IA pour étudier les cellules

Des chercheurs de Nvidia et de Harvard, en utilisant un réseau neuronal développé à l'origine pour la vision par ordinateur, ont mis au point une boîte à outils de deep learning qui peut aider les scientifiques à étudier des types de cellules rares – et éventuellement à identifier les mutations génétiques qui rendent les gens plus vulnérables aux maladies.

Le nouveau kit de deep learning, appelé AtacWorks, « nous permet d'étudier comment les maladies et les variations génomiques influencent des types très spécifiques de cellules du corps humain », expliquait la semaine dernière aux journalistes la chercheuse de Nvidia Avantika Lal, auteure principale de l'article. « Et cela permettra une découverte biologique jusqu'alors impossible, et nous espérons que cela contribuera également à la découverte de nouvelles cibles de médicaments ».

AtacWorks, présenté dans Nature Communications, travaille avec ATAC-seq (Assay for Transposase-Accessible Chromatin with highthroughput sequencing) – une méthode populaire pour trouver les parties du génome humain qui sont accessibles dans les cellules.

Presque toutes les cellules du corps portent une copie de la séquence du génome – une séquence de votre ADN longue d'environ 3 milliards de bases. Cependant, seules certaines parties de la séquence du génome sont accessibles à certaines cellules. Chaque type de cellule – qu'il s'agisse de cellules du foie, du sang ou de la peau – ne peut accéder qu'aux régions de l'ADN dont elles ont besoin pour leur fonction respective. « Cela nous permet de comprendre ce qui rend chaque type de cellule différent des autres, ou comment chaque type de cellule est affecté dans la maladie, ou dans d'autres changements biologiques », indique Avantika Lal.

ATAC-seq trouve ces parties accessibles en produisant un signal pour chaque base du génome. Les pics du signal indiquent les régions accessibles de l'ADN. Cette méthode nécessite généralement des dizaines de milliers de certains types de cellules pour obtenir un signal propre. Il est donc difficile d'étudier des types de cellules rares, comme les cellules souches qui produisent les cellules sanguines et les plaquettes.

Cependant, en appliquant AtacWorks aux données de l'ATAC-seq, les chercheurs ont découvert qu'ils pouvaient compter sur des dizaines de cellules seulement, plutôt que sur des dizaines de milliers. Dans le cadre des recherches décrites dans leur nouvel article, les scientifiques de Nvidia et de Harvard ont appliqué AtacWorks à un ensemble de cellules souches qui produisent des globules rouges et blancs. Ils ont utilisé un échantillon de seulement 50 cellules pour identifier des régions distinctes de l'ADN associées aux cellules qui se développent en globules blancs, ainsi que des séquences distinctes qui sont en corrélation avec les globules rouges.

AtacWorks est un réseau neuronal convolutionnel basé sur PyTorch, qui a été formé sur des paires étiquetées d'ensembles de données correspondantes ATAC-seq – une de haute qualité et une « bruyante ». Le modèle a appris à prédire une version précise de haute qualité d'un ensemble de données et à identifier les pics dans le signal.

Fonctionnant sur les GPU Nvidia Tensor Core, le modèle a pris moins de 30 minutes pour l'inférence sur un génome entier, un processus qui prend normalement 15 heures sur un système avec des CPU à 32 cœurs.

Avantika Lal souligne que les chercheurs ont pu former le modèle sur n'importe quel type de cellule et l'appliquer ensuite à n'importe quel autre type. « C'est vraiment une chose merveilleuse car cela signifie que nous pouvons former des modèles en utilisant toutes les données dont nous disposons et les appliquer ensuite à des échantillons biologiques entièrement nouveaux », précise-t-elle.

Ce modèle pourrait aider à fournir des informations sur toute une série de maladies, notamment les maladies cardiovasculaires, la maladie d'Alzheimer, le diabète ou les troubles neurologiques. Il est disponible sur le NGC Software Hub, le centre de logiciels optimisés pour les GPU de Nvidia, où tout chercheur peut accéder. « Nous espérons qu'une fois notre article publié, d'autres scientifiques travaillant sur différentes maladies adopteront également cette technique et seront intéressés par son utilisation », avance Avantika Lal. « Et nous sommes impatients de voir ce que les nouvelles recherches et les nouveaux développements peuvent permettre ».

Article rédigé par Georges Simmonds pour RT Flash

Zdnet

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

Recommander cet article :

back-to-top