RTFlash

Le deuxième code génétique

L'idée selon laquelle un gène donné code une seule protéine a longtemps prévalu. Ce dogme s'est écroulé dans les années 1980 : un gène peut conduire à plusieurs protéines différentes. Mais les mécanismes sous-jacents au choix de la protéine fabriquée restaient largement inconnus. Une équipe au Canada est parvenue à les éclaircir en partie.

Dans les années 1960, les biologistes ont déchiffré le code génétique, c'est-à-dire le « dictionnaire » qui établit une correspondance entre l'information génétique et les protéines qu'elle code : à chacun des 43 = 64 triplets possibles de bases (A, T, C et G) de l'ADN d'un gène est associé un des 20 acides aminés disponibles (ou une instruction, telle que STOP) de la protéine que ce gène code. Ce dictionnaire, simple et efficace, a contribué à former le dogme « un gène - une protéine » ; et tant pis pour l'ARN, la molécule intermédiaire par laquelle l'information génétique est transcrite puis traduite en protéines.

Cependant, les ARN sortirent rapidement de l'ombre et on leur découvrit plusieurs rôles incontournables dans la vie cellulaire : on ne pouvait plus les négliger ! Parmi ces fonctions, l'une des plus étonnantes est l'épissage alternatif : il s'agit d'un phénomène grâce auquel un seul gène peut coder plusieurs protéines, parfois plusieurs milliers. Par exemple, les trois gènes nommés neurexin codent plus de 3 000 protéines qui participent à l'établissement des synapses dans le cerveau. Dès lors, on comprend mieux comment l'être humain, avec « seulement » quelque 20 000 gènes, peut disposer d'un nombre bien supérieur de protéines.

Toutefois, on ignorait tout de la logique du fonctionnement de cette « source de complexité ». L'enjeu est d'importance quand on sait qu'une perturbation de l'épissage alternatif conduit parfois à des maladies. Yoseph Barash, Brendan Frey et Benjamin Blencowe, de l'Université de Toronto, au Canada, et leurs collègues ont réussi à y voir plus clair dans ce désordre apparent.

Comment fonctionne l'épissage alternatif ? Chez les eucaryotes (les organismes, tel l'être humain, dont les cellules sont pourvues de noyaux), les gènes ne sont pas d'un seul tenant, mais constitués de plusieurs fragments, les exons et les introns : seuls les premiers participent au codage des protéines. Lors de l'épissage, les introns sont éliminés et les exons sont raboutés en un ARN messager dit mature : c'est lui qui est ensuite traduit en protéine.

Mais parfois, certains exons sont eux aussi mis de côté et n'interviennent donc pas dans la fabrication de la protéine. Ainsi, à partir d'un nombre donné d'exons dans un gène, c'est tout une combinatoire qui est autorisée.

L'une des difficultés pour comprendre les ressorts de l'épissage alternatif est qu'il dépend des séquences à la frontière des introns et des exons, mais aussi d'une multitude d'autres séquences, situées dans les exons et dans les introns. Ces séquences dites auxiliaires sont reconnues par des facteurs de régulation qui favorisent ou à l'inverse empêchent l'épissage de tel ou tel morceau. Une autre difficulté tient aux effets variables d'une séquence auxiliaire selon sa position dans le gène. Comment s'y retrouver dans cet imbroglio de relations ?

L'équipe canadienne a utilisé deux types d'informations : d'abord, une liste de près de 3 000 exons de gènes liés à quatre types de tissus différents (cerveau, muscle, cellules embryonnaires, tube digestif) ; ensuite, un répertoire de milliers de séquences auxiliaires (identifiés par des années de travaux de différentes équipes). Les biologistes ont aussi tenu compte de l'organisation spatiale des exons et des introns. L'ensemble de ces données a alimenté un algorithme informatique qu'ils ont mis au point et qui a livré de nombreux résultats.

Le programme a identifié les exons alternatifs (ceux qui ne sont pas gardés à chaque fois) ainsi que leur destin (conservation ou élimination) selon les tissus où le gène s'exprime. En outre, il a identifié les combinaisons de motifs (séquences frontières, séquences auxiliaires, etc.) qui correspondent le mieux à telle ou telle sélection d'exons. L'algorithme a aussi mis en évidence une classe d'exons, inconnue jusqu'alors, dont l'inclusion, qui conduit à des protéines non fonctionnelles, est fréquente lorsqu'on passe de tissus embryonnaires à des tissus adultes. Ce nouveau code a été mis au jour, qui éclaire la mécanique des réarrangements d'information génétique contenus dans les gènes selon les cellules.

PLS

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

Recommander cet article :

back-to-top