• Le deuxième code génétique

    Un même gène peut coder des protéines différentes selon le type de cellules où il s'exprime. Désormais, on comprend un peu mieux les règles qui gouvernent cette diversité.

    Loïc Mangin

    L'idée selon laquelle un gène donné code une seule protéine a longtemps prévalu. Ce dogme s'est écroulé dans les années 1980 : un gène peut conduire à plusieurs protéines différentes. Mais les mécanismes sous-jacents au choix de la protéine fabriquée restaient largement inconnus. Une équipe au Canada est parvenue à les éclaircir en partie.

    Dans les années 1960, les biologistes ont déchiffré le code génétique, c'est-à-dire le « dictionnaire » qui établit une correspondance entre l'information génétique et les protéines qu'elle code : à chacun des 43 = 64 triplets possibles de bases (A, T, C et G) de l'ADN d'un gène est associé un des 20 acides aminés disponibles (ou une instruction, telle que STOP) de la protéine que ce gène code. Ce dictionnaire, simple et efficace, a contribué à former le dogme « un gène – une protéine » ; et tant pis pour l'ARN, la molécule intermédiaire par laquelle l'information génétique est transcrite puis traduite en protéines.

    Cependant, les ARN sortirent rapidement de l'ombre et on leur découvrit plusieurs rôles incontournables dans la vie cellulaire : on ne pouvait plus les négliger ! Parmi ces fonctions, l'une des plus étonnantes est l'épissage alternatif : il s'agit d'un phénomène grâce auquel un seul gène peut coder plusieurs protéines, parfois plusieurs milliers. Par exemple, les trois gènes nommés neurexin codent plus de 3 000 protéines qui participent à l'établissement des synapses dans le cerveau. Dès lors, on comprend mieux comment l'être humain, avec « seulement » quelque 20 000 gènes, peut disposer d'un nombre bien supérieur de protéines.

    Toutefois, on ignorait tout de la logique du fonctionnement de cette « source de complexité ». L'enjeu est d'importance quand on sait qu'une perturbation de l'épissage alternatif conduit parfois à des maladies. Yoseph Barash, Brendan Frey et Benjamin Blencowe, de l'Université de Toronto, au Canada, et leurs collègues ont réussi à y voir plus clair dans ce désordre apparent.

    Comment fonctionne l'épissage alternatif ? Chez les eucaryotes (les organismes, tel l'être humain, dont les cellules sont pourvues de noyaux), les gènes ne sont pas d'un seul tenant, mais constitués de plusieurs fragments, les exons et les introns : seuls les premiers participent au codage des protéines. Lors de l'épissage, les introns sont éliminés et les exons sont raboutés en un ARN messager dit mature : c'est lui qui est ensuite traduit en protéine. Mais parfois, certains exons sont eux aussi mis de côté et n'interviennent donc pas dans la fabrication de la protéine. Ainsi, à partir d'un nombre donné d'exons dans un gène, c'est tout une combinatoire qui est autorisée.

    L'une des difficultés pour comprendre les ressorts de l'épissage alternatif est qu'il dépend des séquences à la frontière des introns et des exons, mais aussi d'une multitude d'autres séquences, situées dans les exons et dans les introns. Ces séquences dites auxiliaires sont reconnues par des facteurs de régulation qui favorisent ou à l'inverse empêchent l'épissage de tel ou tel morceau. Une autre difficulté tient aux effets variables d'une séquence auxiliaire selon sa position dans le gène. Comment s'y retrouver dans cet imbroglio de relations ?

    L'équipe canadienne a utilisé deux types d'informations : d'abord, une liste de près de 3 000 exons de gènes liés à quatre types de tissus différents (cerveau, muscle, cellules embryonnaires, tube digestif) ; ensuite, un répertoire de milliers de séquences auxiliaires (identifiés par des années de travaux de différentes équipes). Les biologistes ont aussi tenu compte de l'organisation spatiale des exons et des introns. L'ensemble de ces données a alimenté un algorithme informatique qu'ils ont mis au point et qui a livré de nombreux résultats.

    Le programme a identifié les exons alternatifs (ceux qui ne sont pas gardés à chaque fois) ainsi que leur destin (conservation ou élimination) selon les tissus où le gène s'exprime. En outre, il a identifié les combinaisons de motifs (séquences frontières, séquences auxiliaires, etc.) qui correspondent le mieux à telle ou telle sélection d'exons. L'algorithme a aussi mis en évidence une classe d'exons, inconnue jusqu'alors, dont l'inclusion, qui conduit à des protéines non fonctionnelles, est fréquente lorsqu'on passe de tissus embryonnaires à des tissus adultes.

    En fin de compte, un nouveau code a été mis au jour, qui éclaire la mécanique des réarrangements d'information génétique contenus dans les gènes selon les cellules. Ce code gagnera sans doute en précision à mesure qu'il sera testé (et conforté) par les innombrables résultats d'analyses à haut débit effectuées par les biologistes du monde entier, notamment avec d'autres types de tissus que ceux étudiés ici.

    Le deuxième code  génétique
    © F. Dardel

    L'ARN est une molécule qui ressemble à l'ADN, mais ses rôles sont beaucoup plus diversifés.

    à voir aussi

    © G. Johnson/HHMI
    La transcription d’un gène (ADN) en un ARN messager destiné à être traduit en protéines est un mécanisme complexe.
    © Benoît Bely
    Le principe de l’épissage alternatif. Un gène (en jaune) est constitué de plusieurs parties codantes, des exons (en vert, en rouge et en bleu), séparées par des introns. Lors de l’épissage, ces derniers sont éliminés et les exons raboutés de façon à composer un ARN messager mature. Cependant, tous les exons ne sont pas nécessairement conservés. Ici, selon que l’exon rouge l’est ou non, on obtient deux protéines distinctes.
    © B. Frey & B. Blencowe
    Chaque ligne joint un « code » (un motif d’ADN) et l’ARN messager de la protéine particulière dont il contrôle la fabrication dans un tissu donné (les couleurs). Par exemple, le motif Cugbp participe à l’épissage alternatif de l’ARN d’une protéine dans les tissus embryonnaires.

    L'auteur

    Loïc Mangin est rédacteur en chef adjoint à Pour la Science.

    Pour en savoir plus

    Y. Barash et al., Deciphering the splicing code, Nature, vol. 465, pp. 53-59, 6 mai 2010.
     
    F. Schweighoffer et O. Cochet, Un même gène pour plusieurs protéines, Dossier Pour la Science n° 46, janvier-mars 2005.

  • Commentaires

    Aucun commentaire pour le moment

    Suivre le flux RSS des commentaires


    Ajouter un commentaire

    Nom / Pseudo :

    E-mail (facultatif) :

    Site Web (facultatif) :

    Commentaire :