Epissage alternatif
A – Epissage alternatif du gène GH1
a - Le gène de l’hormone de croissance GH1
Les données sur le gène qui code pour l’hormone de croissance GH peuvent être utilisées pour atteindre un des objectifs cognitifs du programme « Un même ARN pré-messager peut subir des maturations différentes et donc être à l’origine de plusieurs protéines différentes. »
· Il existe deux gènes codant pour l’hormone de croissance, GH1 et GH2, situés sur le chromosome 17, associés à deux gènes codant pour l’hormone lactogène placentaire avec lesquels ils forment une famille multigénique. GH1 est exprimé dans les cellules hypophysaires surtout après la naissance ; GH2 est exprimé dans le placenta.
· Ces 4 gènes ont la même structure avec 5 exons et 4 introns.
· Dans les cellules hypophysaires sécrétant l’hormone de croissance, on a mis en évidence 5 variants de l’ARN messager du gène GH1.
- Le variant 1 est constitué par les 5 exons du gène ; il code pour un polypeptide de 22 kilodaltons. Ce dernier représente 90% environ de l’hormone de croissance présente dans les cellules hypophysaires et le plasma.
- Le variant 2 comprend les exons 1, 2, une partie de l’exon 3 et les exons 4 et 5. Il résulte d’un épissage différent du variant 1 qui fait que les 45 premiers nucléotides de l’exon 3 sont éliminés (donc une partie de l’exon 3 est éliminée comme un intron). Cela est dû à la présence au sein de l’exon 3 d’un signal d’épissage, parfois mis en jeu. Ce variant code pour un polypeptide de 20 Kda qui représente 5 à 10% de l’hormone de croissance produite. Ce polypeptide 20Kda semble avoir une activité biologique assez proche de celle du polypeptide 22Kda.
- Le variant 3 comprend les exons 1, 2, 4 et 5. L’épissage amenant à ce variant élimine donc l’exon 3. Il code pour une protéine de 17,5 Kda qui n’a pas d’activité biologique. A la suite de mutations affectant le mécanisme d’épissage, ce variant normalement rare (0,1% à 3%) est produit en plus grande quantité. Dans ce cas, il affecte la sécrétion des hormones de 22 Kda et 20 Kda et peut être à l’origine d’une déficience en hormone de croissance.
- Les variants 4 et 5 codent pour des polypeptides qui ne se trouvent qu’à l’état de traces dans les cellules hypophysaires et qui n’ont pas de rôle connu. Le variant 4 comprend les exons 1, 2 et 5. L’épissage a donc supprimé les exons 3 et 4. Cet ARNm code pour un polypeptide de 11,3 Kda. Le variant 5 comprend les exons 1 et 5 ; l’épissage a donc supprimé les exons 2, 3 et 4. Il code pour un polypeptide de 7,4 Kda.
Les ARNm des différents variants de GH1. Les exons présents dans chaque séquence sont numérotés de 1 à 5.
b - Mise en évidence de l’épissage alternatif du gène GH1
On dispose de la séquence du gène, de celle de l’ARN pré-messager, de celles des 5 variants de l’ARNm.
Télécharger le fichier : GH1.edi
1 - Comparaison du gène et du pré-ARNM
La comparaison de la séquence du gène avec celle de l’ARN pré-messager (fonction de comparaison sans discontinuités) permet de constater que toute la séquence du gène est transcrite.
2- Comparaison du pré-ARNm et des différents ARN
La fonction dotplot permet de comparer la séquence de chacun des variants avec celle de l’ARN pré-messager. Il est bon de commencer par le variant 1 pour lequel l’épissage fait que les 5 exons se retrouvent dans l’ARN messager. Cela sert de référence pour découvrir ensuite les caractéristiques de l’épissage aboutissant aux 4 autres variants.
GH1 Variant 1- Les 5 segments rouges représentent les 5 exons.
GH1 Variant 2 - On retrouve bien les 5 exons. Remarquer que l'exon 3 est raccourci par rapport à celui du variant1.
GH1 Variant 3. On constate l'absence totale de l'exon 3 qui a été éliminé comme le sont les introns lors de la maturation du pré-ARNm.
GH1 Variant 4. Les exons 3 et 4 sont absents.
GH1 Variant 5. Ne subsiste dans ce variant que les exons 1 et 5 (Raccourci).
La notion d’épissage alternatif du gène étant dégagée, il est bon d’en voir les conséquences au niveau protéique en utilisant la fonction de traduction d’Anagène (à partir du premier AUG)
et en comparant les 5 protéines. Ainsi on dégage l’idée de production de plusieurs protéines à partir d’un seul gène.
B - Un épissage alternatif tissu dépendant conduisant à deux polypeptides aux fonctions différentes : épissage du gène CGRP
a - Le gène CGRP (Calcitonin Gene Related Product)
Le gène est situé sur le chromosome 11. Il s’exprime dans les cellules C de la thyroïde où il code pour une hormone, la calcitonine, intervenant dans la régulation de la calcémie (hormone hypocalcémiante). Il s’exprime aussi dans de nombreux neurones du système nerveux central et périphérique où il code pour un neuromédiateur, le CGRP.
Calcitonine et CGRP ont des rôles physiologiques différents. C’est donc l’exemple d’un gène qui code pour deux protéines différentes suivant le type de cellules où il s’exprime.
Ce gène comprend 6 exons et 5 introns.
Dans les cellules de la thyroïde, l’ARN messager résultant de l’expression du gène est constitué par l’union des exons 1 à 4. Le système d’épissage est tel que les exons 5 et 6 ne se retrouvent pas dans l’ARNm. Dans les neurones, l’ARNm résultant de l&rsqrsquo;expression du gène est formé par l’union des exons 1, 2, 3, 5 et 6. Il résulte donc d’un épissage qui a fait disparaître l’exon 4. On voit donc que le gène est épissé différemment dans les deux types cellulaires.
b - Mise en évidence de l’épissage alternatif du gène CGRP
On dispose de la séquence du gène, de celle de l’ARN pré-messager et des deux ARN messagers, celui présent dans les cellules thyroïdiennes, et celui présent dans les neurones.
Télécharger le fichier : CGRP.edi
Une difficulté réside dans le fait qu’aucun des deux ARN messagers n’incorpore la totalité des exons. Pour faciliter l’exploitation des séquences, on peut fournir la structure du gène comme référence. Il reste néanmoins possible de l’établir à la fin après l’exploitation des 2 ARN messagers.
Là aussi, c’est la fonction Dotplot qui permet de comparer chaque ARN messager à la séquence de l’ARN pré-messager.
Si on n'a pas fournit au préalable la structure du gène, l'élève, par la comparaison des deux graphiques de ressemblance précédents, peut arriver à la reconstituer.
En effet, la comparaison des deux DotPlot montre que les 3 premiers exons sont communs aux deux ARNm, que l'exon 4 présent dans l'ARNm de la calcitonine est absent dans celui du CGRP (et donc éliminé ici comme un intron), et que l'ARNm du CGRP possède en propre deux exons situés dans la partie terminale du gène. Absents de l'ARNm de la calcitonine, ils sont donc éliminés comme des introns.
Le pré-ARNm (donc le gène) est donc constitué de 6 exons 5 introns ; l'élève est en mesure de schématiser cette structure et l'épissage alternatif de la manière suivante :