Notions de gène morcelé et d'épissage
A – Les données
Le gène qui code pour la chaîne bêta de l’hémoglobine est un bon support pour introduire la notion de gène morcelé. C’est d’ailleurs le premier gène chez lequel on a établit la structure en exons et introns. Comme les autres gènes de globine, il a une structure relativement simple puisque constitué par 3 exons et 2 introns.
Pour cette étude, on dispose des séquences suivantes :
- Séquence du brin non transcrit du gène (avec introns et exons) ;
- Séquence de l'ARNm pré-messager (préARNm) ;
- Séquence de l'ARNm ;
- Séquence de l'ARN strictement codant.
Télécharger le fichier : HB-Beta.edi
B - La structure de l’ARN messager
Jusqu'ici, on a assimilé l’ARN messager à sa région strictement codante. En réalité, en amont (extrémité 5’), il existe une région non traduite mais qui est indispensable pour que le ribosome se fixe à l’ARN messager et initie le début de la traduction au premier codon AUG. De même, en aval du codon stop (extrémité 3’), il existe une séquence non traduite. A vrai dire, mais le programme n’en fait pas mention, l’ARNm qui passe dans le cytoplasme commence par la coiffe et se termine par une queue poly A qui sont ajoutées dans le noyau au cours de la maturation de l’ARNm, donc après la transcription. Les séquences dl’ARNm fournies dans la banque ne comprennent pas de coiffe et de poly A.
Cette appréhension plus complète de la structure de l’ARN fait mieux saisir l’intérêt de la notion de codon stop puisque ce dernier ne se trouve pas situé à la fin de la séquence. Lorsqu’on limite l’ARN messager à sa région strictement codante, le codon stop se trouve situé en dernier et ce n’est qu’en cas de mutation faisant apparaître un codon stop anticipé que son rôle est bien apparent.
Les illustrations suivantes montrent au début et à la fin de l'ARNm des parties qui ne figurent pas dans dans sa région codante.
Il est aussi possible de le faire avec la fonction dotplot (graphique de ressemblance).
La diagonale rouge traduit l'identité d'une partie des deux séquences. La détermination des coordonnées des deux extrémités de cette diagonale montre que cette diagonale recouvre la totalité de l'ARN codant. Les parties de l'ARNm en amont et en aval de la diagonale n'ont pas d'équivalent dans l'ARN codant, ce qui signifie qu'elles ne sont pas traduites.
C – La structure du gène et du pré ARNm
Les principes de la transcription et de la traduction étant connus, les séquences permettent un travail centré sur le phénomène de maturation de l’ARNm dans le noyau au cours de la transcription.
La comparaison des séquences de l’ADN complet et de l’ARN pré-messager résultant de la transcription du gène par l’ARN polymérase révèle seulement que toute la séquence du gène est transcrite.
D – La comparaison du pré ARNm et de l'ARNm
On peut ensuite demander aux élèves de comparer la séquence de l’ARN pré-messager avec celle de l’ARN messager qui sera traduit en protéine, en utilisant la fonction DotPlot.
On voit que l’ARN messager se retrouve sous la forme de trois segments séparés dans l’ARN pré-messager (les exons) et que deux longs segments de l’ARN pré-messager (les introns) ne se retrouvent pas dans l’ARN messager. Cela conduit à déduire ce qui s’est passé dans le noyau entre la transcription du gène et l’exportation de l’ARNm : l’élimination de deux régions initialement transcrites et la mise bout à bout des trois régions restantes.
Ainsi, on atteint l’objectif cognitif du programme « Chez les Eucaryotes, la transcription est la fabrication dans le noyau d’une molécule d’ARN pré-messager complémentaire du brin transcrit de l'ADN. Après une maturation l'ARNm est traduit en protéine dans le cytoplasme. »
e - Schématisations
On peut alors schématiser la correspondance entre ARN pré-messager et ARN messager de la façon suivante.
Revenir à la comparaison de la séquence du gène avec celle de l’ARN pré-messager permet de faire le point sur la structure en exons et introns du gène.
Au terme de ces étapes les élèves devraient être en mesure de construire une représentation schématique de l'expression d'un gène voisine de celle-ci :
NB : Cette représentation montre à la dernière ligne la suppression de la méthionine initiale dans la chaîne polypeptidique finale.