Principes de l'expression de l'information génétique
1 – Principes de l’expression de l’information génétique
Le gène qui code pour la chaîne bêta d’hémoglobine peut servir de support. On part de la notion de gène la plus simple - celle que connaissent les élèves en arrivant en première - où le gène est réduit à sa séquence strictement codante. Il est évidemment souhaitable de créer un environnement biologique - ici concernant les érythroblastes qui synthétisent l’hémoglobine - afin que les élèves saisissent bien la signification des études qui seront réalisées grâce au logiciel. Pour cela il convient de définir à partir de l'exemple du phénotype drépanocytaire les différents niveaux du phénotype : macroscopique, cellulaire, moléculaire. Ainsi est dégagée l'idée que le génotype détermine uniquement le phénotype moléculaire et plus précisément la synthèse d'une chaîne polypeptidique. Cela conduit à préciser la localisation cytoplasmique de la synthèse des chaînes de l’hémoglobine, ce qui suggère l’idée d’un transfert d’information du noyau vers le cytoplasme et permet l’introduction de l’ARN messager. Les deux étapes de l’expression du gène, la transcription et la traduction sont ainsi mises en place.
Activités possibles sur la transcription
A partir de la représentation 3D d'un fragment d'une molécule d'ARN (avec RasTop ou Jmol), il est possible d'en dégager les caractéristiques.
Télécharger le fichier : ARN-3D.zip
Ce travail préalable permet de poser le problème de la synthèse de l'ARN à partir de l'ADN.
La banque de données de Anagène comporte, dans les thèmes fournis en 1997, une entrée Expression de l'information génétique. Cette entrée permet d'accéder à des ensembles de séquences correspondant aux chaînes alpha, bêta, gamma et delta de l'hémoglobine humaine.
Pour le gène bêta de l'hémoglobine humaine sont fournies, notamment, les séquences de nucléotides de chacun des brins de l’ADN du gène et celle de l’ARN messager.
Il est possible de comparer la séquence de l’ARNm à celle de chacun des brins de l’ADN. On découvre ainsi que la séquence d’ARNm est identique à celle d’un des brins de l’ADN (sauf, bien sûr, que la thymine est remplacée par l’uracile dans l’ARN) et donc complémentaire de celle de l’autre brin.
Grâce aux connaissances acquises sur les modalités de la réplication de l’ADN, on peut faire une hypothèse sur la synthèse de l’ARN messager à partir de l’ADN. Un film sur l’expression de l’information génétique permet de tester cette hypothèse. Les notions de brin transcrit et de brin non transcrit sont ainsi dégagées. Puisque les séquences du brin non transcrit de l’ADN et de l’ARN messager sont identiques, on peut comprendre que dans les banques de séquences d’Anagène sur les gènes, on fournisse uniquement celles du brin non transcrit d'un gène.
Activités possibles sur la traduction
L’algorithme sous-jacent à la fonction de traduction d’une séquence du logiciel est conforme globalement aux modalités de la traduction de l’ARN messager en polypeptide qui a lieu au sein de la cellule. Donc, en observant et analysant la manière dont le logiciel opère, on découvre certaines des caractéristiques de la traduction dans les cellules.
Il importe là aussi de créer un environnement biologique à partir de clichés montrant des ribosomes reliés à une molécule d’ARN messager, ce qui suggère qu’ils réalisent la synthèse d’un polypeptide en parcourant la molécule d’ARNm et en assurant la mise en place successive des acides aminés.
- Le premier problème à résoudre est celui du type de correspondance entre la séquence de nucléotides de l’ARNm et celle de la séquence d’acides aminés du polypeptide. On peut aborder le problème de façon classique et théorique en réfléchissant sur les combinaisons de nucléotides permettant de coder la vingtaine de sortes d’acides aminés des polypeptides. A partir des longueurs des séquences de l’ARNm et du polypeptide, on peut aussi dégager simplement l’hypothèse du triplet.
Il est également possible, en déprotégeant les données, d’enlever le nombre de nucléotides que l’on veut à la séquence d’ARN messager codant du gène bêta de la globine.
Grâce à la fonction de traduction simple (sans la contrainte du codon d'initiation), on peut convertir chacune des séquences en polypeptide, puis comparer chacun des polypeptides obtenus avec la séquence réelle de la chaîne bêta de référence.
Ainsi, on peut tester les hypothèses émises et déboucher sur la notion d’une traduction triplet par triplet de l’ARNm (sans interruption ni chevauchement). Les polypeptides obtenus par la traduction de l’ARNm commençant au deuxième et troisième nucléotide étant très courts, le problème des causes de cet arrêt précoce de la traduction est posé.
Remarque : ARNm - nucléotide1 : lire ARNm moins le nucléotide 1
- Le deuxième problème est celui du code génétique. On peut fournir aux élèves un tableau vide du code génétique et leur demander de le remplir afin de rechercher des caractéristiques du code génétique : est-il univoque, sans ambigüité ? Est-il redondant ? Existe-t-il des triplets théoriquement possibles ne codant en réalité pour aucun acide aminé ?
La fonction qui permet, à la suite de la traduction, de comparer la séquence de l’ARNm avec celle du polypeptide permet de remplir en partie ce tableau.
On peut alors demander aux élèves de construire des ARNm artificiels permettant de compléter le tableau (Commandes : Fichier, Créer).
La séquence d'ARN est créée soit en tapant la suite des nucléotides, soit en cliquant sur leur symbole dans le bloc des nucléotides :
Ce faisant, on se rapproche de la méthodologie qui a permis de découvrir le code génétique. Les élèves doivent traduire ces séquences. Normalement, ils devraient aboutir à la notion de codon stop et trouver une explication à l’arrêt de traduction préalablement constaté quand on commence la traduction aux 2ème et 3ème nucléotides.
Il est également possible de dégager rapidement les caractéristiques du code génétique en utilisant le tableau de ce code intégré au logiciel (icône AUG de la barre du menu). Le tableau peut être utilisé soit en entrant un codon pour voir quel acide aminé il code, soit en cliquant sur un acide aminé pour voir par quel codon il est codé.
La même démarche peut être réalisée avec les autres chaînes de l'hémoglobine figurant dans la banque de données fournies en 1997.