Les mécanismes de l'évolution
Evolution 
Information scientifiques
Outils pour enseigner
Partenaires  Recherche Synthèses  Points Ressources  Démarches Biblio Sites
Mise à jour : 10/03/2005

Téléchargements

Conception :

M. Barrère

La famille multigénique des globines
( Jacques Barrère,Lycée Paul Louis Courier, Tours)



Présentation des gènes des globines

Toutes les hémoglobines humaines sont constituées de quatre chaînes polypeptidiques deux à deux identiques. 

Avant la naissance, les hématies du fœtus contiennent de l'hémoglobine fœtale constituée de deux chaînes a et de deux chaînes g. Après la naissance, les hématies contiennent de l'hémoglobine adulte A, très largement majoritaire (97%), de l'hémoglobine D (2%) et de l'hémoglobine F (environ 1%). L'hémoglobine A est constituée de deux chaînes a et de deux chaînes b. L'hémoglobine D est constituée de deux chaînes a et de deux chaînes d

Les hémoglobines F, A et D assurent le transport du dioxygène, de la surface respiratoire (placenta pour le fœtus, alvéoles pulmonaires après la naissance) jusqu'aux cellules. 

La localisation des gènes de l'hémoglobine : The human genome of NCBI

Les gènes de type alpha sont regroupés sur un chromosome (le chromosome numéro 16), les gènes de type bêta sur un autre(le chromosome numéro 11) . 

  • Dans le groupe alpha, le gène qui code pour la chaîne embryonnaire zêta z précède les deux gènes des chaînes a qui sont des composants des hémoglobines foetales et des hémoglobines adultes. 
  • Dans le groupe bêta, le gène de la chaîne embryonnaire epsilon e est suivi par les deux gènes des chaînes foetales g puis par les deux gènes des chaînes adultes d et b
La séquence des gènes de la globine humaine le long des chromosomes correspond à l'ordre dans lequel ils sont exprimés au cours du développement. 
 
Cartes de la famille des gènes codant les chaînes de type a et b de l'hémoglobine humaine. 
Les gènes embryonnaires sont représentés en bleu, les gènes foetaux en vert, les gènes adultes en jaune et les pseudogènes en rouge: 
  • Sur le chromosome 16, on trouve de gauche à droite les gènes z en bleu, fz et fa1 en rouge et a2 puis a1 en jaune; 
  • Sur le chromosome 11, on trouve de gauche à droite les gènes e en bleu, Gg et Ag en vert, fb en rouge, d et b en jaune.
Les gènes des globines forment une famille multigénique

Les globines humaines présentent de nombreuses similitudes : leurs propriétés et leurs structures se ressemblent

Les globines sont toutes impliquées dans le transport ou le stockage du dioxygène. 

Chaque molécule d'hémoglobine est un tétramère formé par l'association de quatre chaînes polypeptidiques identiques deux à deux. Chaque chaîne adopte une conformation spatiale lui donnant une forme globuleuse et ménageant une "poche" superficielle dans laquelle se trouve logé le hème. Chaque globine présente sept ou huit secteurs en forme d'hélice droite reliés par des segments comportant parfois des coudes (voir animation présentant la structure d'une globine bêta
 

Les premier et dernier acides aminés sont notés AA1 et AAn,
GH désigne le segment de liaison entre les hélices G et H. 

Les chaînes alpha et bêta  présentent des structures tertiaires assez similaires.

Toutes les globines humaines, globines a, b, z, gG, gA, e ou m, présentent des structures qui se ressemblent : de telles similitudes confortent l'idée d'une origine commune (Illustrations ci-dessous réalisées avec le logiciel Rastop).. 
 
 


 
Les globines humaines sont des molécules homologues, leurs gènes appartiennent à une famille de gènes, la famille des globines

Les séquences nucléotidiques ou les séquences peptidiques des globines humaines présentent un degré de similitude qui ne peut être dû au hasard. Les globines sont donc des protéines homologues ainsi que les gènes qui les codent. Tous ces gènes dérivent d'un même gène ancestral. 

Les gènes des globines forment donc une famille multigénique. 

Séquences peptidiques des globines humaines
Alignement réalisé avec CLUSTAL W (1.81) multiple sequence alignment
Fichier data/glob_pro.aln
 

Beta.pro         MVHLTPEEKSAVTALWGKVN--VDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGN
Delta.pro        MVHLTPEEKTAVNALWGKVN--VDAVGGEALGRLLVVYPWTQRFFESFGDLSSPDAVMGN
gammaG.pro       MGHFTEEDKATITSLWGKVN--VEDAGGETLGRLLVVYPWTQRFFDSFGNLSSASAIMGN
gammaA.pro       MGHFTEEDKATITSLWGKVN--VEDAGGETLGRLLVVYPWTQRFFDSFGNLSSASAIMGN
Epsilon.pro      MVHFTAEEKAAVTSLWSKMN--VEEAGGEALGRLLVVYPWTQRFFDSFGNLSSPSAILGN
Alpha1.pro       -MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF-DLSH-----GS
Alpha2.pro       -MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF-DLSH-----GS
Theta.pro        -MALSAEDRALVRALWKKLGSNVGVYTTEALERTFLAFPATKTYFSHL-DLSP-----GS
Zeta.pro         -MSLTKTERTIIVSMWAKISTQADTIGTETLERLFLSHPQTKTYFPHF-DLHP-----GS
Myoglob.pro      -MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKAS
                    ::  :   :   * *: :       *.* * :  .* *   *  : .*       ..

Beta.pro         PKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHH
Delta.pro        PKVKAHGKKVLGAFSDGLAHLDNLKGTFSQLSELHCDKLHVDPENFRLLGNVLVCVLARN
gammaG.pro       PKVKAHGKKVLTSLGDAIKHLDDLKGTFAQLSELHCDKLHVDPENFKLLGNVLVTVLAIH
gammaA.pro       PKVKAHGKKVLTSLGDAIKHLDDLKGTFAQLSELHCDKLHVDPENFKLLGNVLVTVLAIH
Epsilon.pro      PKVKAHGKKVLTSFGDAIKNMDNLKPAFAKLSELHCDKLHVDPENFKLLGNVMVIILATH
Alpha1.pro       AQVKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAH
Alpha2.pro       AQVKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAH
Theta.pro        SQVRAHGQKVADALSLAVERLDDLPHALSALSHLHACQLRVDPASFQLLGHCLLVTLARH
Zeta.pro         AQLRAHGSKVVAAVGDAVKSIDDIGGALSKLSELHAYILRVDPVNFKLLSHCLLVTLAAR
Myoglob.pro      EDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSK
                  .:: ** .*  :.   :   ..    :  *:. *.   ::    :.::.. ::  *  .

Beta.pro         FGKEFTPPVQAAYQKVVAGVANALAHKYH------
Delta.pro        FGKEFTPQMQAAYQKVVAGVANALAHKYH------
gammaG.pro       FGKEFTPEVQASWQKMVTAVASALSSRYH------
gammaA.pro       FGKEFTPEVQASWQKMVTAVASALSSRYH------
Epsilon.pro      FGKEFTPEVQAAWQKLVSAVAIALAHKYH------
Alpha1.pro       LPAEFTPAVHASLDKFLASVSTVLTSKYR------
Alpha2.pro       LPAEFTPAVHASLDKFLASVSTVLTSKYR------
Theta.pro        YPGDFSPALQASLDKFLSHVISALVSEYR------
Zeta.pro         FPADFTAEAHAAWDKFLSVVSSVLTEKYR------
Myoglob.pro      HPGDFGADAQGAMNKALELFRKDMASNYKELGFQG
                    :* .  :.: :* :  .   :  .*: 
 


 Afin d'obtenir l'arbre de filiation des gènes de cette famille de globines humaines, on construit une matrice de différences (matrice calculée avec le logiciel phylogène) : 

On déduit de cette matrice l'arbre d'évolution probable des globines humaines (construction effectuée avec le logiciel phylogène) : 

Chaque noeud de cet arbre correspond à une duplication génique, suivie d'une évolution indépendante des deux duplicata par fixation de mutations différentes (les mutations apparaissant au hasard). Cet arbre permet de retrouver les 2 groupes de globines : le groupe alpha et le groupe bêta. 

Tous les Vertébrés, à l'exception des Agnathes, ayant deux gènes de globine (alpha et bêta) et les plus anciens poissons étant  datés d'environ 450 mA alors que les premiers Vertébrés sont apparus il y a environ 550 mA, on en déduit que la première duplication a dû avoir lieu entre ces deux dates. 

La myoglobine diffère des sous-unités alpha et bêta de l'hémoglobine, plus que celles-ci ne diffèrent l'une de l'autre, ce qui indique que la myoglobine a divergé avant l'apparition des gènes a et b

La famille des globines est donc issue de duplications suivies de mutations qui amènent à une diversification des gènes.

Réflexion sur le maintien des innovations génétiques 

Pour qu'une innovation génétique, apparue au hasard chez un individu, se maintienne, il faut :

  • qu'elle ait eu lieu dans une cellule germinale
  • que cette cellule germinale ait participé à la reproduction
  • que cette innovation soit transmise de génération en génération pour se répandre dans toute la population
1 - Sélection négative

L'alignement des séquences peptidiques des globines humaines présenté ci-dessus montre : 

  • 3 groupes de séquences : le groupe alpha (a1, a2, t et z), le groupe bêta (gA, gG, e,d et b) et la myoglobine m.
  • 18 résidus sont conservés au cours de l'évolution des globines humaines : ces positions sont indiquées dans  le tableau ci-dessous :
W  K  E  L  R  P  T  F  L  H  G  V  L  H  L  F  Y
a1 14 16 27 29 31 37 39 43 48 58 59 62 83 87 109 117 127 140
a2 14 16 27 29 31 37 39 43 48 58 59 62 83 87 109 117 127 140
t 14 16 27 29 31 37 39 43 48 58 59 62 83 87 109 117 127 140
z 14 16 27 29 31 37 39 43 48 58 59 62 83 87 109 117 127 140
gA 15 17 26 28 30 36 38 42 48 63 64 67 88 92 114 122 132 145
gG 15 17 26 28 30 36 38 42 48 63 64 67 88 92 114 122 132 145
e 15 17 26 28 30 36 38 42 48 63 64 67 88 92 114 122 132 145
d 15 17 26 28 30 36 38 42 48 63 64 67 88 92 114 122 132 145
b 15 17 26 28 30 36 38 42 48 63 64 67 88 92 114 122 132 145
m 14 16 27 29 31 37 39 43 49 64 65 68 89 93 115 120 130 143

Remarque : on a attribué le numéro d'ordre zéro au codon initiateur correspondant à la méthionine. D'autre part, les différences de position pour un même résidu sont dues au fait que les différentes globines n'ont pas la même longueur (141 acides aminés pour les globines du groupe alpha, 146 pour celles du groupe bêta, 152 pour la myoglobine)

La conservation de certains de ces sites peut s'expliquer par leur position particulière dans la molécule, en relation avec la fixation de l'hème. 

  • C'est le cas pour les histidines 58 et 87 dans la chaîne alpha (63 et 92 dans la chaîne beta), dont les chaînes latérales interagissent avec l'hème :
  • L'explication couramment proposée est la suivante : si une mutation a pour conséquence un changement de l’un des acides aminés en rapport avec la fixation du hème au niveau de la globine, la fonction de la molécule s’en trouvera vraisemblablement altérée ; elle ne sera pas donc pas conservée (sélection naturelle négative)
  • Ce raisonnement peut être appliqué à d'autres sites conservés pour lesquels les explications suivantes sont proposées : 
    • la glycine (notée G) est l’acide aminé présentant le plus faible encombrement (sa chaîne latérale comprend un hydrogène seulement). Or, sa position au cœur de la globine entre deux hélices, ne tolérerait pas un acide aminé plus « volumineux » ;
    • la proline (P) introduit un coude nécessaire à l’interruption de l’hélice C, indispensable à la structure globulaire ;
    • le rôle de la thréonine (T) est incertain ;
    • la phénylalanine (F) et la valine (V) participent au positionnement du hème : de tels acides aminés sont indispensables à la fonction de la protéine ;
    • le rôle des leucines (L) est incertain ;
    • la tyrosine (Y) crée un contact entre les hélices H et F indispensable à la stabilité de la structure spatiale de la globine
  • Si on visualise au niveau des structures 3D des globines les acides aminés conservés, on constate que , pour 4 ou 5 d'entre eux, il s’agit d’acides aminés «en contact» avec l'hème. Ce sont la phénylalanine (position 42 ou 43), l’histidine (position 58, 63 ou 64), la valine (position 62, 67 ou 68) et l’histidine (position 87, 92 ou 93). 
alphahom.pdb
conserv_alpha.scr (détails du script ci-dessous)
betahom.pdb
conserv_beta.scr
myohom.pdb
conserv_myo.scr
select all 
wireframe off 
spacefill off 
backbone on 

select hem 
wireframe on 
color cpk 
select *.fe 
spacefill on 
color blue 

select 27,37,39,43,58,62,83,87,109,140 
wireframe 2 
color cpk 

select all 

select all 
wireframe off 
spacefill off 
backbone on 

select hem 
wireframe on 
color cpk 
select *.fe 
spacefill on 
color blue 

select 26,36,38,42,63,67,88,92,114,145 
wireframe 2 
color cpk 

select all 

select all 
wireframe off 
spacefill off 
backbone on 

select hem 
wireframe on 
color cpk 
select *.fe 
spacefill on 
color blue 

select 27,37,39,43,64,68,89,93,115,143 
wireframe 2 
color cpk 

select all 


 
2 - Mutations neutres

En revanche, si une mutation a pour conséquence de modifier la séquence sans perturber la structure tridimensionnelle de la molécule en un autre endroit (par exemple remplacement d’un acide aminé par un autre de même encombrement ou d’un acide aminé par un autre ayant les mêmes caractéristiques d’hydrophobie ou d’hydrophilie), cette mutation est dite « neutre ». On peut donc supposer que sa conservation résulte alors du hasard. Exemple : 139 dans la chaîne bêta

 

Institut national de recherche pédagogique