Génétique moléculaire et spécificités humaines
Jean-Claude Hervé
B - Génétique et spécificités humaines.
Les découvertes en génétique moléculaire n’ont pas été exploitées uniquement pour préciser les relations de parenté entre les divers homininés fossiles et établir l’histoire évolutive des Homo, notamment celle des Homo sapiens. La comparaison des génomes a aussi permis de rechercher des réponses à la question suivante : quelles sont les innovations génétiques intervenues dans la lignée humaine depuis sa séparation avec celle des chimpanzés qui ont contribué aux états dérivés propres à l’Homme, notamment le grand développement de son cerveau, son aptitude au langage, les caractères anatomiques associés à une bipédie exclusive, etc. L’idée est que la comparaison des génomes entiers de l’Homme et du Chimpanzé, va révéler des régions où le génome humain présente des spécificités et qu’il s’agira par la suite, de trouver si ces spécificités sont en rapport avec des caractéristiques phénotypiques humaines. En réalité, cela s’est avéré beaucoup plus compliqué qu’on l’imaginait initialement. Ce que révèle en premier la comparaison des génomes des Grands singes est l’importance des similitudes entre les génomes (98,7% entre la séquence du génome humain et celle du chimpanzé ; 96% si on prend en compte les délétions et les insertions et duplications de gènes). Trouver les différences ayant une signification fonctionnelle revient un peu à chercher une aiguille dans une meule de foin.
Deux méthodes ont fourni des résultats intéressants, celle des gènes candidats et celle de recherche des régions ayant subi une évolution accélérée uniquement dans la lignée humaine.
1. La méthode des gènes dits « candidats »
Un gène candidat est un gène identifié chez l’homme dont on pense que son évolution a contribué à l’acquisition de caractéristiques spécifiquement humaines. Une raison justifiant cette hypothèse est que les mutations de ce gène dans l’espèce humaine altèrent profondément une fonction propre à l’homme. L’exemple modèle, emblématique, est celui du gène FOXP2. Le point de départ est une famille anglaise, la famille KE, dont plusieurs membres sur trois générations présentent un déficit de langage, tant dans la capacité à émettre des mots que dans l’aptitude à construire des phrases (figure ?) L’analyse génétique classique a révélé que c’est une maladie héréditaire mono génique où le phénotype morbide est dominant. Les techniques de biologie moléculaire ont permis de localiser le gène sur le chromosome 7 et de le séquencer. Elles ont aussi permis de localiser la mutation à l’origine du déficit linguistique, mutation ponctuelle entraînant la substitution d’un acide aminé (histidine à la place d’arginine) en position 553, sur 715 acides aminés. Ce gène code pour une protéine qui est un facteur de transcription c'est-à-dire une protéine qui en se fixant sur les séquences régulatrices d’autres gènes en régule la transcription. A cause de son implication dans le langage, spécificité humaine, les chercheurs ont pensé que c’était un bon gène candidat.
Ils ont alors séquencé le gène FOXP2 chez divers primates et chez la souris, et comparé les séquences obtenues.
·
Les fractions indiquées sur chaque branche précisent au numérateur le nombre de substitutions non synonymes (rectangles rouges) et au dénominateur le nombre de substitutions synonymes (en bleu).
Au niveau protéique il n’y a que très peu de différences entre les séquences FOXP2 de ces mammifères : une seule différence entre celle de la Souris et celle du Chimpanzé ; trois différences entre celle de la Souris et celle de l’Homme. Au niveau nucléique, il existe plus de différences car la grande majorité des substitutions sont silencieuses, n’ont pas de conséquences au niveau protéique à cause de la redondance du code génétique. La figure ci-dessus, extraite de l’article de Enart (Molecular evolution of FOXP2, a gene involved in speech and language. Nature vol 418 august 2002) indique sur un arbre phylogénétique le nombre de mutations ponctuelles survenues sur chaque branche de l’arbre en distinguant celles qui sont silencieuses et celles qui ont eu des conséquences au niveau protéique. La première idée qui se dégage est donc celle d’une protéine très conservée au cours de l’évolution.
La fréquence des substitutions non synonymes (entraînant un changement d’acide aminé) est nettement inférieure sur chaque branche (hors celle de la lignée humaine) à celle des mutations synonymes. Cela ne signifie pas que la fréquence d’apparition de ces substitutions non synonymes a été plus faible mais seulement que la plupart n’ont pas été conservées au cours de l’évolution à cause d’une sélection négative : les individus qui en étaient porteurs avaient un désavantage sélectif à cause de la protéine mutée, qui devait être moins fonctionnelle.
La branche de la lignée humaine offre une originalité par rapport aux autres branches : il y a eu deux substitutions uniquement, et les deux non synonymes qui font que la protéine FOXP2 humaine diffère de celle du Chimpanzé par deux acides aminés. La conservation de ces mutations indique qu’elles ne devaient pas conférer un désavantage sélectif aux individus qui en étaient porteurs. Elles devaient même leur conférer un avantage sélectif au point de se généraliser dans les populations de la lignée humaine où elles sont apparues. L’analyse du génome de Neandertal a montré que cet Homo possédait la version Homo sapiens de FOXP2, ce qui suggère que les mutations sont apparues avant la séparation de la lignée néandertalienne avec celle des sapiens.
La spécificité de la protéine humaine FOXP2 suggère que ce gène a joué un rôle important dans l’acquisition de l’aptitude au langage dans la lignée humaine au point qu’on l’a qualifié abusivement de « gène du langage »
La protéine FOXP2 est un facteur de transcription. Konopka et al dans un article publié par Nature en 2009 ( Human-specific transcriptional regulation of CNS development genes by FOXP2) relatent des expériences de transgenèse au niveau cellulaire ayant pour but de comparer l’effet de la version humaine du gène FOXP2 et de celle du Chimpanzé sur l’expression de gènes dans des cellules nerveuses en culture. Le résultat est net : les réseaux de gènes activés par la version humaine sont différents de ceux activés par le gène FOXP2 du chimpanzé. Cela renforce l’idée que l’évolution du gène FOXP2 dans la lignée humaine a joué un rôle important dans la genèse des structures nerveuses impliquées dans l’aptitude au langage.
Il faut bien remarquer que l’évolution du gène concerne la séquence codante du gène traduite en protéine. Mais du fait du rôle de la protéine (facteur de transcription), c’est l’expression de nombreux gènes situés en aval qui est modifiée.
Une méthodologie du même type a permis de suspecter le rôle d’autres gènes dans l’acquisition de spécificités humaines. C’est en particulier le cas des gènes ASPM et MCPH1 (microcephalin) dont des mutations sont à l’origine de microcéphalies se traduisant par une extrême réduction du cortex cérébral dans l’espèce humaine ; on a donc supposé que l’évolution de ces gènes dans la lignée humaine a joué un rôle dans l’accroissement du volume cérébral.
2. La méthode des HARs (Human accelerated regions)
Cette méthode a nécessité la mise au point de programmes informatiques permettant de rechercher, par la comparaison de génomes entiers de plusieurs espèces, des séquences qui sont très semblables chez toutes les espèces sauf chez l’espèce humaine et cela sans connaître à priori le rôle de ces séquences. Ces régions sont donc très conservées au cours de l’évolution des lignées des diverses espèces mais ont beaucoup évolué dans la lignée humaine : ce sont ces deux propriétés qui font qu’on les qualifie de HAR. Le fait que la séquence soit très conservée indique que les mutations dans les lignées ont été éliminées (sélection négative) ce qui suggère que ces séquences ont un rôle important. L’évolution accélérée dans la lignée humaine suggère que les mutations dans cette lignée ont été soumises à une sélection positive et ont donc contribué à l’acquisition de caractéristiques phénotypiques nouvelles propres à la lignée humaine. Il reste ensuite à identifier la fonction de ces séquences.
L’équipe de Pollard a ainsi identifié 49 HARs ; celles chez qui l’implication dans les caractéristiques humaines est le plus nettement établie sont désignées HAR1 et HAR2. (K.S Pollard et al. : An RNA gene expressed during cortical development evolved rapidly in humans, Nature, vol. 443, no. 7108, pp. 167-172(September 14, 2006).
- - HAR1 est une séquence de 118 nucléotides (en réalité paires de nucléotides puisqu’il s’agit d’ADN). Les séquences de la Poule et du Chimpanzé dont le plus récent ancêtre commun est de 300 millions d’années environ, ne diffèrent que par deux nucléotides alors qu’entre celles du Chimpanzé et de l’Homme, il existe 18 différences bien que le dernier ancêtre commun soit daté de 6 millions d’années environ. Cette séquence répond dont très bien aux critères d’une HAR à savoir être une région très conservée sauf dans la lignée humaine où elle a beaucoup évolué.
L’équipe de Pollard a ensuite montré que cette séquence est transcrite au cours du développement, entre les 7ème et 19ème semaines de gestation, dans des neurones corticaux qui participent à l’organisation du cortex cérébral. Un dysfonctionnement de ces neurones peut engendrer une maladie congénitale appelée lissencéphalie (cortex cérébral sans replis et de surface réduite). Cela a laissé supposer que l’évolution de cette séquence dans la lignée humaine a contribué à la genèse des spécificités du cortex cérébral humain.
La séquence HAR1 est transcrite en ARN dans ces neurones corticaux mais non traduite. Il ne s’agit donc pas d’une séquence dont l’expression aboutit à la synthèse d’un polypeptide, et l’ARN est un petit ARN qui n’est pas un ARN messager. Il s’agit d’une catégorie d’ARN récemment découverte dont le rôle est de réguler l’expression de nombreux gènes. Les structures spatiales des ARN transcrits des séquences HAR1 du Chimpanzé et de l’Homme sont différentes ce qui suggère l’idée que la régulation de l’expression des gènes qu’ils effectuent est propre à chacun d’entre eux.
En A, structure de l'ARN HAR1 en feuille de trèfle chez l'Homme. En B structure en épingle à cheveux chez le Chimpanzé.
- - HAR2 (encore appelée HACNS1) est une séquence de 586 paires de nucléotides qui possède à 16 sites un nucléotide spécifique à l’espèce humaine. Et surtout, il existe en son sein une séquence de 81 paires de nucléotides où on reconnaît 13 sites propres à l’homme (sur les 16). On constate que les séquences des autres vertébrés, notamment celles du Chimpanzé et du Macaque, présentent peu de différences. Cette séquence répond donc bien aux critères d’une HAR : elle est très conservée chez tous les vertébrés et elle a beaucoup évolué depuis la séparation de la lignée humaine avec celle du Chimpanzé.
La séquence HAR2 n’est pas une séquence codante ; elle n’est pas transcrite et donc pas traduite. C’est une séquence régulatrice qui intervient dans le contrôle de l’expression de plusieurs gènes.
Les chercheurs ont supposé que les changements intervenus dans cette séquence dans la lignée humaine ont modifié la façon dont elle contrôlait l’activité de gènes cibles. Pour tester cette idée, ils ont réalisé une expérience de transgenèse utilisant la technique du gène rapporteur. Ils ont élaboré des constructions génétiques associant la séquence HAR2 de l’Homme, ou du chimpanzé ou du Macaque, avec la séquence codante d’une gêne rapporteur, le gène de la Beta galactosidase. La protéine résultant de l’expression de ce gène se colore en bleu avec une technique de coloration appropriée. On peut ainsi repérer où ce gène s’exprime.
Ils ont injecté cette construction génique dans un œuf de souris, puis étudié l’expression du gène rapporteur à différents moments du développement. La figure illustre les résultats obtenus chez des embryons de 11,5 jours.
Territoires d'expression du transgène chez des embryons de Souris de 11,5 jours. Tout en haut, on précise les territoires d'expression avec la séquence HAR2 de l'Homme. Chez chaque espèce, 3 essais sont réalisés.
On constate une forte expression du gène rapporteur en divers endroits, notamment dans les bourgeons des membres avec la séquence HAR2 humaine, alors que cette expression est beaucoup plus faible avec la séquence HAR2 du Chimpanzé ou du Macaque. Cela confirme que la séquence HAR2 humaine a une activité différente de celles des autres primates et les chercheurs ont montré par la suite que cela était lié aux substitutions spécifiques de la séquence humaine. On peut en conclusion supposer que l’évolution de la séquence HAR2 dans la lignée humaine a modifié le fonctionnement des réseaux de gènes contrôlés par cette séquence et par-là ont pu entraîner des changements morphologiques. Les auteurs pensent que l’action régulatrice exercée par la séquence humaine au niveau des territoires du poignet, de la main et notamment du pouce, peuvent avoir contribué aux spécificités de la main humaine et notamment de sa dextérité.
L’étude n’en est toutefois qu’à ses débuts car il reste à identifier les gènes cibles contrôlés par la séquence humaine et dont l’activité est modifiée.
3. Généralisation
- Au début de l’analyse comparative des génomes des primates, on pensait qu’elle révèlerait les gènes dont la séquence codante a varié dans l’espèce humaine, entraînant des changements dans les protéines qu’ils codent, changements à l’origine de spécificités phénotypiques humaines. Ce n’est point ce qu’on a constaté. Les changements dans les séquences codantes des gènes de structure n’ont guère révélé de modifications ayant des conséquences significatives.
En revanche, les exemples précédemment envisagés attirent l’attention sur l’importance des variations touchant des gènes codant pour des facteurs de transcription (comme FOXP2) et des séquences régulatrices. Facteurs de transcription et séquences régulatrices sont les éléments qui par leur interaction régulent l’expression de nombreux gènes cibles. - Après le séquençage du génome humain et surtout à partir de2007, une équipe internationale comprenant près de 450 chercheurs a mis au point le projet ENCODE ayant pour objectif de cartographier toutes les séquences actives du génome, constituant en somme une encyclopédie des éléments actifs. Un premier compte rendu des résultats obtenus a été publié en 2012 dans 30 articles de la revue Nature.
Les premiers travaux ont eu pour but de repérer tous les gènes codant pour des protéines. Une première surprise est qu’ils se sont avérés beaucoup moins nombreux que prévu : 21000 environ. L’espèce humaine ne se différencie pas des autres espèces par un nombre de gènes élevé.
On a aussi repéré les gènes codant pour des ARN impliqués dans la synthèse protéique, comme les ARN ribosomiaux et les ARN de transfert. Mais, même avec ces gènes, l’ensemble ne constituait qu’une faible partie du génome, 3% environ. Le reste a été initialement désigné sous le nom d’ " ADN poubelle ".
C&rsquorsquo;est justement à l’analyse de cet ADN poubelle que sont attachées les équipes du projet ENCODE. La conclusion de la première étape de leurs travaux publiée en 2012 entraîne un changement radical dans notre perception du génome : 80% environ de notre ADN a une activité. Il faut abandonner la notion d’ADN poubelle. - En dehors des gènes codant pour des protéines, les éléments actifs du génome sont des gènes codant pour des ARN dont on pense qu’ils ont un rôle régulateur de l’expression d’autres gènes (la séquence HAR1 en est un exemple) et des séquences régulatrices non transcrites sur lesquelles se fixent des facteurs de transcription, protéines codées par des gènes régulateurs. On a ainsi repéré 400000 régions régulatrices de l’expression d’autres gènes et une multitude d’ARN régulateurs.
- Néanmoins, seuls 10% de ces éléments à action régulatrice de l’expression d’autres gènes, ont un rôle » bien identifié (on connaît leurs gènes cibles). Rien ne dit que toutes ces séquences ont une importance fonctionnelle. Cependant, les exemples précédemment envisagés laissent à penser que l’évolution de ces séquences a joué un rôle essentiel dans l’évolution morphologique et anatomique humaine, comme dans celle des êtres vivants en général, en régissant la chronologie, le lieu, l’intensité d’expression de leurs gènes cibles intégrés dans des réseaux complexes.
Si on a sans doute identifié la nature des innovations génétiques à l’origine des spécificités humaines, on est très loin d’en avoir une description précise.
Quelques aspects de l’évolution d’Homo sapiens
Tous les Hommes modernes ont une origine africaine. La diversification des populations actuelles a donc été acquise au cours de la dispersion des sapiens à partir de leur territoire d’origine. Il est intéressant de montrer que comme toute espèce, l’espèce humaine a évolué avec apparition de nouveaux phénotypes. On retrouve les mêmes modalités que chez toutes les espèces à savoir des innovations génétiques qui finissent par se généraliser plus ou moins dans certaines populations sous l’action de la sélection naturelle, de la sélection sexuelle, de la dérive génétique dans les populations à faible effectif. Un autre aspect de la sélection propre à l’espèce humaine est la sélection culturelle.
Parmi les exemples pour lesquels on dispose d’informations sur les innovations génétiques et les facteurs de sélection en jeu, on peut envisager : l’évolution de la couleur de la peau, l’aptitude à digérer ou non le lactose à l’âge adulte, la capacité à digérer l’amidon grâce à l’amylase salivaire.