Aller au contenu. | Aller à la navigation

Outils personnels

Plateforme - ACCES
Navigation

Le thermomètre moléculaire

Par salame — Dernière modification 04/07/2016 10:50

 

 

Les différentes activités proposées :

  • une analyse de profils d'acides gras (il s'agit de déterminer ici qui est thermophile, qui ne l'est pas) [Activité à Construire],
  • l'établissement d'un indice protéique de thermostabilité, (un thermomètre moléculaire de nature polypeptidique et son application à des situations variées);
  • l'établissement d'un indice ribosomique de thermostabilité, (un thermomètre moléculaire de nature ribonucléique);
  • la comparaison des génomes et de l'information génétique (on montre que les Bactéries et les Archées thermophiles - et plus particulièrement hyperthermophiles - ont des génomes plus petits, plus compacts, des familles de gènes aux fonctions apparentées moins nombreuses, des gènes eux-mêmes plus petits...),
  • la mise en culture d'extraits soumis à différentes températures (p ex des extraits de sol),
  • l'observation au microscope d'extraits soumis à différentes températures (p ex des extraits préparés à partir de lichens ou de mousses récoltés sur un mur ou un toit),
  • la reconstitution d'un paléoenvironnement [Activité à Construire].

 

 Le thermomètre ribosomique

  1. Par ribosomique on entend lié au ribosome dans le sens étymologique de ce dernier c'est-à-dire riche en ribose car riche en ARN. Il s'agit donc d'une étude portant sur l'ARN de la petite sous-unité du ribosome (ARN dont le coefficient de sédimentation en ultracentrifugation analytique est de 16S chez les procaryotes, Bactéries et Archées et 18S chez les Eucaryotes). Même si en pratique les séquences analysées seront le plus souvent des séquences d'ADN. Les modificatons de bases qui sont assez bien connues pour ces molécules d'ARN sont ici considérées comme négligeables.
  2. On verra toutefois que les conclusions ont une portée plus générale et s'étendent aux autres ARN ribosomiques (5S et 23S) et aux ARNt.

Nous nous inspirons ici pour une large part des travaux publiés par Galtier et Lobry (1997) dont les données sont accessibles en ligne à l'adresse : ... (voir l'accord des auteurs).

  • Les espèces thermophiles et hyperthermophiles présentent une composition en bases guanine et cytosine généralement élevée (>60%) 
  •  Les espèces psychrophiles et mésophiles présentent au contraire un %G+C généralement plus faible
  • mais il existe un fort recouvrement et des exceptions assez notoires
  • et un fort "tassement" pour les faibles valeurs de %G+C qui tient au fait que le %G+C des ARNr est toujours nettement élevé (>50%) quelque soit l'espèce 
  • le %G+C est largement indépendant du %G+C du génome total
  • on peut ainsi rechercher l'explication au niveau de l'ARN
  • Galtier et Lobry (1997) ont montré que l'on obtenait une meilleure corrélation si l'on ne retenait des séquences nucléotidiques que les régions de l'ARNr s'appariant pour former une structure double brin
  • Notons que la conservation (et donc la stabilité) de la structure secondaire des ARN ribosomiques à une valeur universelle. C'est bien souvent grâce à cette structure secondaire qu'il est possible de constituer des alignements multiples de séquences que la variabilité rend assez difficiles à constituer.
  • On comprend ainsi que c'est la plus grande stabilité thermique des portions double brin riches en G+C qui contribue à une meilleure adaptation de l'espèce à son environnement thermophile.

voir sur ce thème les activités proposées.

Le thermomètre protéique

L'activité proposée s'inspire d'une démarche fréquemment mise en oeuvre par les scientifiques :

  • rechercher un paramètre indicateur ayant, si possible, une valeur synthétique;
  • le valider dans une situation connue de manière à évaluer son intérêt, sa performance;
  • enfin, une fois la validation acquise, pouvoir l'utiliser en routine comme élément diagnostic.

Ici nous recherchons un indicateur de thermostabilité des protéines qui puisse être assez facilement mis en oeuvre et qui ait un bon pouvoir diagnostic. L'indication d'une probable thermostabilité de la molécule (au terme de ce test) doit permettre d'avancer l'hypothèse que l'organisme qui possède cette molécule est lui-même thermophile. La démonstration que tel est bien le cas est possible si l'organisme peut-être isolé et cultivé. Dans le cas contraire, par exemple s'il s'agit d'un organisme fossile, cette démonstration directe ne pourra pas être apportée. Il restera alors à essayer de conforter l'hypothèse (à défaut de la valider) en testant d'autres indices de thermophilie (nous en proposons un autre plus loin dans ce dossier).

 

Un indice de thermostabilité pour les polypeptides

Le choix s'est porté sur la composition en acides aminés du polypeptide et le calcul d'un indice pour chaque acide aminé à l'aide des données de la littérature.

  • [Tableau donnant une dizaine d'indices de thermostabilité des acides aminés tirés de la littérature scientifique.]
  • A l'aide d'un tableur (de type Excel) on réalise la moyenne de ces indices.
  • Une explication de l'origine des différences pour ce paramètre peut être recherchée en comparant aux données standard sur les acides aminés (taille, charge, hydrophobicité, hydratation, stabilité, etc.).

 

Une nécessaire étape de validation

Celle-ci s'effectue sur des polypeptides d'organismes dont le statut de preferendum thermique, qu'ils soient tolérants ou résistants, que ce soit aux températures basses ou élevées, est connu.

  • les polypeptides testés ne doivent pas être trop courts sans quoi l'analyse statistique n'est pas valide et l'effet de biais dans la composition des acides aminés (AA) ne ressort pas (ex. la Ribonucléase de moins de 100 AA) ;
  • de même des chaînes polypeptidiques soumises à des contraintes de séquences très fortes comme les protéines ribosomales (qui sont en outre souvent de petits polypeptides) ne se prètent pas à cette analyse.

 

Les séquences que nous proposons sont les suivantes :

  1. le couple d'enzymes apparentées Ldh/Mdh (Lactate déhydrogénase, Malate déhydrogénase),
  2. le couple d'enzymes apparentées Glycérate kinase/Hydroxypyruvate réductase,
  3. l'enzyme Gdh (Glutamate déhydrogénase),
  4. la protéine chaperone Hsp70 (synonyme DnaK),
  5. la protéine FtsZ-Tubuline,
  6. l'amylase?, à voir]
  7. Les données de Lobry 1997 accessibles sur le site ... représentant deux ensembles (un premier ensemble constitué de protéines cytosoliques et un second de protéines membranaires) pour 59 espèces bactériennes dont le %G+C du génome total est compris entre 24,8 et 71,7
  • Fichier donnant les séquences des polypeptides (par exemple banque MDH)
  • Adresse du site pour faire les analyses de composition en acides aminés
  • Constitution du tableau avec conversion de la composition en indice global de thermostabilité pour chaque polypeptide
  • Report, classement, selon le preferendum thermique (espèces classées suivant leurs températures optimales de croissance (tableau donnant ces valeurs)
  • Production graphique, analyse

Une mise en application en routine

Nous proposons différents scénarios - fictifs mais qui se veulent réalistes - amenant à rechercher si tel ou tel organisme est adapté ou non aux hautes voire très hautes températures à travers les polypeptides qu'il produit. Il peut également s'agir de concevoir la structure d'un polypeptide de telle sorte qu'il offre une bonne résistance aux fortes températures, etc.

  • Des cas de suspicion de contamination
  1. - par un mésophile - dans une banque de séquence d'hyperthermophiles, le tout dans le cadre d'une démarche de type métagénomique),
  2. Un hôpital est confronté à un problème d'infection récurrente chez des malades opérés. Les soupçons finissent par se porter sur l'étape de décontamination des instruments chirurgicaux. Un chercheur chargé de l'enquête décide d'opérer une analyse d'ADN par PCR, une méthode qui permet à l'aide de courtes séquences d'ADN artificiel appelées amorces de réaliser une multiplication artificielle des molécules d'ADN pouvant se trouver en faible voire très faible quantité dans des liquides, sur des surfaces, en suspension dans l'air, etc. (on parle à ce titre d'amplification de l'ADN). Il choisit des amorces correspondant à un gène de synthèse d'une protéine enzymatique du métabolisme très commune chez les êtres vivants et pour laquelle des études préalables ont montré une bonne discrimination des organismes selon qu'ils sont mésophiles ou thermophiles. Les séquences polypeptidiques sont obtenues par traduction automatique des séquences nucléotidiques obtenues par l'amplification d'ADN, la méthode permettant d'obtenir directement la séquence de chaque molécule initialement présente dans le mélange analysé. Les différentes taches sont pour la plupart automatisées et au final les données sont directement saisies et traitées par informatique.
  • Un travail de design d'un polypeptide artificiel (qui pourrait être une enzyme dans un process industriel impliquant une thermorésistance élevée ; un médicament dont le procédé de fabrication et de stérilisation peut-être nécessiterait une thermostabilité élevée, peut-être un antibiotique ; etc.),
  • la conception d'une nouvelle enzyme dont on donnerait le site actif et rechercherait à synthétiser artificiellement le reste moyennant quelques contraintes (une sorte de "puzzle" polypeptidique par exemple en combinant à partir d'une banque de peptides et évaluant à l'aide de l'indice les combinaisons effectuées).
  • application à l'évaluation de protéines fossiles (collagène de mammouth!)  et la reconstitution du preferendum probable d'une espèce ancestrale (LUCA?) (voir les données du groupe de Manolo Gouy à Lyon).

(une initiation à la bioinformatique...)