Aller au contenu. | Aller à la navigation

Outils personnels

Plateforme - ACCES
Navigation

Un indice protéique de thermostabilité

Par Hervé Levesque Dernière modification 19/09/2017 09:43
L'activité permet d'établir un indice de thermostabilité, une sorte de thermomètre moléculaire, de le valider à l'aide de séquences connues puis de l'appliquer à des séquences inconnues

L'activité proposée s'inspire d'une démarche fréquemment mise en oeuvre par les scientifiques :

  • rechercher un paramètre indicateur ayant, si possible, une valeur synthétique;
  • le valider dans une situation connue de manière à évaluer son intérêt, sa performance;
  • enfin, une fois la validation acquise, pouvoir l'utiliser en routine comme élément diagnostic.

Ici nous recherchons un indicateur de thermostabilité des protéines qui puisse être assez facilement mis en oeuvre et qui ait un bon pouvoir diagnostic. L'indication d'une probable thermostabilité de la molécule (au terme de ce test) doit permettre d'avancer l'hypothèse que l'organisme qui possède cette molécule est lui-même thermophile. La démonstration que tel est bien le cas est possible si l'organisme peut-être isolé et cultivé. Dans le cas contraire, par exemple s'il s'agit d'un organisme fossile, cette démonstration directe ne pourra pas être apportée. Il restera alors à essayer de conforter l'hypothèse (à défaut de la valider) en testant d'autres indices de thermophilie (nous en proposons un autre plus loin dans ce dossier).

 

Un indice de thermostabilité pour les polypeptides

Le choix s'est porté sur la composition en acides aminés du polypeptide et le calcul d'un indice pour chaque acide aminé à l'aide des données de la littérature.

  • [Tableau donnant une dizaine d'indices de thermostabilité des acides aminés tirés de la littérature scientifique.]
  • A l'aide d'un tableur (de type Excel) on réalise la moyenne de ces indices.
  • Une explication de l'origine des différences pour ce paramètre peut être recherchée en comparant aux données standard sur les acides aminés (taille, charge, hydrophobicité, hydratation, stabilité, etc.).

 

Une nécessaire étape de validation

Celle-ci s'effectue sur des polypeptides d'organismes dont le statut de preferendum thermique, qu'ils soient tolérants ou résistants, que ce soit aux températures basses ou élevées, est connu.

  • les polypeptides testés ne doivent pas être trop courts sans quoi l'analyse statistique n'est pas valide et l'effet de biais dans la composition des acides aminés (AA) ne ressort pas (ex. la Ribonucléase de moins de 100 AA) ;
  • de même des chaînes polypeptidiques soumises à des contraintes de séquences très fortes comme les protéines ribosomales (qui sont en outre souvent de petits polypeptides) ne se prètent pas à cette analyse.

 

Les séquences que nous proposons sont les suivantes :

  1. le couple d'enzymes apparentées Ldh/Mdh (Lactate déhydrogénase, Malate déhydrogénase),
  2. le couple d'enzymes apparentées Glycérate kinase/Hydroxypyruvate réductase,
  3. l'enzyme Gdh (Glutamate déhydrogénase),
  4. la protéine chaperone Hsp70 (synonyme DnaK),
  5. la protéine FtsZ-Tubuline,
  6. l'amylase?, à voir]
  7. Les données de Lobry 1997 accessibles sur le site ... représentant deux ensembles (un premier ensemble constitué de protéines cytosoliques et un second de protéines membranaires) pour 59 espèces bactériennes dont le %G+C du génome total est compris entre 24,8 et 71,7
  • Fichier donnant les séquences des polypeptides (par exemple banque MDH)
  • Adresse du site pour faire les analyses de composition en acides aminés
  • Constitution du tableau avec conversion de la composition en indice global de thermostabilité pour chaque polypeptide
  • Report, classement, selon le preferendum thermique (espèces classées suivant leurs températures optimales de croissance (tableau donnant ces valeurs)
  • Production graphique, analyse

Une mise en application en routine

Nous proposons différents scénarios - fictifs mais qui se veulent réalistes - amenant à rechercher si tel ou tel organisme est adapté ou non aux hautes voire très hautes températures à travers les polypeptides qu'il produit. Il peut également s'agir de concevoir la structure d'un polypeptide de telle sorte qu'il offre une bonne résistance aux fortes températures, etc.

  • Des cas de suspicion de contamination
  1. - par un mésophile - dans une banque de séquence d'hyperthermophiles, le tout dans le cadre d'une démarche de type métagénomique),
  2. Un hôpital est confronté à un problème d'infection récurrente chez des malades opérés. Les soupçons finissent par se porter sur l'étape de décontamination des instruments chirurgicaux. Un chercheur chargé de l'enquête décide d'opérer une analyse d'ADN par PCR, une méthode qui permet à l'aide de courtes séquences d'ADN artificiel appelées amorces de réaliser une multiplication artificielle des molécules d'ADN pouvant se trouver en faible voire très faible quantité dans des liquides, sur des surfaces, en suspension dans l'air, etc. (on parle à ce titre d'amplification de l'ADN). Il choisit des amorces correspondant à un gène de synthèse d'une protéine enzymatique du métabolisme très commune chez les êtres vivants et pour laquelle des études préalables ont montré une bonne discrimination des organismes selon qu'ils sont mésophiles ou thermophiles. Les séquences polypeptidiques sont obtenues par traduction automatique des séquences nucléotidiques obtenues par l'amplification d'ADN, la méthode permettant d'obtenir directement la séquence de chaque molécule initialement présente dans le mélange analysé. Les différentes taches sont pour la plupart automatisées et au final les données sont directement saisies et traitées par informatique.
  • Un travail de design d'un polypeptide artificiel (qui pourrait être une enzyme dans un process industriel impliquant une thermorésistance élevée ; un médicament dont le procédé de fabrication et de stérilisation peut-être nécessiterait une thermostabilité élevée, peut-être un antibiotique ; etc.),
  • la conception d'une nouvelle enzyme dont on donnerait le site actif et rechercherait à synthétiser artificiellement le reste moyennant quelques contraintes (une sorte de "puzzle" polypeptidique par exemple en combinant à partir d'une banque de peptides et évaluant à l'aide de l'indice les combinaisons effectuées).
  • application à l'évaluation de protéines fossiles (collagène de mammouth!)  et la reconstitution du preferendum probable d'une espèce ancestrale (LUCA?) (voir les données du groupe de Manolo Gouy à Lyon).

(une initiation à la bioinformatique...)