Le génome nucléaire du Blé
La taille du génome
- Avec environ 17 Gpb (giga paires de bases, soit milliard de pb) le Blé possède l'un des génomes nucléaires les plus complexes du monde vivant. C'est 5 à 6 fois la taille du génome humain donc 10 à 12 m d'ADN dans un même noyau si l'on met bout à bout toutes les molécules (les 42 molécules puisque le caryotype est 2n=42)!
- En outre la structure de ce génome comportant une proportion énorme de séquences répétées (voir ci-après) a fait qu'il sera - parmi les "grandes" espèces domestiquées et modèles - sans doute le dernier dont la séquence complète aura été établie. Ce séquençage complet du génome nucléaire du Blé est en voie de se terminer [lien vers le Genoscope].
|
- Des illustrations de ces points sont proposées dans le diaporama n°2 présenté à FormaVie 2013.
Un génome polyploïde
- On peut pour ce point se reporter aux propositions pédagogiques sur ce même site de nos collègues Jean-Claude Hervé et Naoum Salamé.
- Notre collègue Jean-François Madre a, de son côté, créé le logiciel Caryotype avec lequel il est possible de manipuler les chromosomes de Blé (caryotype en bandes et cartes génétiques) et ainsi montrer - en particulier grâce à la fonction dot-plot - la polyploïdie (et donc l'homéologie des chromosomes). Ce logiciel permet aussi de travailler sur la localisation géographique des blés et des espèces apparentées (voir une autre partie de ce dossier).
L'organisation du génome nucléaire du Blé
- La distinction "ADN codant" et "ADN non codant"
NB. Cette distinction est importante pour la suite.
Une définition classiquement utilisée par la communauté scientifique pour "ADN codant" est : séquence (ou portion) d'ADN qui permet la synthèse d'une protéine ; elle serait donc synonyme de gène. Mais en réalité on trouve de l'ADN non codant (donc qui ne participe pas directement à la séquence de la protéine) au sein même des gènes, sous la forme de séquences d'ADN régulatrices, qui peuvent être ou non transcrites, sous la forme des introns qui sont issus de la transcription de l'ADN mais ne sont pas traduits puisqu'ils sont éliminés lors de l'épissage de l'ARN prémessager, etc. Ces notions sont maintenant inscrites dans le programme de SVT de la classe de Première S.
Ainsi ADN codant et ADN non codant auraient le mérite de contourner les problèmes posés par la définition très discutée du mot gène, en gagnant en clarté. Pourtant un nouvel élément s'est glissé dans la discussion, c'est l'ARN. Et il faut maintenant reconnaître que de l'ADN non codant il n'en existe vraisemblablement pas dans une cellule, n'importe quel ADN pouvant être transcrit - avec plus ou moins d'efficacité sans doute. Donc par non codant il faut entendre "non codant pour une séquence polypeptidique". Sur ce plan le blé n'échappe pas à ces difficultés et il en ajoute une supplémentaire, les pseudogènes : c'est-à-dire des gènes qui ne sont pas fonctionnels. Cette notion qui était présente dans l'ancien programme de TS et qui l'est moins dans le nouveau ne peut être ignorée lorsqu'on s'intéresse au génome nucléaire du blé. En effet lorsqu'on consulte les séquences déposées dans les banques (EBI, NCBI) il apparaît bien vite que les pseudogènes représentent une part importante. Cela tient sûrement pour beaucoup à l'origine polyploïde du blé.
- Les transposons
Il s'agit d'éléments génétiques mobiles dont les mécanismes de mobilité (hors programme) ne seront pas décrits. Ils sont extraordinairement abondants dans le génome du blé et d'autres Graminées (Poacées) qui possèdent des génomes de grande taille dont on a établi au moins pour partie la séquence (p ex Maïs, Orge). Tout laisse à penser qu'au cours de l'évolution de la famille des Poacées, ces transposons ont envahi le génome des espèces ayant aujourd'hui de très grands génomes. Car le riz par exemple, espèce de Poacée qui possède un génome de moindre taille, ne manifeste pas - ou beaucoup moins - ce phénomène.
Certains traits caractéristiques de séquence des transposons (en particulier les LTR, explication ci-après), les types de gènes retrouvés et en particulier celui de la polymérase, permettent d'identifier sans difficultés ce type d'élément génétique lors de l'analyse des séquences d'ADN. Certains transposons portent un nom qui les identifie et fait que l'on peut ainsi constater leur présence en des localisations multiples sur le même chromosome ou sur des chromosomes différents voire des espèces différentes (voir les activités proposées ci-après). Différents transposons (portant des noms différents) peuvent aussi se retrouver imbriqués les uns dans les autres formant des figures en mosaïque assez complexes (voir les illustrations proposées dans le diaporama n°2 présenté à FormaVie 2013).
Des activités possibles avec les élèves sur ce thème
Consultation en ligne des banques de séquences, extraction au sein de la banque des séquences provenant du génome nucléaire du Blé, lecture des résultats de l'extraction
Documents | |
Objectifs |
|
Remarques :
- Les séquences ont été extraites de la banque en interrogeant avec l'expression "triticum aestivum bac clone", les BAC sont des Bacterial Artificial Chromosome c'est-à-dire des vecteurs de clonage bactériens comportant des insertions (ici d'ADN nucléaire de Blé) de très grande dimension (plusieurs dizaines à quelques centaines de kpb).
- Les "CDS" sont les Coding DNA Sequence c'est-à-dire les séquences codantes de l'ADN (voir § ci-avant)
- les transposons sont des éléments génétiques mobiles qui se transposent (se déplacent) dans le génome qui les héberge ; les rétrotransposons se déplacent sous la forme d'un intermédiaire ARN (sous forme d'ADN pour les transposons)
- Les "LTR" (Long Terminal Repeat) sont des séquences caractéristiques des éléments transposables (ou transposons)
- Les "gap" sont des lacunes de séquences (le travail de séquençage n'étant pas encore totalement achevé)
- "Repeat region" signifie qu'il s'agit d'une séquence d'ADN (codant ou non) répétée en tandem (les répétition sont successives au niveau d'un même locus)
- "Mobile element" signifie qu'il s'agit d'une séquence d'ADN également retrouvée dans d'autres endroits du génome (d'autres loci), une séquence répétée donc, mais répétée dispersée et non répétée en tandem.