Aller au contenu. | Aller à la navigation

Outils personnels

Plateforme - ACCES
Navigation

Le génome nucléaire du Blé

Par Hervé Levesque Dernière modification 16/02/2024 15:12
Parmi l'ensemble du monde vivant, le Blé possède un des génomes les plus complexes, d'où des difficultés techniques - actuellement en voie d'être résolues - pour en établir la description complète

 

La taille du génome

  • Avec environ 17 Gpb (giga paires de bases, soit milliard de pb) le Blé possède l'un des génomes nucléaires les plus complexes du monde vivant. C'est 5 à 6 fois la taille du génome humain donc 10 à 12 m d'ADN dans un même noyau si l'on met bout à bout toutes les molécules (les 42 molécules puisque le caryotype est 2n=42)!
  • En outre la structure de ce génome comportant une proportion énorme de séquences répétées (voir ci-après) a fait qu'il sera - parmi les "grandes" espèces domestiquées et modèles - sans doute le dernier dont la séquence complète aura été établie. Ce séquençage complet du génome nucléaire du Blé est en voie de se terminer [lien vers le Genoscope].
  • Le chromosome 3B est en cours de publication.
  • Notons que dans ce projet de collaboration internationale, les chercheurs français - et ceux de l'INRA de Clermont-Ferrand en particulier - ont un rôle de toute première importance.
  • On a également déjà cité l'équipe du Genoscope, les uns et les autres travaillant en étroite coopération, de même que plusieurs autres équipes à l'étranger.
projet IWGSC
 

 

  • Des illustrations de ces points sont proposées dans le diaporama n°2 présenté à FormaVie 2013.

 

Un génome polyploïde

 

L'organisation du génome nucléaire du Blé

  • La distinction "ADN codant" et "ADN non codant"

NB. Cette distinction est importante pour la suite.

Une définition classiquement utilisée par la communauté scientifique pour "ADN codant" est : séquence (ou portion) d'ADN qui permet la synthèse d'une protéine ; elle serait donc synonyme de gène. Mais en réalité on trouve de l'ADN non codant (donc qui ne participe pas directement à la séquence de la protéine) au sein même des gènes, sous la forme de séquences d'ADN régulatrices, qui peuvent être ou non transcrites, sous la forme des introns qui sont issus de la transcription de l'ADN mais ne sont pas traduits puisqu'ils sont éliminés lors de l'épissage de l'ARN prémessager, etc. Ces notions sont maintenant inscrites dans le programme de SVT de la classe de Première S.

Ainsi ADN codant et ADN non codant auraient le mérite de contourner les problèmes posés par la définition très discutée du mot gène, en gagnant en clarté. Pourtant un nouvel élément s'est glissé dans la discussion, c'est l'ARN. Et il faut maintenant reconnaître que de l'ADN non codant il n'en existe vraisemblablement pas dans une cellule, n'importe quel ADN pouvant être transcrit - avec plus ou moins d'efficacité sans doute. Donc par non codant il faut entendre "non codant pour une séquence polypeptidique". Sur ce plan le blé n'échappe pas à ces difficultés et il en ajoute une supplémentaire, les pseudogènes : c'est-à-dire des gènes qui ne sont pas fonctionnels. Cette notion qui était présente dans l'ancien programme de TS et qui l'est moins dans le nouveau ne peut être ignorée lorsqu'on s'intéresse au génome nucléaire du blé. En effet lorsqu'on consulte les séquences déposées dans les banques (EBI, NCBI) il apparaît bien vite que les pseudogènes représentent une part importante. Cela tient sûrement pour beaucoup à l'origine polyploïde du blé.

  • Les transposons

Il s'agit d'éléments génétiques mobiles dont les mécanismes de mobilité (hors programme) ne seront pas décrits. Ils sont extraordinairement abondants dans le génome du blé et d'autres Graminées (Poacées) qui possèdent des génomes de grande taille dont on a établi au moins pour  partie la séquence (p ex Maïs, Orge). Tout laisse à penser qu'au cours de l'évolution de la famille des Poacées, ces transposons ont envahi le génome des espèces ayant aujourd'hui de très grands génomes. Car le riz par exemple, espèce de Poacée qui possède un génome de moindre taille, ne manifeste pas - ou beaucoup moins - ce phénomène.

Certains traits caractéristiques de séquence des transposons (en particulier les LTR, explication ci-après), les types de gènes retrouvés et en particulier celui de la polymérase, permettent d'identifier sans difficultés ce type d'élément génétique lors de l'analyse des séquences d'ADN. Certains transposons portent un nom qui les identifie et fait que l'on peut ainsi constater leur présence en des localisations multiples sur le même chromosome ou sur des chromosomes différents voire des espèces différentes (voir les activités proposées ci-après). Différents transposons (portant des noms différents) peuvent aussi se retrouver imbriqués les uns dans les autres formant des figures en mosaïque assez complexes (voir les illustrations proposées dans le diaporama n°2 présenté à FormaVie 2013).

 

Des activités possibles avec les élèves sur ce thème

Consultation en ligne des banques de séquences, extraction au sein de la banque des séquences provenant du génome nucléaire du Blé, lecture des résultats de l'extraction

Documents

  • une sélection de liens vers des pages des banques EBI (présentation davantage graphique et synthétique) et NCBI (présentation davantage textuelle avec un peu plus de commentaires)

Objectifs

  • constater l'omniprésence de séquences répétées dont des éléments génétiques mobiles (un calcul statistique peut compléter le travail)

 

Remarques :

  • Les séquences ont été extraites de la banque en interrogeant avec l'expression "triticum aestivum bac clone", les BAC sont des Bacterial Artificial Chromosome c'est-à-dire des vecteurs de clonage bactériens comportant des insertions (ici d'ADN nucléaire de Blé) de très grande dimension (plusieurs dizaines à quelques centaines de kpb).
  • Les "CDS" sont les Coding DNA Sequence c'est-à-dire les séquences codantes de l'ADN (voir § ci-avant)
  • les transposons sont des éléments génétiques mobiles qui se transposent (se déplacent) dans le génome qui les héberge ; les rétrotransposons se déplacent sous la forme d'un intermédiaire ARN (sous forme d'ADN pour les transposons)
  • Les "LTR" (Long Terminal Repeat) sont des séquences caractéristiques des éléments transposables (ou transposons)
  • Les "gap" sont des lacunes de séquences (le travail de séquençage n'étant pas encore totalement achevé)
  • "Repeat region" signifie qu'il s'agit d'une séquence d'ADN (codant ou non) répétée en tandem (les répétition sont successives au niveau d'un même locus)
  • "Mobile element" signifie qu'il s'agit d'une séquence d'ADN également retrouvée dans d'autres endroits du génome (d'autres loci), une séquence répétée donc, mais répétée dispersée et non répétée en tandem.