Document Actions

Cladistique versus phénétique

par Claire Calmet last modified 2010 May 21 20:10

Démarche pédagogique testée en TS, permettant de comprendre qu'une matrice taxon-caractère comporte davantage d'information phylogénétique que la matrice de distances correspondante : lors de la construction de la matrice de distance à partir de la matrice taxon-caractère, on résume la distribution des états de caractères à une seule valeur de distance par couple de taxons. Cette opération fait perdre toute information sur le partage des états dérivés de caractères. Résultat : une matrice taxon-caractère contenant suffisamment d'information phylogénétique pour reconstruire une phylogénie simple peut très bien se traduire en une matrice de distance dont le traitement conduit à une phylogénie erronée. N.B. : les illustrations sont à venir ...

 On cherche à comparer deux méthodes de reconstruction phylogénétique : la méthode cladistique et une méthode phénétique. Pour cela, on se propose de chercher à établir les relations de parenté entre 4 espèces de Vertébrés (4 "taxons"), d'abord par la méthode cladistique, puis par une méthode phénétique. Afin que les résultats obtenus soient comparables, les deux méthodes sont appliquées au même jeu de données initial.

 

Les 4 taxons choisis sont des Vertébrés : AIGLE, MESANGE, CROCODILE et LEZARD. Au départ, on ne fait aucune hypothèse sur les relations de parenté entre ces 4 taxons. On part donc d'un arbre totalement irrésolu (un "rateau") :

( AIGLE , MESANGE , CROCODILE , LEZARD ) Arbre irresolu

Les deux méthodes utilisent le fait que certains caractères (attributs observables des organismes) homologues (hérités d'un ancêtre commun) se présentent sous des états légèrement différents d'une espèce à l'autre. Par exemple, les membres antérieurs de l'AIGLE, de la MESANGE, du CROCODILE et du LEZARD sont homologues, mais se présentent sous forme d'ailes chez l'AIGLE et la MESANGE, et sous forme de pattes chez le CROCODILE et le LEZARD. On a donc, pour le caractère "membre antérieur", deux états de caractères, "ailes" et "pattes", qui doivent pouvoir nous renseigner sur les relations de parenté entre les 4 taxons. 

 

Question 1 : spontanément, quel(s) regroupement(s) pensez-vous pouvoir faire d'après les états du caractère "membre antérieur" ? Tracez l'arbre correspondant. Justifiez votre choix.

Réponse élève la plus fréquente (ne pas les détromper de suite) : le caractère nous informe sur la parenté étroite entre AIGLE et MESANGE d'une part et CROCODILE et LEZARD d'autre part. On regroupe ensemble les taxons qui présentent le même état de caractère.

( (AIGLE , MESANGE) , (CROCODILE , LEZARD) ) Arbre 1

APPROCHE CLADISTIQUE : CONSTRUCTION ET ANALYSE D'UNE MATRICE TAXON-CARACTERE

Réflexion méthodologique

Dans la méthode cladistique, les deux états "patte" et "aile" du caractère "membre antérieur" ne sont pas considérés comme équivalents. En effet, un des deux états existait chez le plus récent ancêtre commun des 4 taxons (cet état est qualifié d'ancestral), et l'autre est apparu, par modification de l'état ancestral, chez un ancêtre de certains seulement des taxons (cet état est qualifié de dérivé).

Différentes observations permettent d'identifier l'état ancestral et l'état dérivé. En voici quelques-unes :

Observation 1 : les amphibiens (grenouilles, salamandres) possèdent des pattes. C'est le critère de "groupe extérieur", en faveur de l'état ancestral "pattes".

Observation 2 : les archives fossiles révèlent des Vertébrés à quatre pattes beaucoup plus anciens que les premiers Vertébrés à 2 ailes et 2 pattes. C'est un critère paléontologique, en faveur lui aussi de l'état ancestral "pattes".

Observation 3 : les membres postérieurs de l'aigle et de la mésange sont "restés" à l'état de patte, observation en faveur de l'état ancestral "pattes".

On est donc capables de "polariser" le caractère "membre antérieur" : l'état "patte" est le caractère ancestral, et l'état "aile" est un état dérivé, qui représente une innovation évolutive par rapport à l'état patte. La méthode cladistique exploite le fait que seul le partage d'un état dérivé de caractère témoigne d'une étroite parenté.

 

Question 2 : placez sur les quelques arbres ci-dessous la (ou les) innovation(s) à l'origine de la coexistence de deux états du caractère "membre antérieur". Quel(s) arbre(s) regroupe(nt) les taxons uniquement sur le critère de partage d'une innovation évolutive ?

Arbre 1 : ( ( AIGLE , MESANGE ) , ( CROCODILE , LEZARD) ) Arbre 1 =====>     Arbre 1’

Arbre 2 : ( AIGLE , MESANGE , ( CROCODILE , LEZARD ) ) Arbre 2     =====>     Arbre 2’

Arbre 3 : ( ( AIGLE , MESANGE ) , CROCODILE , LEZARD ) Arbre 3     =====>     Arbre 3’

Arbre 4 : ( ( ( AIGLE , MESANGE) , CROCODILE ) , LEZARD ) Arbre 4     =====>     Arbre 4’

Arbre 5 : ( ( ( AIGLE , MESANGE) , LEZARD ) , CROCODILE ) Arbre 5     =====>     Arbre 5’

Réponse élève attendue : seul l'arbre 3 fait le regroupement ( AIGLE , MESANGE ) justifié par le partage de l'état dérivé "ailes" du caractère "membre antérieur", sans faire de regroupement non justifié comme ( CROCODILE , LEZARD ).

 

Conclusion sur la méthode :

Dans la méthode cladistique, les premières étapes - cruciales- dans l'établissement de relations de parenté sont donc l'observation des organismes, la construction d'un tableau indiquant les états de caractères pour les différents taxons (la matrice taxons-caractères), et la polarisation des caractères. Les regroupements phylogénétiques se basent sur le partage des états dérivés des caractères.

 

Application de la méthode cladistique

Matériel : logiciel phylogène et banque de données Vertébrés (Lycée)

Pour l'utilisation proprement dite du logiciel Phylogène, se reporter à la présentation du logiciel, sur le site ACCES. Seules des indications succinctes sont fournies ci-dessous en italique.

  • Construction d'une matrice taxons-caractères

Taxons à sélectionner : Aigle, Mésange, Crocodile, Lézard.

Caractères à sélectionner : branchies, membres pairs, amnios, doigts, fenêtre mandibulaire, température, plumes, bréchet.

Ouvrir le logiciel Phylogène. Ouvrir la banque des Vertébrés. Choisir le menu CONSTRUIRE pour construire une matrice d'états de caractères. Sélectionner par un clic les 4 taxons choisis pour l'étude. Sélectionner par un clic les caractères choisis. Remplir la matrice taxon-caractère, à partir des observations obtenues en cliquant sur chacune des cases. Vérifier la matrice complétée et la corriger éventuellement.

 Matrice taxons caractères

  • Exploitation de la matrice taxons-caractères

Matériel : matrice taxons-caractères construite ci-dessus dans Phylogène.

Dans le logiciel Phylogène, choisir le menu ARBRE.

Un arbre totalement irrésolu (multifurcation, "rateau") s'affiche : on ne sait pas a priori quelles espèces sont les plus apparentées. Puisque seul le partage d'une innovation évolutive témoigne d'une étroite parenté, les caractères "informatifs" dans la méthode cladistique dont ceux pour lesquels une innovation évolutive est partagée par seulement certains des taxons à classer. Autrement dit, un caractère informatif est un caractère qui se présente sous au moins deux états, dont un état dérivé présent chez au moins deux des taxons à classer.

 

 

Question 3 : avec la définition d'un caractère informatif proposée, quels caractères de la matrice sont informatifs pour le problème posé ?

S'aider en cliquant successivement sur les noms des différents caractères : des couleurs correspondant aux états s'affichent. La couleur bleue indique l'état ancestral et les autres couleurs (jaune notamment) indiquent le(s) état(s) dérivés.

 

Réponse élève attendue : les caractères branchies, membres pairs, amnios et cavités du coeur se présentent sous un seul état, parmi les 4 taxons à classer. Ces caractères ne portent donc aucune information phylogénétique sur les relations de parenté entre ces 4 taxons : ils ne sont pas informatifs. Les 4 autres caractères proposés sont informatifs :

- le caractère "fenêtre mandibulaire" est présent à l'état ancestral ("absence" de fenêtre mandibulaire) chez le lézard et à l'état dérivé ("présence") chez l'Aigle, la mésange et le crocodile. Ce caractère est donc en faveur d'un regroupement

( ( AIGLE , MESANGE , CROCODILE) , LEZARD )

- les caractères "température" , "plumes" et "bréchet" sont présents à l'état ancestral chez  le crocodile et le lézard, et à l'état  dérivé chez l'aigle et  la mésange. Ces 3 caractères sont donc en faveur d'un regroupement

( ( AIGLE , MESANGE ) , CROCODILE , LEZARD )

 

 

Question 4 : exploitez les caractères informatifs un par un, en regroupant les espèces porteuses d'états dérivés partagés. Quel arbre obtenez-vous en appliquant la méthode cladistique, parmi les arbres proposés ci-dessous ?

Arbre I : ( ( AIGLE , MESANGE ) , ( CROCODILE , LEZARD) )

Arbre II : ( ( ( AIGLE , MESANGE) , CROCODILE ) , LEZARD )

Arbre III : ( ( ( AIGLE , MESANGE) , LEZARD ) , CROCODILE )

Arbre IV : ( AIGLE , ( MESANGE , ( CROCODILE , LEZARD ) ) )

Arbre V : ( AIGLE , (CROCODILE , ( MESANGE , LEZARD ) ) )

 

 

Réponse élève attendue : la méthode cladistique, appliquée à cette matrice taxon-caractère, permet de proposer la phylogénie correspondant à l'arbre II. On a un regroupement du crocodile, de la mésange et de l'aigle (à l'exclusion du lézard), soutenu par 1 innovation évolutive. Puis, entre crocodile, aigle et mésange, on a un regroupement plus étroit encore de l'aigle et de la mésange, soutenu par 3 innovations évolutives.

Question 5 : pour chacun des caractères informatifs, placez les innovations évolutives (en minimisant le nombre d'événements évolutifs), non seulement sur l'arbre que vous avez obtenu par la méthode cladistique, mais aussi sur les autres arbres proposés. Quel est l'arbre le plus court (c'est à dire l'arbre qui comporte le moins d'innovations évolutives) ?

Remarque : vous pouvez être amené à supposer l'apparition indépendante d'un même état dérivé sur plusieurs branches, ou à  supposer un retour à l'état ancestral.

 

Réponse élève attendue : le tableau ci-dessous indique, pour les 5 arbres proposés, le nombre minimal d'événements évolutifs qui doit être supposé pour expliquer la distribution des états de caractères au sein des 4 taxons.

Arbre I : 5    Arbre II : 4    Arbre III : 5    Arbre IV : 8    Arbre V : 9

L'arbre le plus court est donc celui qui a été obtenu en regroupant les espèces uniquement d'après le partage d'états dérivés de caractères.

 

Retour (collectif) sur la notion de caractère informatif et sur la méthode cladistique :

    Le critère proposé pour reconnaître un caractère informatif (au moins deux états, dont un état dérivé partagé par au moins 2 taxons) est donc un moyen pratique pour identifier les caractères dont la distribution des états ne peut s'expliquer par un même nombre minimal d'événements évolutifs quel que soit l'arbre. Pour chaque caractère informatif, certains arbres sont plus courts (plus parcimonieux) que d'autres. La méthode cladistique vise à identifier les arbres les plus parcimonieux, tous caractères de la matrice confondus, et propose que l'arbre le plus parcimonieux correspond à la phylogénie véritable.

    Toute modification de la matrice taxon-caractère peut conduire à une modification de la phylogénie la plus parcimonieuse. On se base donc sur le traitement de plusieurs matrices taxons-caractères de grande dimension (nombreux taxons, nombreux caractères), pour s'assurer d'un résultat fiable. Certaines relations phylogénétiques, comme la parenté entre crocodiles et oiseaux, que vous venez de mettre en évidence, sont maintenant établies de façon très forte. D'autres relations phylogénétiques demeurent incertaines (la position phylogénétique des tortues en est un exemple).

 

APPROCHE PHENETIQUE : CONSTRUCTION ET ANALYSE D'UNE MATRICE DE DISTANCES

Réflexion méthodologique

Il est possible de résumer l'information contenue dans une matrice taxon-caractère (comprenant un nombre T de taxons et un nombre C de caractères) par une liste de valeurs numériques reflétant la "distance" entre paires de taxons. On peut alors remplacer la matrice taxon-caractères (qui comporte T x C cases) par une matrice de distances qui comporte T x (T - 1) / 2  cases. Si le nombre de caractères étudié est important (comme par exemple lorsque l'on traite des données moléculaires, pour lesquelles chaque position dans la séquence correspond à un caractère), la matrice de distances est beaucoup plus petite que la matrice taxons-caractères. Le traitement de la matrice de distance est donc potentiellement plus rapide que celui de la matrice taxons-caractères (un programme chargé de traiter les données devra "tourner" moins longtemps !). Il existe une multitude de façons de mesurer des distances, mais une méthode simple et intuitive consiste tout simplement à compter le nombre de caractères se présentant sous des états différents, pour chaque paire de taxons.

Une fois la matrice de distances obtenue, il existe différents algorithmes de construction d'arbre.  Le plus simple consiste à regrouper les taxons les moins distants, et à mettre à jour la matrice de distances au fur et à mesure des regroupements, jusqu'à la racine de l'arbre.

Application de la méthode phénétique

  • De la matrice taxons-caractères à la matrice de distance

 

Question 6 : reprendre la même matrice taxons-caractères que précédemment. Pour chaque paire de taxons, compter le nombre de caractères dont l'état diffère entre les 2 taxons. Reporter ce nombre au croisement des colonnes correspondant aux 2 taxons.

Par exemple, on a 3 caractères sous des états différents entre le crocodile et l'aigle, ce qui donne une distance de 3 entre ces deux taxons.

Matrice de distances attendue (les cases non remplies feraient double emploi avec d'autres cases) :

 

    AIGLE   MESANGECROCODILE LEZARD
AIGLE0   
MESANGE00  
CROCODILE330 
LEZARD4410

  • Exploitation de la matrice de distance : construction d'un arbre en suivant un algorithme simple

Les taxons les moins distants sont l'AIGLE et la MESANGE, qui ne présentaient aucune différence d'état de caractère, dans la matrice taxons-caractères (distance 0). L'algorithme utilisé pour construire l'arbre consiste à regrouper ces deux taxons, et à remplir une nouvelle matrice, qui regroupe les cases AIGLE et MESANGE de la matrice précédente (les distances sont alors les moyennes des distances regroupées). On procède ensuite de même avec la nouvelle matrice de distance.

 

Question 7 : appliquer l'algorithme proposé jusqu'à obtention d'un arbre.

Matrices successives attendues

Après regroupement de l'aigle et de la mésange :

 

 (AIGLE, MESANGE)CROCODILE   LEZARD  
(AIGLE , MESANGE)0  
CROCODILE30 
LEZARD410

 

Le regroupement suivant concernera le LEZARD et le CROCODILE, qui sont les moins distants, et donnera la matrice :

 

 (AIGLE , MESANGE)(CROCODILE , LEZARD)
(AIGLE , MESANGE)0 
(CROCODILE , LEZARD)3.50

 

On regroupe, enfin, les deux lignées restantes, pour obtenir l'arbre numéroté I (à la question 4) :

( ( AIGLE , MESANGE ) , ( CROCODILE , LEZARD ) )

 

 

Question 8 : comment expliquez-vous que l'arbre obtenu soit différent de celui que vous aviez obtenu par la méthode cladistique ? (autrement dit, pourquoi êtes-vous amené à regrouper CROCODILE et LEZARD, dans l'approche phénétique ?)

Réponse attendue : la matrice de distance se contente d'indiquer le nombre d'états de caractères différents entre taxons, mais ne donne aucune information sur la nature de ces différences. Il y a seulement une différence entre LEZARD et CROCODILE, alors qu'il y a 3 différences entre CROCODILE et le groupe (AIGLE , MESANGE). On regroupe donc LEZARD et CROCODILE, par la méthode phénétique. Mais lors du passage de la matrice taxons-caractères à la matrice de distances, on a perdu l'information sur le partage d'un état dérivé entre CROCODILE et les deux espèces d'oiseaux (présence d'une fenêtre mandibulaire). Cette information, exploitée par la méthode cladistique, est ici noyée par le regroupement avec les autres caractères (les 3 états dérivés communs aux deux oiseaux empêchent l'information concernant la fenêtre mandibulaire de "passer").

 

Conclusion générale (collective) :  la matrice taxons-caractères contient une information phylogénétique (partage d'états dérivés des caractères) dont une partie est perdue lors du remplacement de la matrice taxons-caractères par une matrice de distances. Même si la matrice taxons-caractères permet une reconstitution phylogénétique correcte, le traitement phénétique de la même information de départ peut conduire à une phylogénie erronée, du fait de cette perte d'information. Les deux méthodes ne sont donc pas équivalentes.

 

Remarque :

Un pont est possible avec les mathématiques. L'idée est la suivante : si l'on dispose d'une distribution (par exemple un histogramme des notes à un devoir), on peut résumer cette distribution par une moyenne (la note moyenne au devoir). Mais si l'on vous donne la moyenne, il n'y a aucun moyen de remonter à la distribution : il y a une multitude de distributions des notes qui donnent la même moyenne. Il y a une perte d'information lors du passage de la distribution complète à la moyenne.

Le remplacement de l'information de la matrice taxons-caractères par une matrice de distance est de même nature : les distances résument les distributions des états de caractères de façon incomplète. Autant, à partir de la matrice taxons-caractères, on peut construire la matrice de distances, autant remonter de la matrice de distances à la matrice taxons-caractères est mission impossible. Il y a eu perte d'information, lors du passage de la matrice taxons-caractères à la matrice de distances.

 

Personal tools