Mise
à jour : 26/07/2007
Glossaire
Histoire
Téléchargements
Qu'est-ce qu'un intermédiaire
?
La notion d'homologie
La notion de fossile vivantest-elle
valable ?
Qu'est-ce qu'un ancêtre
?
Qu'est-ce qu'un arbre
phylogénétique ?
Construction d'une classification phylogénétique |
Construction d'une classification
phylogénétique
Guillaume Lecointre, MNHN
La reconstruction des liens de parenté ne résulte pas
une découverte fortuite ou révélée mais résulte
de décisions préalables réfléchies, qui sont
autant de postulats :
-
Une question posée au départ. Etape de définition
du problème phylogénétique, c'est-à-dire délimitation
du groupe d'intérêt ("ingroup").
-
Le choix d’un échantillon d’organismes propres à répondre
à cette question : c’est l’échantillonnage taxonomique. Cette
étape consiste aussi à choisir un ou plusieurs points de
référence externes, le(s) extra-groupe(s). Ces organismes
sont postulés extérieurs au groupe d’intérêt,
c’est-à-dire extérieur à tous ceux dont on veut définir
les relations de parenté. Les extra-groupes serviront à enraciner
le(s) futur(s) arbre(s).
-
Le choix et/ou la détection des caractères qui seront
informatifs pour la question posée : c’est l’échantillonnage
des caractères.
-
Le codage et la construction de la matrice des caractères.
Nous nous intéresserons à une matrice de caractères
morphologiques codée en vue d’une analyse cladistique. Il faut savoir
qu’il existe d’autres types de matrices, les matrices de distances, que
nous laisserons de côté pour le moment. Ce codage comprend
l’étape d’établissement des homologies primaires (principe
des connexions, alignement des séquences) et l’étape de polarisation
des caractères (critère du groupe extérieur ou critère
ontogénétique) ; puis l’inscription du fruit de cette analyse
dans une matrice de catactère.
-
L’exploration des arbres possibles. A un nombre fixé de taxons
dans la matrice correspond un nombre précis d’arbres possibles.
Pour quatre taxons dont un est préalablement défini comme
extra-groupe, il existe trois arbres racinés possibles. Pour cinq
taxons, il existe 15 arbres racinés possibles, etc. L’idéal
est de les évaluer tous au regard des informations contenues dans
la matrice.
-
L’évaluation de chacun de ces arbres au regard de la matrice.
-
Le choix d’un critère de choix d’un arbre : ce critère
est la parcimonie. On choisit l’arbre le plus parcimonieux, c’est-à-dire
l’arbre qui requiert le plus petit nombre d’événements évolutifs
entre les états de caractères présentés par
les organismes. Mais il faut savoir qu’il existe d’autres critères
de choix d’un arbre. Par exemple, sur la base d’une approche probabiliste
parfois appliquée aux données de séquences nucléiques
ou protéiques, approche où l’on peut associer à certaines
transformations d’un acide nucléique en un autre une certaine probabilité,
on choisira l’arbre le plus vraisemblable : c’est l’arbre dont la vraisemblance
(produit des probabilités) est maximale. A partir d’une approche
de distances, on choisira l’arbre dont les distances arborées entre
organismes sont les plus fidèles possible aux distances de la matrice
de départ ; dans ce cas c’est choisir l’arbre dont la matrice d’arrivée
distord le moins possible la matrice de départ.
-
Le choix d’un arbre, ce sera l’arbre le plus "court", c’est-à-dire
qui demande le minimum d’hypothèses de transformation des caractères.
Cet arbre permet :
-
l’identification des états des caractères qui définissent
chacun des nœuds (= clades) de l'arbre obtenu (les synapomorphies = homologie
de filiation ou homologie secondaire).
-
l’identification des états homoplasiques, et éventuellement
établissement de conclusions sur le mode d'évolution des
caractères.
-
la création une classification phylogénétique, c'est-à-dire
l’assignation d'un nom de groupe à chaque nœud (= clade) fiable
de l'arbre.
Application : Mise en pratique
de la notion de parcimonie
Une question posée au départ : Quel est le groupe-frère
des oiseaux ?
Une polémique a eu lieu au début des années 1980
; elle consistait à tester si les oiseaux étaient groupe-frère
des mammifères (comme semblaient l’indiquer les caractères
de l’anatomie molle) ou le groupe-frère des crocodiles (comme semblaient
l’indiquer les caractères de l’anatomie du squelette lorsque les
fossiles étaient analysés simultanément).
Un échantillon d’organismes propres à répondre
à cette question : si l’on décide d’échantillonner
le moins d’organismes possible pour des raisons didactiques, la question
du groupe-frère des oiseaux peut être explorée en choisissant
trois amniotes : un coq, un alligator et un chien. Extra-groupe : un non-amniote,
par exemple une grenouille.
Echantillonnage des caractères. Il s’agit d’observer des
attributs de ces organismes qui permettent de différencier deux
d’entre les trois.
-
Homéothermie : présente chez le coq et le chien, mais pas
chez l’alligator ;
-
Mandibule perforée : présente chez le coq et le crocodile,
mais pas chez le chien
-
Gésier : présent chez le coq et le crocodile, mais pas chez
le chien.
-
Plume : cet attribut n’est pas partagé par deux entre les trois
puisqu’il est unique au coq dans cet échantillon.
Remarque : il pourrait y en avoir beaucoup
plus, la liste est limitée ici pour des raisons didactiques.
Le codage et la construction de la matrice des caractères .
Nous nous intéresserons à une matrice de caractères
morphologiques codée en vue d’une analyse cladistique. L’état
trouvé chez l’extra-groupe, ici la grenouille, est codé "0"
par convention. L’état qui en diffère est codé "1".
L’analyse cladistique consiste à ne regrouper les organismes que
sur la base d’innovations, c’est-à-dire sur le partage d’états
qui sont différents de celui trouvé chez l’extra-groupe.
Ainsi le caractère 1 est à l’état "0" chez la grenouille
(poïkilothermie) et à l’état "0" chez l’alligator (poïkilothermie
également). Il est à l’état "1" chez le coq et le
chien (homéothermie). Le caractère 1 plaidera pour un regroupement
chien-alligator. Selon la même règle, le caractère
2 plaidera pour un regroupement coq-alligator (absence de perforation de
la mandibule chez la grenouille et le chien (état 0), présence
de perforation chez le coq et l’alligator (état 1). Il en va de
même pour le caractère 3. Quant au caractère 4, on
constate l’absence de plumes chez la grenouille (état "0"), l’absence
de plumes aussi chez l’alligator (état "0") et chez le chien (état
"0"). Or, on ne peut regrouper le chien et l’alligator sur la base du "0"
partagé puisque cet état est déjà constaté
dans l’extra-groupe (c’est donc qu’il ne signe pas un apparentement dans
le groupe d’étude mais un apparentement beaucoup plus ancien qui
n’intéresse pas laquestion posée au sein du groupe d’étude).
Ce caractère ne fait donc que regrouper le coq avec lui-même.
Il n’est donc pas informatif au regard de la question posée.
Remarque : lorsque l’on code "1", par exemple
pour le caractère 3, on émet une hypothèse d’homologie
(voir plus loin) : on suppose que le gésier du crocodile est l’homologue
du gésier du coq.
L’exploration des arbres possibles. Pour quatre taxons dont un est
préalablement défini comme extra-groupe (la grenouille),
il existe trois arbres racinés possibles :
celui qui regroupe le coq et l’alligator
celui qui regroupe le coq et le chien
celui qui regroupe le chien et l’alligator.
L’évaluation de chacun de ces arbres au regard de la matrice.
Pour chaque caractère, on tentera ici de placer dans chaque arbre
le point où la transformation a lieu (de 0 vers 1 ou de 1 vers 0),
de manière à produire le moins de transformations possibles.
On remarquera que chacun des trois arbres ne demande pas le même
nombre de pas que les deux autres. L’arbre 1 requiert 5 transformations.
L’arbre 2 en requiert 6. L’arbre 3 requiert 7 transformations. Remarque
: lorsque l’arbre oblige à placer deux transformations pour un caractère,
on a le choix entre deux transformations terminales, c’est-à-dire
en bout de branche, ou une transformation précoce suivie d’une réversion.
Le premier cas est celui de la convergence évolutive, le deuxième
cas est celui de la réversion. Les deux hypothèses "coûtent"
le même nombre de transformations, elles n’influent donc pas sur
le choix ultérieur de l’arbre. Ces situations sont des cas d’homoplasie.
Le choix d’un critère de choix d’un arbre : ce critère
est la parcimonie, on choisit l’arbre qui requiert le plus petit nombre
d’événements évolutifs entre les états de caractères
présentés par les organismes.
Le choix d’un arbre : l’arbre choisi est donc l’arbre 1. L’oiseau
est plus proche de l’alligator qu’il ne l’est du chien.
Remarque : c’est l’arbre le plus parcimonieux qui permet de
connaître l’évolution des caractères. Ici, l’arbre
1 nous dit que nous avions eu raison de supposer que le gésier de
l’oiseau était l’homologue du gésier de l’alligator. Ce pari
sur l’homologie est gagné : l’arbre nous dit que l’organe a bien
été acquis d’un ancêtre commun hypothétique
(c’est l’homologie de filiation ou homologie seccondaire). En revanche,
l’arbre 1 nous dit aussi que nous avions eu tort de parier que l’homéothermie
de l’oiseau et celle du chien étaient homologues. Elles ne le sont
pas, puisqu’elles ont été acquises deux fois indépendemment
(convergence). Si, au lieu de supposer une convergence, nous avions opté
pour l’hypothèse de la réversion, c’est-à-dire une
perte secondaire de l’homéothermie chez l’alligator, cette homéothermie
eût bien été acquise d’un ancêtre commun, mais
cet ancêtre hypothétique est commun à plus d’organismes
qu’aux chien et oiseau (en fait aux trois organismes ici présents),
et donc reflète une parenté plus ancienne qui ne répond
plus à la question posée.
On pourra refaire le même exercice avec pour question : les chauve-souris
sont elles des oiseaux ou des mammifères volants ? espèces
choisies : un homme un pigeon une chauve-souris extra-groupe : une grenouille.
-
caractère 1 : ailes
-
caractère 2 : poils
-
caractère 3 : mammelles
|