Les méthodes phénétiques
Remarque : plusieurs centaines de milliers de séquences sont maintenant connues, appartenant à des milliers d'organismes. Cependant, pour un organisme particulier, le nombre de gènes séquencés reste limité. Pour certaines collections (les Vertébrés en particulier), il est encore impossible de choisir un ensemble de taxons présents dans Phylogène, d'y travailler avec les données anatomiques et morphologiques, et de poursuivre le travail sur les mêmes taxons avec des données moléculaires.
Tracer un arbre à partir de données moléculaires
Phylogène permet de tracer un arbre à partir d'un fichier contenant des séquences nucléiques ou protéiques . Ces séquences peuvent être alignées ou non.
A partir d'un fichier de séquences alignées
Plusieurs fichiers de séquences alignées sont fournis avec le logiciel. Quelques unes sont adaptées à l'étude de ces relations de parentés sur l'ensemble du vivant. D'autres sont appropriées pour mettre en évidence la notion de famille multigénique ainsi que l'histoire des allèles d'un gène au cours de l'évolution. Ces fichiers au format .aln ont été alignés préalablement avec le logiciel ClustalW.
Pour accéder à ces fichiers, choisir dans le menu de Phylogène Fichier, puis Ouvrir un Tableau de molécules.
En choisissant le fichier cytoxy2.aln (Collection des Archontes) et en cliquant ensuite sur le bouton "Arbre", on obtient le résultat correspondant.
En cliquant sur les boutons portant les noms des taxons, on retire ou on rajoute ces taxons dans l'arbre (si le paramètre "enlever-taxon=oui" dans le fichier phylini.ini. Ce paramètre doit avoir la valeur non si Phylogène est utilisé au collège (Manipulation des taxons et des branches non souhaitable).
Matrice des distances
La matrice des distances associée à cet arbre est obtenue en cliquant sur le bouton correspondant.
Options
Arbres
Présente les 3 modalités de construction possibles.
Pour une vue exhaustive des méthodes de construction consulter :
Par défaut, l'arbre est tracé avec la méthode UPGMA.
D'après cette méthode, le racinage de l'arbre est situé à égale distance entre les branches. Il n'est donc pas possible de le réenraciner. En revanche, on peut permuter les branches ou afficher les distance avec les outils appropriés.
La méthode NJ (Neighbor Joining) : Le racinage de l'arbre est choisi arbitrairement. On peut donc inclure dans l'échantillonnage un groupe extérieur et réenraciner par rapport à ce groupe.
"L'arbre Clade" permet de traiter les données moléculaires comme les données anatomiques et morphologiques, c'est à dire en appliquant une approche cladistique. Cependant, comme il est impossible de savoir pour chaque acide aminé ou pour chaque base quels sont les états primitif et évolué, cette méthode est difficilement utilisable au lycée avec les données moléculaires.
Distances
Donne accès aux différentes modalités d'affichage et de traitement.
Ajouter une séquence
A un fichier de molécule affiché, on peut ajouter une nouvelle séquence. Celle-ci, de même nature que les séquences du fichier affiché, doit être au format PIR avec comme extension .pro ou .adn. L'ajout d'une séquence appelle logiquement un réalignement de l'ensemble des séquences. A manipuler donc avec prudence.
A partir d 'un fichier de séquences non alignées
Phylogène (comme Clustal) accepte d'aligner des séquences contenues dans un seul fichier au format PIR. Dans ce format, chaque séquence est précédée d'une ligne comportant le signe > suivi du nom de la séquence (en un seul mot). La séquence ne doit comporter aucun espacement. Il n'y pas non plus de ligne vide entre deux séquences. Exemple :
> Pan-Paniscus
MAHAAQVGLQDATSPIMEELIIFHDHALMIIFLICFLVLYALFLTLTTKLTNTSISDAQEMETVWTILPA
IILVLIALPSLRILYMTDEVNDPSFTIKSIGHQWYWTYEYTDYGGLIFNSYMLPPLFLEPGDLRLLDVDN
RLVLPVEAPVRMMITSQDVLHSWAVPTLGLKTDAIPGRLNQTTFTATRPGVYYGQCSEICGANHSFMPIV
LELIPLKIFEMGPVFTL
> Pan-Troglodytes
MAHAAQVGLQDATSPIMEELIIFHDHALMIIFLICFLVLYALFLTLTTKLTNTSISDAQEMETVWTILPA
IILVLIALPSLRILYMTDEVNDPSFTIKSIGHQWYWTYEYTDYGGLIFNSYMLPPLFLEPGDLRLLDVDN
RVVLPVEAPVRMMITSQDVLHSWAVPTLGLKTDAIPGRLNQTTFTATRPGVYYGQCSEICGANHSFMPIV
LELIPLKIFEMGPVLTL
La méthode cladistique a été mise au point par William Hennig dans les années 1960.
La méthode cladistique est basée sur la notion d'homologie. On n'établira des relations de parenté que sur la base du partage des états évolués des caractères (ou homologies).
Lorsqu'une nouveauté évolutive apparaît chez un organisme, elle sera transmise à tous ses descendants. On peut donc tenir le raisonnement suivant : lorsque plusieurs être vivants partagent une même nouveauté évolutive (homologie), ils l'ont héritée d'un même ancêtre, qui leur est propre (ancêtre commun), et chez qui cette nouveauté est apparue.
Pour appliquer la méthode cladistique, il faut donc identifier les différents états d'un caractère, et distinguer l'état primitif de l'état évolué. Pour définir ces états, on applique souvent des critères paléontologiques : l'état évolué est celui qui est apparu le plus récemment ; on peut aussi parfois appliquer un critère ontogénique : le caractère évolué apparaît plus tard au cours du développement).