2.2 les dendrogrammes · d'unités évolutives (ue), d'unités évolutives hypothétiques...

2.2 Les dendrogrammes

Le dendrogramme est une figure arborescente. Si, dans sa construction, l'on

introduit l'hypothèse que les ressemblances sont le reflet d'une relation de parenté, le

dendrogramme est généalogique ; si l'on introduit celle que les ressemblances

évoluent au cours du temps, le dendrogramme est phylogénétique. Les

dendrogrammes retenus dans cette section mettent en évidence des ressemblances

entre différents taxons.

L'objectif de recherche est souvent double ; dans un premier temps, il s'agit de

mettre en évidence sur un schéma synthétique (le dendrogramme) les relations

généalogiques ou évolutives entre plusieurs taxons ; dans un second temps,

d'apprécier leur degré de divergence. Ce dernier est estimé en fonction soit du temps

qui sépare les taxons, soit des différences génétiques, moléculaires ou autres

accumulées entre ces mêmes taxons.

Les constructions phylogénétiques sont bâties principalement à partir de

l'anatomie comparée, l'ontogénie et la paléontologie.

L'anatomie comparée a pour objectif de rechercher les homologies en utilisant,

par exemple, le principe de subordination des caractères de B. de JUSSIEU ( les

caractères constants sont plus importants que les caractères inconstants), ou encore

celui des connexions de É. GEOFFROY SAINTHILAIRE (voir la section précédente) : quelles

que soient leur forme, leur taille ou leur fonction, des organes sont reconnus

homologues s'ils possèdent les mêmes connexions avec d'autres organes.

L'ontogénie utilise le principe de récapitulation (loi biogénétique fondamentale)

de E. HAECKEL, mais reformulé par Gareth NELSON (1973) : lorsque l'on peut suivre la

transformation d'un caractère d'un état général vers un état plus spécialisé, le

caractère le plus général est le plus ancien, le moins général est le plus récent, dérivé

du premier. La règle de G. NELSON, qui n'est pas sans rappeler les deux premières

règles de K. E. von BAER, est une hypothèse de travail et non une loi.

La paléontologie fournit des arguments morphologiques, mais aussi des

arguments chronologiques.

À ces données traditionnelles s'ajoutent aujourd'hui celles de la biologie

moléculaire : séquençages des protéines, de l'ADN, de l'ARN, hybridation de l'ADN.

L'unité de base de la construction phylogénétique est très souvent l'espèce,

puisqu'elle est un groupe génétique fermé : l'interfertilité existe uniquement entre ses

103

membres. Mais certains auteurs rejettent cet usage de l'espèce, car leurs travaux

concernent des populations plus que des espèces entières : sousespèces et espèces

sont alors confondues. Pour éviter l'emploi du mot « espèce », les taxons sont qualifiés

d'unités évolutives (UE), d'unités évolutives hypothétiques (UEH) s’ils sont de pures

constructions fictives, ou encore d’unités taxinomiques opérationnelles (UTO ou OTU

dans la terminologie anglosaxonne). Les taxons sont parfois de niveau

supraspécifique ; dans ce cas, ils doivent appartenir à une même lignée phylétique

(lignée monophylétique) pour demeurer comparables.

Les arbres sont composés de deux régions : les noeuds où sont placés les

taxons qui sont souvent des UEH, car on ne connaît pas les formes fossiles, et les

branches qui indiquent le degré de parenté des différents taxons. La longueur des

branches est proportionnelle au temps ou bien aux différences entre taxons (fig. 2.15).

À leurs extrémités figurent les taxons terminaux qui sont des UE.

Fig. 2.15

Si l'arbre est enraciné (fig. 2.15A), la racine représente l'ancêtre commun et il précise

alors les relations évolutives des différents taxons présents. Mais l'arbre est souvent

dépourvu de racines (fig. 2.15B) : il rend compte uniquement des relations de parenté,

sans que l'on puisse savoir comment l'évolution passe d'un taxon à l'autre. Cependant

un arbre peut être enraciné si on le construit avec un taxon extérieur au groupe, UE

extragroupe, qui sera la référence pour estimer les degrés de ressemblance entre les

taxons étudiés. Il est nécessaire de connaître précisément les données taxinomiques

104

ou paléontologiques de cette UE extragroupe ; il faut, en effet, être sûr qu'elle a

divergé bien avant l'ancêtre commun aux UE considérées (fig. 2.15A). Lorsque l'on

dispose d'un certain nombre d'UE dont on veut établir la parenté, le nombre théorique

d'arbres possibles augmente très rapidement :

avec n unités (UE) et si l'arbre est enraciné, il y a N1 arbres théoriques, soit :

N1 = (2n 3) ! : 2 n2 (n 2) !

avec n unités (UE) et si l'arbre n'est pas enraciné, il y a N2 arbres possibles, soit

:

N2 = (2n 5) ! : 2 n2 (n 2) !

Si n = 10, N1 est égal à 35.106 et N2 à 2.106 ; la formule exprime les incertitudes pour

déterminer l'arbre exact parmi plusieurs millions. Un exemple sera donné à propos de

l'émergence de l'Homme moderne à la section 4.4.3 : « Le modèle unirégional ou

monocentrique, discussion ».

Les classifications phylogénétiques utilisent abondamment le critère

d'homologie. Les ressemblances sans lien de parenté sont des homoplasies parmi

lesquelles on distingue les convergences (ressemblances adaptatives) et les

réversions, brusque apparition d'un caractère rappelant un caractère ancestral. Un

caractère ancestral est plésiomorphe ; un caractère dérivé est apomorphe.

Parmi les quatre méthodes principales phénétique, cladistique, probabiliste et de

compatibilité , seules seront évoquées les deux premières, car ce sont les plus

fréquentes.

2.2.1 La méthode phénétique ou numérique

Conçue par Charles MICHENER et Robert SOKAL (1957), elle utilise un nombre

réduit de principes. La construction des arbres phénétiques (phénogrammes) repose

sur les ressemblances observées entre chaque paire d'UE (unité évolutive). Les

ressemblances englobent ici aussi bien les homologies que les homoplasies, les

plésiomorphies (caractères ancestraux) que les apomorphies (caractères dérivés). Les

phénéticiens admettent que les caractères évoluent indépendamment les uns des

autres et qu'ils ont tous le même poids. Plus le nombre de caractères étudiés est

élevé, meilleure sera la classification. Les ressemblances entre UE sont souvent

estimées par l'emploi d'une matrice de similitude (voir cidessous la méthode UPGMA).

Peter SNEATH et R. SOKAL précisent que les phénogrammes ne sont pas a priori

phylogénétiques ; en fait, ces arbres doivent être reconnus seulement comme

105

phénétiques. Le phénogramme n’a pas de racines, car il montre les relations

morphologiques qui rapprochent ou qui éloignent plusieurs unités taxinomiques. Mais

la notion d'évolution (phylogénie) peut se déduire des phénogrammes à condition

d'introduire dans la construction des hypothèses évolutives telle que l'horloge

moléculaire, par exemple.

On distingue trois méthodes phénétiques majeures :

La méthode d'ajustement. L'arbre non enraciné choisi est celui dont les longueurs

des branches expliquent le mieux les ressemblances des UE ; l'introduction de

certains critères permet de déterminer les longueurs.

La méthode de parcimonie. L’objectif, qui rappelle celui de la méthode cladistique,

est d’obtenir un arbre non enraciné le plus court possible avec une minimisation des

homoplasies.

Les méthodes d'agglomération. La classification est hiérarchique car les UE sont

classées en fonction de leurs ressemblances. La méthode agglomérative dite UPGMA,

abréviation anglaise de Unweighted Pair Group Method with Arlthmetic Mean, a été

très employée par les phénéticiens pour traiter les données moléculaires (séquençage,

etc.). Si la notion de l'horloge moléculaire est admise ; elle implique que le taux de

mutations et la vitesse d'évolution d'un caractère donné sont constants. Par

conséquent, les longueurs des branches de l'arbre peuvent être proportionnelles au

temps. En revanche, la méthode dite « du plus proche voisin » (neighbor joining), qui

se développe rapidement, n'utilise pas le postulat de l'horloge moléculaire. Les paires

d'UE sont regroupées d'après leurs ressemblances, de telle sorte que l'arbre non

enraciné construit soit le plus court possible.

Les résultats qui proviennent de l'étude de séquençage sont exprimés sous

forme de chiffres qu’on soumet à un certain nombre de manipulations : ce tableau

devient alors une matrice. La manière la plus simple consiste à quantifier les

différences entre chaînes peptidiques (protéines) et nucléotidiques (ADN ou ARN).

Tout calcul doit être précédé de l'alignement des séquences, même lorsque les

chaînes sont de longueur identique. La figure 2.16 donne un exemple de matrice

simple où sont reportés les nombres d'acides aminés différents de la chaîne α de

l'hémoglobine, chez quelques Vertébrés ; les séquences sont comparées deux à deux.

106

Le nombre de différences correspond à une distance génétique : deux espèces seront

d'autant plus proches que leurs différences seront faibles.

La figure 2.17 montre un exemple simple de calculs permettant la construction d'un

phénogramme avec les transformations successives subies par la matrice.

107

Toutes les unités taxinomiques (espèces, familles, classes...) qui doivent être

comparées sont des Unités Taxinomiques Opérationnelles (UTO) ou Operational

Taxinomic Units (OTU). Au cours de l'établissement du phénogramme, on regroupe

les deux espèces qui présentent la différence la plus petite, ici HommeChimpanzé, en

une seule OTU : l'Homme et le Chimpanzé ont la différence la plus faible (1,45) des

quatre (1,451,573,04 et 7,1).

La 2ème matrice se réalise comme il est indiqué sur la figure 2.17. Par exemple, la

différence entre le Rhésus et l'OTU (HommeChimpanzé) est égale à la somme des

108

différences HommeMacaque rhésus : 7,51 et ChimpanzéMacaque rhésus : 7,5,

divisée par 2 puisque HommeChimpanzé constitue un groupe. Pour le Gorille et

l'Orangoutan, le raisonnement est identique. Dans cette 2ème matrice, la différence la

plus faible concerne l'OTU (HommeChimpanzé) et le Gorille ; on regroupe donc en

une 2ème OTU ces trois animaux.

La 3ème matrice est établie selon les mêmes règles. La différence entre l'OTU

(HommeChimpanzéGorille) et l'Orangoutan est égale à la somme des différences

HommeOrangoutan 2,98, ChimpanzéOrangoutan 2,94 et GorilleOrangoutan 3,04,

divisée par trois. La différence est la plus faible entre la 2ème OTU (Homme

ChimpanzéGorille) et l'Orangoutan ; ces quatre animaux constituent une 3ème OTU à

l'origine de la dernière matrice.

Tous les calculs s'effectuent avec les résultats de la première matrice, et non avec les

moyennes calculées par la suite.

Le phénogramme est bâti à partir des résultats suivants :

La différence HommeChimpanzé est de 1,45 ; on construit deux branches

parallèles de longueur égale 1,45/2 = 0,725.

La différence (HommeChimpanzé)Gorille est de 1,54 : la branche du Gorille

mesure 1,54/2 = 0,77. L'OTU (HommeChimpanzé) comprend déjà deux branches de

0,725 ; pour obtenir un segment horizontal de longueur égale à 0,77, on rajoute un

court segment de 0,045, soit (0,77 0,725), à ce groupe.

La différence (HommeChimpanzéGorille)Orangoutan est de 1,495. La branche

Orangoutan est donc de 1,495 et la 2ème branche, de 0,77, doit être rallongée de 0,725

soit (1,495 0,77).

La différence (HommeChimpanzéGorilleOrangoutan)Macaque rhésus est de

3,695. Les deux dernières branches s'établissent comme cidessus.

La figure 2.18 donne un autre exemple un peu plus compliqué, non commenté ; au

lecteur de s'exercer à reconstituer les OTU, les matrices et le phénogramme.

109

Les phénogrammes d’espèces identiques diffèrent parfois pour trois raisons : soit les

caractères choisis comme critères varient d’une classification à l’autre, soit les indices

de distance sont différents, soit les opérations matricielles ne sont pas identiques.

2.2.2 L'horloge moléculaire

Ce concept se révèle très précieux pour traiter les données moléculaires, mais

sa fiabilité est loin d'être démontrée. Les conclusions issues de son utilisation sont

vivement controversées, comme on le verra dans la section 4.4.3, à propos de

l'émergence de l'Homme moderne : « Le modèle unirégional ou monocentrique,

discussion ».

Sa découverte

Entre 1962 et 1965, Émile ZUCKERKANDL et Linus PAULING, ainsi que

Emmanuel MARGOLIASH en 1963, ont travaillé respectivement sur les séquences

polypeptidiques de l'hémoglobine et du cytochrome C, molécule intervenant dans le

transfert d'électrons au cours de la chaîne respiratoire des mitochondries. Ils ont

remarqué que le rythme de substitution des acides aminés de ces deux molécules

demeurait constant chez différents Mammifères. La représentation graphique des

ressemblances des molécules homologues de plusieurs espèces de Mammifères

correspond à un dendrogramme très semblable à celui obtenu par les méthodes de la

paléontologie ; de plus, la longueur des branches du premier est proportionnelle à

celle du second. Il devient donc possible d’utiliser les degrés de ressemblance entre

molécules homologues d’espèces plus ou moins apparentées pour dater des

événements tels que la séparation de deux lignées, l’âge d’une lignée... Cette

découverte étendue à tous les groupes est à l'origine du postulat de l'horloge

moléculaire : chaque molécule possède un rythme de mutations qui lui est propre ;

dénombrer les mutations qui ont affecté une molécule revient donc à dater son

ancienneté.

La nature du matériel concerné

Les gènes sont les premières molécules affectées par cette horloge qui régule le

rythme de leurs mutations. Mais les résultats se rapportent aux gènes de structure

pour lesquels les biologistes disposent d'une quantité importante de données aussi

bien qualitatives, connaissance du gène et de son fonctionnement, que quantitatives,

connaissance du nombre de gènes. Les données qui se rapportent aux gènes de

régulation, beaucoup plus limitées, ne concernent souvent que l'aspect qualitatif ; on

111

ignore encore la fréquence de leurs mutations. En général, l'horloge moléculaire règle

donc le rythme des mutations de l'ADN nucléaire, mais aussi celui de l'ADN

mitochondrial. Le taux de mutations peut être retrouvé indirectement par l'analyse des

séquences protéiniques, par l'hybridation de l'ADN ou par le calcul des distances

immunologiques.

L'utilité des calculs

L'horloge constitue un outil pratique et heuristique. Chaque gène, chaque

protéine en possède une originale. Si, pour une molécule, le rythme des mutations est

constant, on peut alors calculer l'âge de la divergence de deux lignées. L'horloge

donne une probabilité de mutation. Le calcul de son rythme est effectué par estimation

du nombre de mutations intervenues entre deux événements connus précisément

dans une série fossile ou bien par le recensement des mutations présentes chez deux

lignées dérivant d'un ancêtre commun ; il permet de tester la validité de la méthode.

Aujourd'hui, la connaissance de nombreuses séquences d'ADN facilite la mesure du

rythme de l'horloge, mieux certainement que ne pourraient le faire d'autres méthodes,

comme le séquençage des protéines. Le rythme s'exprime en pourcentage de

mutations par unité de temps ; généralement il est de quelques % pour un milliard

d'années : la longueur des branches des arbres phylogénétiques représente alors un

temps et non plus une unité arbitraire. Ces dernières années, l'ADN mitochondrial a

acquis une importance considérable parce que sa vitesse de fixation des mutations est

beaucoup plus rapide (jusqu’à 10 fois chez les Mammifères) que celle de l'ADN

nucléaire : les mutations affectent deux à quatre nucléotides sur cent par million

d'années. Cette horloge au rythme si rapide, qui permet de dater des phénomènes très

récents, est utilisée en archéologie pour calculer l'âge des fossiles d'Hominidés et des

ancêtres directs de l'Homme.

Les contestations

Les résultats établis à partir de l'horloge ont bouleversé les données

paléontologiques, car ils ont conduit à estimer la séparation HommeChimpanzé à

5 Ma, alors que les fossiles, dont un petit nombre seulement étaient en bon état, la

plaçaient à 15 Ma. Mais quinze ans après, en expérimentant plusieurs méthodes de

séquençage des protéines, de l'ADN nucléaire, de l'ADN mitochondrial, l’horloge

moléculaire a confirmé l'origine récente des Hominidés (5 à 10 Ma). La

reconnaissance de cette origine récente vient de la découverte d’Ardipithecus ramidus,

112

forme très proche des Australopithecus, daté de 4,5 Ma, dont les caractères

anatomiques sont intermédiaires entre ceux de l’Homme et ceux du Chimpanzé.

D'autres biologistes, tel Morris GOODMAN (1981), ont contesté également la

régularité de l'horloge. Ils pensent que l'évolution suit le rythme des fixations des

mutations, qui augmenterait au moment des périodes de radiation adaptative. Pour

étayer leur thèse, ils prennent l'exemple extrême des gènes des hémoglobines α et β,

chez lesquels la fréquence des mutations par substitution est très élevée lors de leur

individualisation et de leur séparation. Cette fréquence est interprétée comme un

phénomène peu courant : la sélection naturelle, dite positive, a favorisé les mutations

qui ont permis à la fonction de l'hémoglobine de progresser. Dans l'immense majorité

des cas, en revanche, la sélection naturelle est négative, c'estàdire qu'elle élimine les

mutations.

Les erreurs et leurs remèdes

Les erreurs peuvent provenir d'estimations faussées :

1) Si les mutations s’annulent mutuellement, le gène est maintenu dans son état

ancestral ; la datation de son apparition est alors sousestimée, car le faible nombre de

mutations apparentes lui donne un âge plus récent qu’il ne l’est en réalité.

2) Si la sélection naturelle augmente le rythme des mutations, le gène sera

considéré comme plus ancien qu'il ne l'est.

3) Si deux lignées qui ont divergé s'hybrident, les gènes des hybrides seront

donnés pour récents.

Dans une population, le nombre de mutations par génération (taux de mutation) peut

être élevé, mais on ne peut étudier que les mutations fixées ; le taux de fixation

(nombre de mutations fixées par génération) dépend en raison de la dérive génique

fortuite de l'effectif des populations.

Pour améliorer la fiabilité de l'outil, les biologistes s'accordent maintenant sur ces

conditions à respecter :

Les ressemblances entre les organismes étudiés doivent provenir de leur

parenté ; mais la comparaison des séquences homologues n’élimine pas toutes les

homoplasies.

Le nombre de leurs différences doit être proportionnel à l'ancienneté de leur

séparation d'un ancêtre commun. Mais on ne peut le savoir a priori.

Les lignées qui ont divergé ne doivent pas être mélangées. Généralement, elles

ne le sont pas si l’on compare des espèces.

113

En définitive, il semble que l'hypothèse de l'horloge moléculaire soit utilisable

pour des lignées voisines et non pour des lignées trop éloignées, car dans ce dernier

cas, l'horloge souffre de dysfonctionnement.

Le test de la fréquence relative

Pour éviter les désaccords fréquents au sujet de la datation des divergences de

lignées, Vincent SARICH et Allan WILSON ont mis au point, en 1973, un test sans datation

absolue : celui de la fréquence relative. Plusieurs propositions doivent être admises :

1) Le fonctionnement de l'horloge est régulier.

2) Après divergence, les lignées évoluent à la même vitesse.

3) Le test utilise trois lignées, deux dont on veut apprécier le degré de divergence et

la troisième, servant de référence, qui s'est séparée d'un tronc commun bien avant les

deux premières (c'est la notion de l'UE extragroupe déjà évoquée plus haut).

L'arbre phylétique de ces trois lignées A, B et C possède l'aspect représenté à la

figure 2.19

La fréquence des mutations par substitution de l'espèce A par rapport au point O

est Koa, celle de l'espèce B est Kob et celle de C est Koc. On peut écrire les égalités

suivantes :

(1) Kac = Koa + Koc

114

(2) Kbc = Kob + Koc

(3) Kab = Koa + Kob

Si l'horloge est régulière, on peut écrire :

(4) Koa = Kob

et d'après les égalités (1) et (2) :

(5) Koa Kob = Kac Kbc

L'égalité (5) permet donc d'apprécier le rythme de fixation des mutations de A et de B

par rapport à C. En fait, le taux de fixation dépend à la fois de l'effectif de la population,

en raison de la dérive génique fortuite (voir les sections 3.1.3 : « La variabilité et la

dérive génique fortuite », 3.3.2 : « La spéciation par révolution génétique », 4.2.3 : « La

théorie synthétique » et 4.3.2 : « La théorie neutraliste, le hasard ») et du taux de

mutations par génération qui est, seul, pris en compte ici.

Les fréquences de mutations fixées synonymes sont égales chez la Souris (A) et

le Rat (B), l'espèce (C) de référence est l'Homme (fig. 2.20).

115

En revanche, elles sont deux fois plus fréquentes chez le Singe africain (A) que chez

l'Homme (B), l'espèce (C) de référence est le Lémur pour l'exemple de la βglobine et

le Chien pour celui de l'insuline (fig. 2.20).

Le Rat et la Souris possèdent par rapport à l'Homme un taux de mutations et un taux

de fixation beaucoup plus élevés que ceux du Singe. Deux explications non exclusives

rendent compte de ces différences :

1) La durée de vie d'une génération est plus courte chez le Rongeur que chez le

Singe, et chez ces derniers que chez l'Homme. Le rythme de vie des cellules des

Rongeurs est accéléré ; les divisions cellulaires plus fréquentes impliquent de

nombreuses réplications de l'ADN, au cours desquelles les mutations peuvent

s'accumuler rapidement.

2) Le système de réparation de l'ADN au moment de sa réplication est moins

performant chez les animaux que chez l'Homme, comme l'indiquent les études sur les

Rongeurs réalisées par Roy BRITTEN (1986). Avant la division cellulaire, la réplication de

l'ADN est effectuée par l'ADNpolymérase, complexe enzymatique, qui, après avoir

contrôlé la conformité des brins néoformés aux brins originaux, corrige les erreurs de

transcription.

L'horloge moléculaire est donc fiable pour des lignées proches qui possèdent

une physiologie cellulaire comparable, mais aussi une durée de vie semblable.

2.2.3 La méthode cladistique

Alors que les phénogrammes représentent des degrés de ressemblances, les

cladogrammes représentent des relations de parenté.

Les particularités des caractères employés

Les cladistes admettent que les caractères évoluent indépendamment les uns

des autres et à des vitesses souvent inégales : la présence de cinq doigts à la main de

l'Homme est un caractère ancestral ou plésiomorphe, alors que la présence d'un

cortex plissé est un caractère dérivé ou apomorphe. Des vitesses différentes pour des

caractères différents donnent ce que Gavin De BEER (1954) a nommé une évolution en

mosaïque. Les variations de vitesse n'ont aucune répercussion sur l'élaboration de

l'arbre phylogénétique, dont la construction est indépendante du temps et ne nécessite

pas le postulat de l’horloge moléculaire. Les cladistes appliquent dans leurs

recherches et dans l'établissement du cladogramme le principe de parcimonie :

utilisation d'un nombre minimum d'hypothèses, choix du cladogramme le plus court.

116

La construction d'un cladogramme implique au préalable le choix de certains

caractères dont il faut trouver les états plésiomorphes (ancestraux) et les états

apomorphes (dérivés). La parenté plus ou moins proche des UE est, en effet,

déterminée par le partage de caractères apomorphes (synapomorphie) et non par la

présence commune de plésiomorphies. La reconnaissance des plésiomorphies et des

apomorphies nécessite l'emploi de plusieurs critères dont les deux premiers sont les

plus importants :

Le critère de comparaison extragroupe : un groupe non directement apparenté à

celui étudié sert de référence. « ... Étant donné un caractère rencontré dans un groupe, si le

caractère est rencontré également à l’extérieur du groupe il est primitif pour le groupe étudié ;

si le caractère n’est rencontré que dans le groupe étudié il est dérivé » (P. TASSY, L’Arbre à

remonter le temps, Paris, Christian Bourgois, 1991, p. 165).

Le critère ontogénique déjà évoqué, qui est issu d'une nouvelle formulation de la

loi de récapitulation. Les caractères apparaissent dans un ordre qui correspond à celui

de leur généalogie ; les premiers caractères développés sont les plus « primitifs », les

suivants sont de plus en plus « modernes ».

Le critère paléontologique : si un caractère est partagé par des fossiles, le fossile

le plus ancien présente le caractère plésiomorphe. Ce critère n'est valable que si les

fossiles appartiennent à un groupe monophylétique.

Le critère de distribution géographique, qui est presque abandonné. Un caractère

apomorphe apparaît dans une espèce loin de l'aire de répartition principale de cette

espèce.

Les cladistes travaillent sur des caractères apomorphes ou dérivés, mais aussi

homologues afin que ces derniers demeurent comparables. Ils ont donc à rechercher

les caractères homologues. Ils retracent la phylogénie de groupes monophylétiques,

c'estàdire d'un ensemble de taxons étroitement apparentés ; lorsque les taxons ne le

sont pas, le groupe est dit paraphylétique. Les taxons apparentés forment des groupes

frères. Parfois certains caractères ne sont pas partagés avec des groupes frères, ils

sont particuliers à un seul groupe ; on parle dans ce cas de caractères autapomorphes

ou d'autapomorphies. La figure 2.21 résume quelques points exposés cidessus.

117

La reconnaissance des homologies

Après avoir reconnu les caractères dérivés et les caractères ancestraux, le

problème fondamental est d'identifier les homologies avec la plus grande certitude.

Les cladistes disposent de trois critères :

Le critère de ressemblance, qui correspond au principe des connexions de

É. GEOFFROY SAINTHILAIRE. Un organe maintient avec ses voisins toujours les mêmes

connexions, qui sont invariables. Par conséquent, des organes d’espèces différentes

sont homologues s’ils ont des connexions identiques avec leurs voisins.

Le critère de noncoexistence : deux caractères homologues ne peuvent coexister

chez un même organisme. C'est pourquoi les Centaures sont de pures inventions

mythologiques, car ils cumulent « bras » et « pattes antérieures ».

Le critère de parcimonie (ou de congruence). Toutes les conclusions adoptées

sont issues de l'utilisation d'un nombre d'hypothèses aussi faible que possible.

La notion d’homologie, fondamentale dans l’analyse cladistique, est appliquée

également aux molécules. Mais l’assimilation courante d’une ressemblance ou d’une

similitude moléculaire à une homologie heurte les convictions de certains spécialistes

qui considèrent ce rapprochement abusif. C’est pourquoi W. FITCH (1970) a proposé la

création de deux termes spécifiques à la biologie moléculaire : « orthologue » et

« paralogue », celui d’homologue étant réservé aux caractères morphologiques. Le

terme « orthologue » qualifie des séquences similaires issues d’ascendants

communs ; le terme « paralogue » désigne des séquences dont la similitude est

118

acquise par des mutations ou par des remaniements génétiques dans des lignées

différentes ; dans tous les cas, la paralogie est acquise indépendamment de la

spéciation.

Les caractéristiques du cladogramme

Le cladogramme possède des branches internes dont la longueur est

proportionnelle au nombre de caractères apomorphes. En revanche, la longueur des

branches terminales est déterminée par le nombre de caractères autapomorphes. Le

cladogramme n'est pas obligatoirement enraciné ; seules les relations de parenté sont

indiquées. L'introduction d'un extragroupe permet son enracinement ; l'ancêtre situé à

la racine comme ceux présents aux différents noeuds de l'arbre sont totalement

hypothétiques, puisqu'ils sont déduits des caractères de leurs descendants.

119

Il arrive que plusieurs arbres soient aussi parcimonieux, bien qu'ils aient des

configurations différentes (fig. 2.22). Des homoplasies non détectées en sont

responsables. Le cladogramme, comme le phénogramme, n'est pas directement

phylogénétique à moins d'introduire des hypothèses évolutives : les observations sont

équivalentes, les caractères évoluent indépendamment, les caractères se

transforment...

120

Le cladogramme est parfois qualifié indifféremment d’arbre « généalogique » ou

d’arbre « phylogénétique ». Or ces deux termes ne sont pas tout à fait équivalents :

Dans un arbre généalogique, les ancêtres sont connus et bien identifiés.

Dans un arbre phylogénétique (un cladogramme), les ancêtres comme,

d’ailleurs, les intermédiaires ne sont pas connus, mais ils sont inférés par les

caractères qu’ils ont légués à leurs descendants. Seules les relations de parenté entre

les U.E terminales sont mises en évidence.

L'établissement d'un cladogramme

L'exemple choisi concerne des données moléculaires d'une protéine homologue

l'hémoglobine de plusieurs Primates. Par l'analyse des séquences partielles de la

myoglobine des 11 Singes, on reconstitue la séquence ancestrale en appliquant le

critère de parcimonie : le caractère typique ancestral est le plus fréquent c'estàdire,

dans cet exemple, l'acide aminé le plus fréquent puisque sa détermination nécessite

un minimum d’hypothèses.

Au lieu de reconstituer une classification généalogique comme dans le

phénogramme, on veut suivre les étapes de l'évolution en reconstituant les relations

de parenté qui unissent, par exemple, le Singe laineux ou Lagothrix (La), le Saimiri

(Sai) et le Marmouset (Mar). Trois arbres sont possibles (voir figure 2.23).

121

La construction du cladogramme obéit également aux principes de parcimonie et

de vraisemblance. Ignorant les probabilités de chaque mutation, les cladistes

supposent que les différents types de mutations (substitution, insertion et délétion) ont

une fréquence identique. Par exemple, les transformations Phe> Leu, Ile> Val,

122

Val> Ala... se produisent au même rythme. Retracer l'apparentement des trois

espèces de Singes, le Lagothrix (La), le Saïmiri (Sai) et le Marmouset (Mar), exige

l'exploration des filiations possibles qui, limitées à trois, sont présentées dans la

figure 2.23. Pour bâtir l'un des trois cladogrammes, on choisira la solution exigeant les

manipulations les moins nombreuses.

Le critère de référence est la séquence ancestrale. Dans le cas du cladogramme

2.23A, le passage direct de la séquence ancestrale à la séquence (Sai) a nécessité

5 mutations, signalées sur la branche du cladogramme ; le passage à la séquence

(Mar) 1 mutation, et le passage à la séquence (La) 3 mutations. Trois de ces neuf

mutations sont des convergences, car elles figurent sur deux branches au moins:

1ère convergence Val>Ile position 1 chez (Sai) et (La)

2e convergence His>Gln position 3 chez (Sai) et (La)

3e convergence Ile>Val position 5 chez (Sai) et (Mar)

Les 9 mutations et les 3 convergences forment 12 événements.

Pour bâtir le cladogramme 2.23B, 7 mutations sont nécessaires, dont une

convergence : Ile>Val position 5 chez (Mar) et (Sai), soit un total de 8 événements.

Le cladogramme 2.23C utilise 8 mutations, dont deux convergences et une

réversion :

1ère convergence Val>Ile position 1 chez (Sai) et (La)

2e convergence His>Gln position 3 chez (Sai) et (La)

Le principe de parcimonie situe la mutation Ile>Val en position 5 sur la branche

commune à (Sai) et (Mar), plutôt que sur chacune des deux branches ; il est plus

vraisemblable également que cette mutation s'est produite une fois au lieu de deux.

Quoi qu'il en soit, cette mutation placée sur une branche commune, et non pas sur les

deux branches séparées, est une réversion. Le nombre d'événements est égal à 8

mutations + 2 convergences + une réversion, soit 11 événements.

Finalement, le cladogramme retenu est le 2.23B, car 8 événements en font le plus

économique, et l’on admet qu’il retrace la phylogénie la plus exacte.

123

Discussion sur l'existence de la parcimonie dans l'évolution

Le principe de parcimonie est abondamment utilisé sans que l’on sache pour

autant si l'évolution est réellement parcimonieuse. Si les événements évolutifs

(mutations) sont rares, la parcimonie de l'évolution est admise. En revanche, elle est

rejetée si l'on pense que les homoplasies sont aussi fréquentes que les homologies et

qu'elles ne renvoient à aucun modèle évolutif.

Si l’emploi du terme « parcimonie » est récent (1965), le principe en est ancien.

Guillaume d’OCKHAM (12881349) l’a introduit définitivement dans la démarche

scientifique : la meilleure explication d’un fait est celle qui utilise le minimum

d’hypothèses. La science actuelle continue à rejeter les hypothèses ad hoc, c’està

dire celles qui ne sont pas nécessaires à la compréhension d’un fait particulier. Il est

donc admis qu’un caractère dérivé partagé par deux taxons est hérité d’un ancêtre

commun ; et l’hypothèse soutenant l’apparition indépendante de ce même caractère

chez les deux taxons est rejetée parce qu’elle est moins parcimonieuse que la

première.

Les méthodes phénétiques utilisent des critères de ressemblance issus de

caractères plésiomorphes (ancestraux). Elles traitent aussi bien les homologies que

les homoplasies, convergences et réversions. Pourtant cet amalgame fausse la

reconstruction phylogénétique, car il réunit des espèces non étroitement apparentées,

qui ont adopté une même solution adaptative. La méthode cladistique s’attache, autant

que possible, à limiter la prise en compte des homoplasies. C’est pourquoi le choix des

caractères de référence est très strict et l’arbre le plus parcimonieux est retenu. La

parcimonie permet de dégager un arbre qui se rapproche le plus possible de la

phylogénie réelle, car il est bâti à partir d’un maximum d’homologies et d’un minimum

d’homoplasies.

Deux autres méthodes existent également, mais elles sont beaucoup moins

employées. La méthode de compatibilité, l'arbre choisi est celui qui ne nécessite pas

l'hypothèse de l'homoplasie. La méthode probabiliste, l'évolution obéit à certaines lois

probabilistes définies a priori, l'arbre choisi est le plus probable.

Dans la reconstitution des filiations, l’anatomie comparée occupe une place

importante, car quelques indices suffisent pour reconstituer tout un ensemble, qu’il est

alors possible d’intégrer dans une histoire évolutive.

124

Bibliographie de la section 2.2

Livres

DARLU P. et TASSY P. , Reconstruction phylogénétique, concept et méthodes, Paris, Masson, 1993.

LECOINTRE G. et LE GUYADER H. , Classification phylogénétique du vivant, Paris, Belin, 2001.

LI W. et GRAUR D. , Molecular evolution, Sunderland (Massachussetts, USA), Sinauer Associates Inc., 1991.

NINIO J. , Approches moléculaires de l'évolution, Paris, Masson, 1979.

TASSY P., L’Arbre à remonter le temps, Christian Bourgois, 1991.Le Message des fossiles, Paris, Hachette, 1992.

TASSY P. (coordonné par), L’Ordre et la diversité du vivant, Paris, Fayard, 1986.

Articles

BOULIGAND Y. , « Morphologie », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.

DEVILLERS Ch. , « Homologie/analogie », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.

GASC J.P. , « Tendances évolutives et progrès », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.

GÉNERMONT J. , « Dendrogramme », « Horloge moléculaire de l'évolution », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.

GILLOIS M. : « Homologie », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.

GOUJET D. , « Arbre phylogénétique », « Cladisme », « Grade », « Hennig », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.

GUY Y. , « Phylogénétique (arbre)», Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.

JANVIER Ph., TASSY P. et THOMAS H. , « Le cladisme », La Recherche, n° 117, décembre 1980.

125

LECOINTRE G. , « La construction des phylogénies », APBG (revue de l'Association des Professeurs de Biologie et de Géologie), n° 1, 1995.

TASSY P., « La critique cladistique du néodarwinisme et comment s’en servir », Pour Darwin (dir. P. TORT), Paris, PUF, 1997.

TORT P. , « Adanson », « Monophylie/ polyphylie », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.

126

2.2 les dendrogrammes · d'unités évolutives (ue), d'unités évolutives hypothétiques...

Documents