2.2 les dendrogrammes · d'unités évolutives (ue), d'unités évolutives hypothétiques...
TRANSCRIPT
2.2 Les dendrogrammes
Le dendrogramme est une figure arborescente. Si, dans sa construction, l'on
introduit l'hypothèse que les ressemblances sont le reflet d'une relation de parenté, le
dendrogramme est généalogique ; si l'on introduit celle que les ressemblances
évoluent au cours du temps, le dendrogramme est phylogénétique. Les
dendrogrammes retenus dans cette section mettent en évidence des ressemblances
entre différents taxons.
L'objectif de recherche est souvent double ; dans un premier temps, il s'agit de
mettre en évidence sur un schéma synthétique (le dendrogramme) les relations
généalogiques ou évolutives entre plusieurs taxons ; dans un second temps,
d'apprécier leur degré de divergence. Ce dernier est estimé en fonction soit du temps
qui sépare les taxons, soit des différences génétiques, moléculaires ou autres
accumulées entre ces mêmes taxons.
Les constructions phylogénétiques sont bâties principalement à partir de
l'anatomie comparée, l'ontogénie et la paléontologie.
L'anatomie comparée a pour objectif de rechercher les homologies en utilisant,
par exemple, le principe de subordination des caractères de B. de JUSSIEU ( les
caractères constants sont plus importants que les caractères inconstants), ou encore
celui des connexions de É. GEOFFROY SAINTHILAIRE (voir la section précédente) : quelles
que soient leur forme, leur taille ou leur fonction, des organes sont reconnus
homologues s'ils possèdent les mêmes connexions avec d'autres organes.
L'ontogénie utilise le principe de récapitulation (loi biogénétique fondamentale)
de E. HAECKEL, mais reformulé par Gareth NELSON (1973) : lorsque l'on peut suivre la
transformation d'un caractère d'un état général vers un état plus spécialisé, le
caractère le plus général est le plus ancien, le moins général est le plus récent, dérivé
du premier. La règle de G. NELSON, qui n'est pas sans rappeler les deux premières
règles de K. E. von BAER, est une hypothèse de travail et non une loi.
La paléontologie fournit des arguments morphologiques, mais aussi des
arguments chronologiques.
À ces données traditionnelles s'ajoutent aujourd'hui celles de la biologie
moléculaire : séquençages des protéines, de l'ADN, de l'ARN, hybridation de l'ADN.
L'unité de base de la construction phylogénétique est très souvent l'espèce,
puisqu'elle est un groupe génétique fermé : l'interfertilité existe uniquement entre ses
103
membres. Mais certains auteurs rejettent cet usage de l'espèce, car leurs travaux
concernent des populations plus que des espèces entières : sousespèces et espèces
sont alors confondues. Pour éviter l'emploi du mot « espèce », les taxons sont qualifiés
d'unités évolutives (UE), d'unités évolutives hypothétiques (UEH) s’ils sont de pures
constructions fictives, ou encore d’unités taxinomiques opérationnelles (UTO ou OTU
dans la terminologie anglosaxonne). Les taxons sont parfois de niveau
supraspécifique ; dans ce cas, ils doivent appartenir à une même lignée phylétique
(lignée monophylétique) pour demeurer comparables.
Les arbres sont composés de deux régions : les noeuds où sont placés les
taxons qui sont souvent des UEH, car on ne connaît pas les formes fossiles, et les
branches qui indiquent le degré de parenté des différents taxons. La longueur des
branches est proportionnelle au temps ou bien aux différences entre taxons (fig. 2.15).
À leurs extrémités figurent les taxons terminaux qui sont des UE.
Fig. 2.15
Si l'arbre est enraciné (fig. 2.15A), la racine représente l'ancêtre commun et il précise
alors les relations évolutives des différents taxons présents. Mais l'arbre est souvent
dépourvu de racines (fig. 2.15B) : il rend compte uniquement des relations de parenté,
sans que l'on puisse savoir comment l'évolution passe d'un taxon à l'autre. Cependant
un arbre peut être enraciné si on le construit avec un taxon extérieur au groupe, UE
extragroupe, qui sera la référence pour estimer les degrés de ressemblance entre les
taxons étudiés. Il est nécessaire de connaître précisément les données taxinomiques
104
ou paléontologiques de cette UE extragroupe ; il faut, en effet, être sûr qu'elle a
divergé bien avant l'ancêtre commun aux UE considérées (fig. 2.15A). Lorsque l'on
dispose d'un certain nombre d'UE dont on veut établir la parenté, le nombre théorique
d'arbres possibles augmente très rapidement :
avec n unités (UE) et si l'arbre est enraciné, il y a N1 arbres théoriques, soit :
N1 = (2n 3) ! : 2 n2 (n 2) !
avec n unités (UE) et si l'arbre n'est pas enraciné, il y a N2 arbres possibles, soit
:
N2 = (2n 5) ! : 2 n2 (n 2) !
Si n = 10, N1 est égal à 35.106 et N2 à 2.106 ; la formule exprime les incertitudes pour
déterminer l'arbre exact parmi plusieurs millions. Un exemple sera donné à propos de
l'émergence de l'Homme moderne à la section 4.4.3 : « Le modèle unirégional ou
monocentrique, discussion ».
Les classifications phylogénétiques utilisent abondamment le critère
d'homologie. Les ressemblances sans lien de parenté sont des homoplasies parmi
lesquelles on distingue les convergences (ressemblances adaptatives) et les
réversions, brusque apparition d'un caractère rappelant un caractère ancestral. Un
caractère ancestral est plésiomorphe ; un caractère dérivé est apomorphe.
Parmi les quatre méthodes principales phénétique, cladistique, probabiliste et de
compatibilité , seules seront évoquées les deux premières, car ce sont les plus
fréquentes.
2.2.1 La méthode phénétique ou numérique
Conçue par Charles MICHENER et Robert SOKAL (1957), elle utilise un nombre
réduit de principes. La construction des arbres phénétiques (phénogrammes) repose
sur les ressemblances observées entre chaque paire d'UE (unité évolutive). Les
ressemblances englobent ici aussi bien les homologies que les homoplasies, les
plésiomorphies (caractères ancestraux) que les apomorphies (caractères dérivés). Les
phénéticiens admettent que les caractères évoluent indépendamment les uns des
autres et qu'ils ont tous le même poids. Plus le nombre de caractères étudiés est
élevé, meilleure sera la classification. Les ressemblances entre UE sont souvent
estimées par l'emploi d'une matrice de similitude (voir cidessous la méthode UPGMA).
Peter SNEATH et R. SOKAL précisent que les phénogrammes ne sont pas a priori
phylogénétiques ; en fait, ces arbres doivent être reconnus seulement comme
105
phénétiques. Le phénogramme n’a pas de racines, car il montre les relations
morphologiques qui rapprochent ou qui éloignent plusieurs unités taxinomiques. Mais
la notion d'évolution (phylogénie) peut se déduire des phénogrammes à condition
d'introduire dans la construction des hypothèses évolutives telle que l'horloge
moléculaire, par exemple.
On distingue trois méthodes phénétiques majeures :
La méthode d'ajustement. L'arbre non enraciné choisi est celui dont les longueurs
des branches expliquent le mieux les ressemblances des UE ; l'introduction de
certains critères permet de déterminer les longueurs.
La méthode de parcimonie. L’objectif, qui rappelle celui de la méthode cladistique,
est d’obtenir un arbre non enraciné le plus court possible avec une minimisation des
homoplasies.
Les méthodes d'agglomération. La classification est hiérarchique car les UE sont
classées en fonction de leurs ressemblances. La méthode agglomérative dite UPGMA,
abréviation anglaise de Unweighted Pair Group Method with Arlthmetic Mean, a été
très employée par les phénéticiens pour traiter les données moléculaires (séquençage,
etc.). Si la notion de l'horloge moléculaire est admise ; elle implique que le taux de
mutations et la vitesse d'évolution d'un caractère donné sont constants. Par
conséquent, les longueurs des branches de l'arbre peuvent être proportionnelles au
temps. En revanche, la méthode dite « du plus proche voisin » (neighbor joining), qui
se développe rapidement, n'utilise pas le postulat de l'horloge moléculaire. Les paires
d'UE sont regroupées d'après leurs ressemblances, de telle sorte que l'arbre non
enraciné construit soit le plus court possible.
Les résultats qui proviennent de l'étude de séquençage sont exprimés sous
forme de chiffres qu’on soumet à un certain nombre de manipulations : ce tableau
devient alors une matrice. La manière la plus simple consiste à quantifier les
différences entre chaînes peptidiques (protéines) et nucléotidiques (ADN ou ARN).
Tout calcul doit être précédé de l'alignement des séquences, même lorsque les
chaînes sont de longueur identique. La figure 2.16 donne un exemple de matrice
simple où sont reportés les nombres d'acides aminés différents de la chaîne α de
l'hémoglobine, chez quelques Vertébrés ; les séquences sont comparées deux à deux.
106
Le nombre de différences correspond à une distance génétique : deux espèces seront
d'autant plus proches que leurs différences seront faibles.
La figure 2.17 montre un exemple simple de calculs permettant la construction d'un
phénogramme avec les transformations successives subies par la matrice.
107
Toutes les unités taxinomiques (espèces, familles, classes...) qui doivent être
comparées sont des Unités Taxinomiques Opérationnelles (UTO) ou Operational
Taxinomic Units (OTU). Au cours de l'établissement du phénogramme, on regroupe
les deux espèces qui présentent la différence la plus petite, ici HommeChimpanzé, en
une seule OTU : l'Homme et le Chimpanzé ont la différence la plus faible (1,45) des
quatre (1,451,573,04 et 7,1).
La 2ème matrice se réalise comme il est indiqué sur la figure 2.17. Par exemple, la
différence entre le Rhésus et l'OTU (HommeChimpanzé) est égale à la somme des
108
différences HommeMacaque rhésus : 7,51 et ChimpanzéMacaque rhésus : 7,5,
divisée par 2 puisque HommeChimpanzé constitue un groupe. Pour le Gorille et
l'Orangoutan, le raisonnement est identique. Dans cette 2ème matrice, la différence la
plus faible concerne l'OTU (HommeChimpanzé) et le Gorille ; on regroupe donc en
une 2ème OTU ces trois animaux.
La 3ème matrice est établie selon les mêmes règles. La différence entre l'OTU
(HommeChimpanzéGorille) et l'Orangoutan est égale à la somme des différences
HommeOrangoutan 2,98, ChimpanzéOrangoutan 2,94 et GorilleOrangoutan 3,04,
divisée par trois. La différence est la plus faible entre la 2ème OTU (Homme
ChimpanzéGorille) et l'Orangoutan ; ces quatre animaux constituent une 3ème OTU à
l'origine de la dernière matrice.
Tous les calculs s'effectuent avec les résultats de la première matrice, et non avec les
moyennes calculées par la suite.
Le phénogramme est bâti à partir des résultats suivants :
La différence HommeChimpanzé est de 1,45 ; on construit deux branches
parallèles de longueur égale 1,45/2 = 0,725.
La différence (HommeChimpanzé)Gorille est de 1,54 : la branche du Gorille
mesure 1,54/2 = 0,77. L'OTU (HommeChimpanzé) comprend déjà deux branches de
0,725 ; pour obtenir un segment horizontal de longueur égale à 0,77, on rajoute un
court segment de 0,045, soit (0,77 0,725), à ce groupe.
La différence (HommeChimpanzéGorille)Orangoutan est de 1,495. La branche
Orangoutan est donc de 1,495 et la 2ème branche, de 0,77, doit être rallongée de 0,725
soit (1,495 0,77).
La différence (HommeChimpanzéGorilleOrangoutan)Macaque rhésus est de
3,695. Les deux dernières branches s'établissent comme cidessus.
La figure 2.18 donne un autre exemple un peu plus compliqué, non commenté ; au
lecteur de s'exercer à reconstituer les OTU, les matrices et le phénogramme.
109
Les phénogrammes d’espèces identiques diffèrent parfois pour trois raisons : soit les
caractères choisis comme critères varient d’une classification à l’autre, soit les indices
de distance sont différents, soit les opérations matricielles ne sont pas identiques.
2.2.2 L'horloge moléculaire
Ce concept se révèle très précieux pour traiter les données moléculaires, mais
sa fiabilité est loin d'être démontrée. Les conclusions issues de son utilisation sont
vivement controversées, comme on le verra dans la section 4.4.3, à propos de
l'émergence de l'Homme moderne : « Le modèle unirégional ou monocentrique,
discussion ».
Sa découverte
Entre 1962 et 1965, Émile ZUCKERKANDL et Linus PAULING, ainsi que
Emmanuel MARGOLIASH en 1963, ont travaillé respectivement sur les séquences
polypeptidiques de l'hémoglobine et du cytochrome C, molécule intervenant dans le
transfert d'électrons au cours de la chaîne respiratoire des mitochondries. Ils ont
remarqué que le rythme de substitution des acides aminés de ces deux molécules
demeurait constant chez différents Mammifères. La représentation graphique des
ressemblances des molécules homologues de plusieurs espèces de Mammifères
correspond à un dendrogramme très semblable à celui obtenu par les méthodes de la
paléontologie ; de plus, la longueur des branches du premier est proportionnelle à
celle du second. Il devient donc possible d’utiliser les degrés de ressemblance entre
molécules homologues d’espèces plus ou moins apparentées pour dater des
événements tels que la séparation de deux lignées, l’âge d’une lignée... Cette
découverte étendue à tous les groupes est à l'origine du postulat de l'horloge
moléculaire : chaque molécule possède un rythme de mutations qui lui est propre ;
dénombrer les mutations qui ont affecté une molécule revient donc à dater son
ancienneté.
La nature du matériel concerné
Les gènes sont les premières molécules affectées par cette horloge qui régule le
rythme de leurs mutations. Mais les résultats se rapportent aux gènes de structure
pour lesquels les biologistes disposent d'une quantité importante de données aussi
bien qualitatives, connaissance du gène et de son fonctionnement, que quantitatives,
connaissance du nombre de gènes. Les données qui se rapportent aux gènes de
régulation, beaucoup plus limitées, ne concernent souvent que l'aspect qualitatif ; on
111
ignore encore la fréquence de leurs mutations. En général, l'horloge moléculaire règle
donc le rythme des mutations de l'ADN nucléaire, mais aussi celui de l'ADN
mitochondrial. Le taux de mutations peut être retrouvé indirectement par l'analyse des
séquences protéiniques, par l'hybridation de l'ADN ou par le calcul des distances
immunologiques.
L'utilité des calculs
L'horloge constitue un outil pratique et heuristique. Chaque gène, chaque
protéine en possède une originale. Si, pour une molécule, le rythme des mutations est
constant, on peut alors calculer l'âge de la divergence de deux lignées. L'horloge
donne une probabilité de mutation. Le calcul de son rythme est effectué par estimation
du nombre de mutations intervenues entre deux événements connus précisément
dans une série fossile ou bien par le recensement des mutations présentes chez deux
lignées dérivant d'un ancêtre commun ; il permet de tester la validité de la méthode.
Aujourd'hui, la connaissance de nombreuses séquences d'ADN facilite la mesure du
rythme de l'horloge, mieux certainement que ne pourraient le faire d'autres méthodes,
comme le séquençage des protéines. Le rythme s'exprime en pourcentage de
mutations par unité de temps ; généralement il est de quelques % pour un milliard
d'années : la longueur des branches des arbres phylogénétiques représente alors un
temps et non plus une unité arbitraire. Ces dernières années, l'ADN mitochondrial a
acquis une importance considérable parce que sa vitesse de fixation des mutations est
beaucoup plus rapide (jusqu’à 10 fois chez les Mammifères) que celle de l'ADN
nucléaire : les mutations affectent deux à quatre nucléotides sur cent par million
d'années. Cette horloge au rythme si rapide, qui permet de dater des phénomènes très
récents, est utilisée en archéologie pour calculer l'âge des fossiles d'Hominidés et des
ancêtres directs de l'Homme.
Les contestations
Les résultats établis à partir de l'horloge ont bouleversé les données
paléontologiques, car ils ont conduit à estimer la séparation HommeChimpanzé à
5 Ma, alors que les fossiles, dont un petit nombre seulement étaient en bon état, la
plaçaient à 15 Ma. Mais quinze ans après, en expérimentant plusieurs méthodes de
séquençage des protéines, de l'ADN nucléaire, de l'ADN mitochondrial, l’horloge
moléculaire a confirmé l'origine récente des Hominidés (5 à 10 Ma). La
reconnaissance de cette origine récente vient de la découverte d’Ardipithecus ramidus,
112
forme très proche des Australopithecus, daté de 4,5 Ma, dont les caractères
anatomiques sont intermédiaires entre ceux de l’Homme et ceux du Chimpanzé.
D'autres biologistes, tel Morris GOODMAN (1981), ont contesté également la
régularité de l'horloge. Ils pensent que l'évolution suit le rythme des fixations des
mutations, qui augmenterait au moment des périodes de radiation adaptative. Pour
étayer leur thèse, ils prennent l'exemple extrême des gènes des hémoglobines α et β,
chez lesquels la fréquence des mutations par substitution est très élevée lors de leur
individualisation et de leur séparation. Cette fréquence est interprétée comme un
phénomène peu courant : la sélection naturelle, dite positive, a favorisé les mutations
qui ont permis à la fonction de l'hémoglobine de progresser. Dans l'immense majorité
des cas, en revanche, la sélection naturelle est négative, c'estàdire qu'elle élimine les
mutations.
Les erreurs et leurs remèdes
Les erreurs peuvent provenir d'estimations faussées :
1) Si les mutations s’annulent mutuellement, le gène est maintenu dans son état
ancestral ; la datation de son apparition est alors sousestimée, car le faible nombre de
mutations apparentes lui donne un âge plus récent qu’il ne l’est en réalité.
2) Si la sélection naturelle augmente le rythme des mutations, le gène sera
considéré comme plus ancien qu'il ne l'est.
3) Si deux lignées qui ont divergé s'hybrident, les gènes des hybrides seront
donnés pour récents.
Dans une population, le nombre de mutations par génération (taux de mutation) peut
être élevé, mais on ne peut étudier que les mutations fixées ; le taux de fixation
(nombre de mutations fixées par génération) dépend en raison de la dérive génique
fortuite de l'effectif des populations.
Pour améliorer la fiabilité de l'outil, les biologistes s'accordent maintenant sur ces
conditions à respecter :
Les ressemblances entre les organismes étudiés doivent provenir de leur
parenté ; mais la comparaison des séquences homologues n’élimine pas toutes les
homoplasies.
Le nombre de leurs différences doit être proportionnel à l'ancienneté de leur
séparation d'un ancêtre commun. Mais on ne peut le savoir a priori.
Les lignées qui ont divergé ne doivent pas être mélangées. Généralement, elles
ne le sont pas si l’on compare des espèces.
113
En définitive, il semble que l'hypothèse de l'horloge moléculaire soit utilisable
pour des lignées voisines et non pour des lignées trop éloignées, car dans ce dernier
cas, l'horloge souffre de dysfonctionnement.
Le test de la fréquence relative
Pour éviter les désaccords fréquents au sujet de la datation des divergences de
lignées, Vincent SARICH et Allan WILSON ont mis au point, en 1973, un test sans datation
absolue : celui de la fréquence relative. Plusieurs propositions doivent être admises :
1) Le fonctionnement de l'horloge est régulier.
2) Après divergence, les lignées évoluent à la même vitesse.
3) Le test utilise trois lignées, deux dont on veut apprécier le degré de divergence et
la troisième, servant de référence, qui s'est séparée d'un tronc commun bien avant les
deux premières (c'est la notion de l'UE extragroupe déjà évoquée plus haut).
L'arbre phylétique de ces trois lignées A, B et C possède l'aspect représenté à la
figure 2.19
La fréquence des mutations par substitution de l'espèce A par rapport au point O
est Koa, celle de l'espèce B est Kob et celle de C est Koc. On peut écrire les égalités
suivantes :
(1) Kac = Koa + Koc
114
(2) Kbc = Kob + Koc
(3) Kab = Koa + Kob
Si l'horloge est régulière, on peut écrire :
(4) Koa = Kob
et d'après les égalités (1) et (2) :
(5) Koa Kob = Kac Kbc
L'égalité (5) permet donc d'apprécier le rythme de fixation des mutations de A et de B
par rapport à C. En fait, le taux de fixation dépend à la fois de l'effectif de la population,
en raison de la dérive génique fortuite (voir les sections 3.1.3 : « La variabilité et la
dérive génique fortuite », 3.3.2 : « La spéciation par révolution génétique », 4.2.3 : « La
théorie synthétique » et 4.3.2 : « La théorie neutraliste, le hasard ») et du taux de
mutations par génération qui est, seul, pris en compte ici.
Les fréquences de mutations fixées synonymes sont égales chez la Souris (A) et
le Rat (B), l'espèce (C) de référence est l'Homme (fig. 2.20).
115
En revanche, elles sont deux fois plus fréquentes chez le Singe africain (A) que chez
l'Homme (B), l'espèce (C) de référence est le Lémur pour l'exemple de la βglobine et
le Chien pour celui de l'insuline (fig. 2.20).
Le Rat et la Souris possèdent par rapport à l'Homme un taux de mutations et un taux
de fixation beaucoup plus élevés que ceux du Singe. Deux explications non exclusives
rendent compte de ces différences :
1) La durée de vie d'une génération est plus courte chez le Rongeur que chez le
Singe, et chez ces derniers que chez l'Homme. Le rythme de vie des cellules des
Rongeurs est accéléré ; les divisions cellulaires plus fréquentes impliquent de
nombreuses réplications de l'ADN, au cours desquelles les mutations peuvent
s'accumuler rapidement.
2) Le système de réparation de l'ADN au moment de sa réplication est moins
performant chez les animaux que chez l'Homme, comme l'indiquent les études sur les
Rongeurs réalisées par Roy BRITTEN (1986). Avant la division cellulaire, la réplication de
l'ADN est effectuée par l'ADNpolymérase, complexe enzymatique, qui, après avoir
contrôlé la conformité des brins néoformés aux brins originaux, corrige les erreurs de
transcription.
L'horloge moléculaire est donc fiable pour des lignées proches qui possèdent
une physiologie cellulaire comparable, mais aussi une durée de vie semblable.
2.2.3 La méthode cladistique
Alors que les phénogrammes représentent des degrés de ressemblances, les
cladogrammes représentent des relations de parenté.
Les particularités des caractères employés
Les cladistes admettent que les caractères évoluent indépendamment les uns
des autres et à des vitesses souvent inégales : la présence de cinq doigts à la main de
l'Homme est un caractère ancestral ou plésiomorphe, alors que la présence d'un
cortex plissé est un caractère dérivé ou apomorphe. Des vitesses différentes pour des
caractères différents donnent ce que Gavin De BEER (1954) a nommé une évolution en
mosaïque. Les variations de vitesse n'ont aucune répercussion sur l'élaboration de
l'arbre phylogénétique, dont la construction est indépendante du temps et ne nécessite
pas le postulat de l’horloge moléculaire. Les cladistes appliquent dans leurs
recherches et dans l'établissement du cladogramme le principe de parcimonie :
utilisation d'un nombre minimum d'hypothèses, choix du cladogramme le plus court.
116
La construction d'un cladogramme implique au préalable le choix de certains
caractères dont il faut trouver les états plésiomorphes (ancestraux) et les états
apomorphes (dérivés). La parenté plus ou moins proche des UE est, en effet,
déterminée par le partage de caractères apomorphes (synapomorphie) et non par la
présence commune de plésiomorphies. La reconnaissance des plésiomorphies et des
apomorphies nécessite l'emploi de plusieurs critères dont les deux premiers sont les
plus importants :
Le critère de comparaison extragroupe : un groupe non directement apparenté à
celui étudié sert de référence. « ... Étant donné un caractère rencontré dans un groupe, si le
caractère est rencontré également à l’extérieur du groupe il est primitif pour le groupe étudié ;
si le caractère n’est rencontré que dans le groupe étudié il est dérivé » (P. TASSY, L’Arbre à
remonter le temps, Paris, Christian Bourgois, 1991, p. 165).
Le critère ontogénique déjà évoqué, qui est issu d'une nouvelle formulation de la
loi de récapitulation. Les caractères apparaissent dans un ordre qui correspond à celui
de leur généalogie ; les premiers caractères développés sont les plus « primitifs », les
suivants sont de plus en plus « modernes ».
Le critère paléontologique : si un caractère est partagé par des fossiles, le fossile
le plus ancien présente le caractère plésiomorphe. Ce critère n'est valable que si les
fossiles appartiennent à un groupe monophylétique.
Le critère de distribution géographique, qui est presque abandonné. Un caractère
apomorphe apparaît dans une espèce loin de l'aire de répartition principale de cette
espèce.
Les cladistes travaillent sur des caractères apomorphes ou dérivés, mais aussi
homologues afin que ces derniers demeurent comparables. Ils ont donc à rechercher
les caractères homologues. Ils retracent la phylogénie de groupes monophylétiques,
c'estàdire d'un ensemble de taxons étroitement apparentés ; lorsque les taxons ne le
sont pas, le groupe est dit paraphylétique. Les taxons apparentés forment des groupes
frères. Parfois certains caractères ne sont pas partagés avec des groupes frères, ils
sont particuliers à un seul groupe ; on parle dans ce cas de caractères autapomorphes
ou d'autapomorphies. La figure 2.21 résume quelques points exposés cidessus.
117
La reconnaissance des homologies
Après avoir reconnu les caractères dérivés et les caractères ancestraux, le
problème fondamental est d'identifier les homologies avec la plus grande certitude.
Les cladistes disposent de trois critères :
Le critère de ressemblance, qui correspond au principe des connexions de
É. GEOFFROY SAINTHILAIRE. Un organe maintient avec ses voisins toujours les mêmes
connexions, qui sont invariables. Par conséquent, des organes d’espèces différentes
sont homologues s’ils ont des connexions identiques avec leurs voisins.
Le critère de noncoexistence : deux caractères homologues ne peuvent coexister
chez un même organisme. C'est pourquoi les Centaures sont de pures inventions
mythologiques, car ils cumulent « bras » et « pattes antérieures ».
Le critère de parcimonie (ou de congruence). Toutes les conclusions adoptées
sont issues de l'utilisation d'un nombre d'hypothèses aussi faible que possible.
La notion d’homologie, fondamentale dans l’analyse cladistique, est appliquée
également aux molécules. Mais l’assimilation courante d’une ressemblance ou d’une
similitude moléculaire à une homologie heurte les convictions de certains spécialistes
qui considèrent ce rapprochement abusif. C’est pourquoi W. FITCH (1970) a proposé la
création de deux termes spécifiques à la biologie moléculaire : « orthologue » et
« paralogue », celui d’homologue étant réservé aux caractères morphologiques. Le
terme « orthologue » qualifie des séquences similaires issues d’ascendants
communs ; le terme « paralogue » désigne des séquences dont la similitude est
118
acquise par des mutations ou par des remaniements génétiques dans des lignées
différentes ; dans tous les cas, la paralogie est acquise indépendamment de la
spéciation.
Les caractéristiques du cladogramme
Le cladogramme possède des branches internes dont la longueur est
proportionnelle au nombre de caractères apomorphes. En revanche, la longueur des
branches terminales est déterminée par le nombre de caractères autapomorphes. Le
cladogramme n'est pas obligatoirement enraciné ; seules les relations de parenté sont
indiquées. L'introduction d'un extragroupe permet son enracinement ; l'ancêtre situé à
la racine comme ceux présents aux différents noeuds de l'arbre sont totalement
hypothétiques, puisqu'ils sont déduits des caractères de leurs descendants.
119
Il arrive que plusieurs arbres soient aussi parcimonieux, bien qu'ils aient des
configurations différentes (fig. 2.22). Des homoplasies non détectées en sont
responsables. Le cladogramme, comme le phénogramme, n'est pas directement
phylogénétique à moins d'introduire des hypothèses évolutives : les observations sont
équivalentes, les caractères évoluent indépendamment, les caractères se
transforment...
120
Le cladogramme est parfois qualifié indifféremment d’arbre « généalogique » ou
d’arbre « phylogénétique ». Or ces deux termes ne sont pas tout à fait équivalents :
Dans un arbre généalogique, les ancêtres sont connus et bien identifiés.
Dans un arbre phylogénétique (un cladogramme), les ancêtres comme,
d’ailleurs, les intermédiaires ne sont pas connus, mais ils sont inférés par les
caractères qu’ils ont légués à leurs descendants. Seules les relations de parenté entre
les U.E terminales sont mises en évidence.
L'établissement d'un cladogramme
L'exemple choisi concerne des données moléculaires d'une protéine homologue
l'hémoglobine de plusieurs Primates. Par l'analyse des séquences partielles de la
myoglobine des 11 Singes, on reconstitue la séquence ancestrale en appliquant le
critère de parcimonie : le caractère typique ancestral est le plus fréquent c'estàdire,
dans cet exemple, l'acide aminé le plus fréquent puisque sa détermination nécessite
un minimum d’hypothèses.
Au lieu de reconstituer une classification généalogique comme dans le
phénogramme, on veut suivre les étapes de l'évolution en reconstituant les relations
de parenté qui unissent, par exemple, le Singe laineux ou Lagothrix (La), le Saimiri
(Sai) et le Marmouset (Mar). Trois arbres sont possibles (voir figure 2.23).
121
La construction du cladogramme obéit également aux principes de parcimonie et
de vraisemblance. Ignorant les probabilités de chaque mutation, les cladistes
supposent que les différents types de mutations (substitution, insertion et délétion) ont
une fréquence identique. Par exemple, les transformations Phe> Leu, Ile> Val,
122
Val> Ala... se produisent au même rythme. Retracer l'apparentement des trois
espèces de Singes, le Lagothrix (La), le Saïmiri (Sai) et le Marmouset (Mar), exige
l'exploration des filiations possibles qui, limitées à trois, sont présentées dans la
figure 2.23. Pour bâtir l'un des trois cladogrammes, on choisira la solution exigeant les
manipulations les moins nombreuses.
Le critère de référence est la séquence ancestrale. Dans le cas du cladogramme
2.23A, le passage direct de la séquence ancestrale à la séquence (Sai) a nécessité
5 mutations, signalées sur la branche du cladogramme ; le passage à la séquence
(Mar) 1 mutation, et le passage à la séquence (La) 3 mutations. Trois de ces neuf
mutations sont des convergences, car elles figurent sur deux branches au moins:
1ère convergence Val>Ile position 1 chez (Sai) et (La)
2e convergence His>Gln position 3 chez (Sai) et (La)
3e convergence Ile>Val position 5 chez (Sai) et (Mar)
Les 9 mutations et les 3 convergences forment 12 événements.
Pour bâtir le cladogramme 2.23B, 7 mutations sont nécessaires, dont une
convergence : Ile>Val position 5 chez (Mar) et (Sai), soit un total de 8 événements.
Le cladogramme 2.23C utilise 8 mutations, dont deux convergences et une
réversion :
1ère convergence Val>Ile position 1 chez (Sai) et (La)
2e convergence His>Gln position 3 chez (Sai) et (La)
Le principe de parcimonie situe la mutation Ile>Val en position 5 sur la branche
commune à (Sai) et (Mar), plutôt que sur chacune des deux branches ; il est plus
vraisemblable également que cette mutation s'est produite une fois au lieu de deux.
Quoi qu'il en soit, cette mutation placée sur une branche commune, et non pas sur les
deux branches séparées, est une réversion. Le nombre d'événements est égal à 8
mutations + 2 convergences + une réversion, soit 11 événements.
Finalement, le cladogramme retenu est le 2.23B, car 8 événements en font le plus
économique, et l’on admet qu’il retrace la phylogénie la plus exacte.
123
Discussion sur l'existence de la parcimonie dans l'évolution
Le principe de parcimonie est abondamment utilisé sans que l’on sache pour
autant si l'évolution est réellement parcimonieuse. Si les événements évolutifs
(mutations) sont rares, la parcimonie de l'évolution est admise. En revanche, elle est
rejetée si l'on pense que les homoplasies sont aussi fréquentes que les homologies et
qu'elles ne renvoient à aucun modèle évolutif.
Si l’emploi du terme « parcimonie » est récent (1965), le principe en est ancien.
Guillaume d’OCKHAM (12881349) l’a introduit définitivement dans la démarche
scientifique : la meilleure explication d’un fait est celle qui utilise le minimum
d’hypothèses. La science actuelle continue à rejeter les hypothèses ad hoc, c’està
dire celles qui ne sont pas nécessaires à la compréhension d’un fait particulier. Il est
donc admis qu’un caractère dérivé partagé par deux taxons est hérité d’un ancêtre
commun ; et l’hypothèse soutenant l’apparition indépendante de ce même caractère
chez les deux taxons est rejetée parce qu’elle est moins parcimonieuse que la
première.
Les méthodes phénétiques utilisent des critères de ressemblance issus de
caractères plésiomorphes (ancestraux). Elles traitent aussi bien les homologies que
les homoplasies, convergences et réversions. Pourtant cet amalgame fausse la
reconstruction phylogénétique, car il réunit des espèces non étroitement apparentées,
qui ont adopté une même solution adaptative. La méthode cladistique s’attache, autant
que possible, à limiter la prise en compte des homoplasies. C’est pourquoi le choix des
caractères de référence est très strict et l’arbre le plus parcimonieux est retenu. La
parcimonie permet de dégager un arbre qui se rapproche le plus possible de la
phylogénie réelle, car il est bâti à partir d’un maximum d’homologies et d’un minimum
d’homoplasies.
Deux autres méthodes existent également, mais elles sont beaucoup moins
employées. La méthode de compatibilité, l'arbre choisi est celui qui ne nécessite pas
l'hypothèse de l'homoplasie. La méthode probabiliste, l'évolution obéit à certaines lois
probabilistes définies a priori, l'arbre choisi est le plus probable.
Dans la reconstitution des filiations, l’anatomie comparée occupe une place
importante, car quelques indices suffisent pour reconstituer tout un ensemble, qu’il est
alors possible d’intégrer dans une histoire évolutive.
124
Bibliographie de la section 2.2
Livres
DARLU P. et TASSY P. , Reconstruction phylogénétique, concept et méthodes, Paris, Masson, 1993.
LECOINTRE G. et LE GUYADER H. , Classification phylogénétique du vivant, Paris, Belin, 2001.
LI W. et GRAUR D. , Molecular evolution, Sunderland (Massachussetts, USA), Sinauer Associates Inc., 1991.
NINIO J. , Approches moléculaires de l'évolution, Paris, Masson, 1979.
TASSY P., L’Arbre à remonter le temps, Christian Bourgois, 1991.Le Message des fossiles, Paris, Hachette, 1992.
TASSY P. (coordonné par), L’Ordre et la diversité du vivant, Paris, Fayard, 1986.
Articles
BOULIGAND Y. , « Morphologie », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
DEVILLERS Ch. , « Homologie/analogie », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
GASC J.P. , « Tendances évolutives et progrès », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
GÉNERMONT J. , « Dendrogramme », « Horloge moléculaire de l'évolution », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
GILLOIS M. : « Homologie », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
GOUJET D. , « Arbre phylogénétique », « Cladisme », « Grade », « Hennig », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
GUY Y. , « Phylogénétique (arbre)», Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
JANVIER Ph., TASSY P. et THOMAS H. , « Le cladisme », La Recherche, n° 117, décembre 1980.
125
LECOINTRE G. , « La construction des phylogénies », APBG (revue de l'Association des Professeurs de Biologie et de Géologie), n° 1, 1995.
TASSY P., « La critique cladistique du néodarwinisme et comment s’en servir », Pour Darwin (dir. P. TORT), Paris, PUF, 1997.
TORT P. , « Adanson », « Monophylie/ polyphylie », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.
126