2.2 les dendrogrammes · d'unités évolutives (ue), d'unités évolutives hypothétiques...

24
2.2 - Les dendrogrammes Le dendrogramme est une figure arborescente. Si, dans sa construction, l'on introduit l'hypothèse que les ressemblances sont le reflet d'une relation de parenté, le dendrogramme est généalogique ; si l'on introduit celle que les ressemblances évoluent au cours du temps, le dendrogramme est phylogénétique. Les dendrogrammes retenus dans cette section mettent en évidence des ressemblances entre différents taxons. L'objectif de recherche est souvent double ; dans un premier temps, il s'agit de mettre en évidence sur un schéma synthétique (le dendrogramme) les relations généalogiques ou évolutives entre plusieurs taxons ; dans un second temps, d'apprécier leur degré de divergence. Ce dernier est estimé en fonction soit du temps qui sépare les taxons, soit des différences génétiques, moléculaires ou autres accumulées entre ces mêmes taxons. Les constructions phylogénétiques sont bâties principalement à partir de l'anatomie comparée, l'ontogénie et la paléontologie. L'anatomie comparée a pour objectif de rechercher les homologies en utilisant, par exemple, le principe de subordination des caractères de B. de JUSSIEU ( les caractères constants sont plus importants que les caractères inconstants), ou encore celui des connexions de É. GEOFFROY SAINT-HILAIRE (voir la section précédente) : quelles que soient leur forme, leur taille ou leur fonction, des organes sont reconnus homologues s'ils possèdent les mêmes connexions avec d'autres organes. L'ontogénie utilise le principe de récapitulation (loi biogénétique fondamentale) de E. HAECKEL, mais reformulé par Gareth NELSON (1973) : lorsque l'on peut suivre la transformation d'un caractère d'un état général vers un état plus spécialisé, le caractère le plus général est le plus ancien, le moins général est le plus récent, dérivé du premier. La règle de G. NELSON, qui n'est pas sans rappeler les deux premières règles de K. E. von BAER, est une hypothèse de travail et non une loi. La paléontologie fournit des arguments morphologiques, mais aussi des arguments chronologiques. À ces données traditionnelles s'ajoutent aujourd'hui celles de la biologie moléculaire : séquençages des protéines, de l'ADN, de l'ARN, hybridation de l'ADN. L'unité de base de la construction phylogénétique est très souvent l'espèce, puisqu'elle est un groupe génétique fermé : l'interfertilité existe uniquement entre ses 103

Upload: others

Post on 17-Feb-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

2.2 ­ Les dendrogrammes

Le dendrogramme est  une  figure arborescente.  Si,  dans sa construction,   l'on 

introduit l'hypothèse que les ressemblances sont le reflet d'une relation de parenté, le 

dendrogramme   est   généalogique   ;   si   l'on   introduit   celle   que   les   ressemblances 

évoluent   au   cours   du   temps,   le   dendrogramme   est   phylogénétique.   Les 

dendrogrammes retenus dans cette section mettent en évidence des ressemblances 

entre différents taxons.

L'objectif de recherche est souvent double ; dans un premier temps, il s'agit de 

mettre   en   évidence   sur   un   schéma   synthétique   (le   dendrogramme)   les   relations 

généalogiques   ou   évolutives   entre   plusieurs   taxons   ;   dans   un   second   temps, 

d'apprécier leur degré de divergence. Ce dernier est estimé en fonction soit du temps 

qui   sépare   les   taxons,   soit   des   différences   génétiques,   moléculaires   ou   autres 

accumulées entre ces mêmes taxons.

Les   constructions   phylogénétiques   sont   bâties   principalement   à   partir   de 

l'anatomie comparée, l'ontogénie et la paléontologie.

L'anatomie comparée a pour objectif de rechercher les homologies en utilisant, 

par   exemple,   le   principe   de   subordination   des   caractères   de   B.   de   JUSSIEU  (   les 

caractères constants sont plus importants que les caractères inconstants), ou encore 

celui des connexions de É. GEOFFROY SAINT­HILAIRE (voir la section précédente) : quelles 

que   soient   leur   forme,   leur   taille   ou   leur   fonction,   des   organes   sont   reconnus 

homologues s'ils possèdent les mêmes connexions avec d'autres organes.

L'ontogénie utilise le principe de récapitulation (loi biogénétique fondamentale) 

de E. HAECKEL, mais reformulé par Gareth NELSON  (1973) : lorsque l'on peut suivre la 

transformation   d'un   caractère   d'un   état   général   vers   un   état   plus   spécialisé,   le 

caractère le plus général est le plus ancien, le moins général est le plus récent, dérivé 

du premier.  La règle de G. NELSON,  qui  n'est pas sans rappeler   les deux premières 

règles de K. E. von BAER, est une hypothèse de travail et non une loi.

La   paléontologie   fournit   des   arguments   morphologiques,   mais   aussi   des 

arguments chronologiques.

À   ces   données   traditionnelles   s'ajoutent   aujourd'hui   celles   de   la   biologie 

moléculaire : séquençages des protéines, de l'ADN, de l'ARN, hybridation de l'ADN.

L'unité  de  base  de   la   construction  phylogénétique  est   très  souvent   l'espèce, 

puisqu'elle est un groupe génétique fermé : l'interfertilité existe uniquement entre ses 

103

membres.  Mais  certains  auteurs   rejettent  cet  usage  de  l'espèce,  car   leurs   travaux 

concernent des populations plus que des espèces entières : sous­espèces et espèces 

sont alors confondues. Pour éviter l'emploi du mot « espèce », les taxons sont qualifiés 

d'unités évolutives (UE), d'unités évolutives hypothétiques (UEH) s’ils sont de pures 

constructions fictives, ou encore d’unités taxinomiques opérationnelles (UTO ou OTU 

dans   la   terminologie   anglo­saxonne).   Les   taxons   sont   parfois   de   niveau 

supraspécifique ; dans ce cas,  ils doivent appartenir  à une même lignée phylétique 

(lignée monophylétique) pour demeurer comparables.

Les arbres  sont  composés  de deux  régions   :   les  noeuds où  sont  placés   les 

taxons qui sont souvent des UEH, car on ne connaît  pas les formes fossiles, et les 

branches qui   indiquent   le degré  de parenté  des différents taxons.  La  longueur des 

branches est proportionnelle au temps ou bien aux différences entre taxons (fig. 2.15). 

À leurs extrémités figurent les taxons terminaux qui sont des UE.

Fig. 2.15

Si l'arbre est enraciné (fig. 2.15­A), la racine représente l'ancêtre commun et il précise 

alors les relations évolutives des différents taxons présents. Mais l'arbre est souvent 

dépourvu de racines (fig. 2.15­B) : il rend compte uniquement des relations de parenté, 

sans que l'on puisse savoir comment l'évolution passe d'un taxon à l'autre. Cependant 

un arbre peut être enraciné si on le construit avec un taxon extérieur au groupe, UE 

extra­groupe, qui sera la référence pour estimer les degrés de ressemblance entre les 

taxons étudiés. Il est nécessaire de connaître précisément les données taxinomiques 

104

ou paléontologiques de cette  UE extra­groupe  ;   il   faut,  en  effet,  être  sûr  qu'elle  a 

divergé bien avant l'ancêtre commun aux UE considérées (fig. 2.15­A). Lorsque l'on 

dispose d'un certain nombre d'UE dont on veut établir la parenté, le nombre théorique 

d'arbres possibles augmente très rapidement :

­ avec n unités (UE) et si l'arbre est enraciné, il y a N1 arbres théoriques, soit : 

N1 = (2n ­ 3) ! : 2 n­2 (n ­ 2) !

­ avec n unités (UE) et si l'arbre n'est pas enraciné, il y a N2 arbres possibles, soit 

:

N2 = (2n ­ 5) ! : 2 n­2 (n ­ 2) !

Si n = 10, N1 est égal à 35.106 et N2 à 2.106 ; la formule exprime les incertitudes pour 

déterminer l'arbre exact parmi plusieurs millions. Un exemple sera donné à propos de 

l'émergence de  l'Homme   moderne à   la section 4.4.3 :  « Le modèle  unirégional  ou 

monocentrique, discussion ».

Les   classifications   phylogénétiques   utilisent   abondamment   le   critère 

d'homologie.  Les ressemblances sans  lien de parenté  sont  des  homoplasies  parmi 

lesquelles   on   distingue   les   convergences   (ressemblances   adaptatives)   et   les 

réversions,  brusque  apparition  d'un  caractère   rappelant  un  caractère  ancestral.  Un 

caractère ancestral est plésiomorphe ; un caractère dérivé est apomorphe.

Parmi   les  quatre  méthodes  principales   ­  phénétique,  cladistique,  probabiliste  et  de 

compatibilité   ­,   seules   seront   évoquées   les   deux   premières,   car   ce   sont   les   plus 

fréquentes.

2.2.1 ­ La méthode phénétique ou numérique

Conçue  par  Charles  MICHENER  et  Robert  SOKAL  (1957),  elle  utilise  un  nombre 

réduit de principes. La construction des arbres phénétiques (phénogrammes) repose 

sur   les   ressemblances   observées   entre   chaque   paire   d'UE   (unité   évolutive).   Les 

ressemblances   englobent   ici   aussi   bien   les   homologies   que   les   homoplasies,   les 

plésiomorphies (caractères ancestraux) que les apomorphies (caractères dérivés). Les 

phénéticiens  admettent  que   les   caractères  évoluent   indépendamment   les  uns  des 

autres et  qu'ils  ont   tous  le même poids.  Plus  le  nombre de caractères étudiés est 

élevé,   meilleure   sera   la   classification.   Les   ressemblances   entre   UE   sont   souvent 

estimées par l'emploi d'une matrice de similitude (voir ci­dessous la méthode UPGMA). 

Peter   SNEATH  et   R.   SOKAL  précisent   que   les   phénogrammes   ne   sont   pas  a   priori 

phylogénétiques   ;   en   fait,   ces   arbres   doivent   être   reconnus   seulement   comme 

105

phénétiques.   Le   phénogramme   n’a   pas   de   racines,   car   il   montre   les   relations 

morphologiques qui rapprochent ou qui éloignent plusieurs unités taxinomiques. Mais 

la  notion  d'évolution   (phylogénie)  peut   se  déduire  des  phénogrammes  à   condition 

d'introduire   dans   la   construction   des   hypothèses   évolutives   telle   que   l'horloge 

moléculaire, par exemple.

On distingue trois méthodes phénétiques majeures :

­ La méthode d'ajustement. L'arbre non enraciné choisi est celui dont les longueurs 

des   branches   expliquent   le   mieux   les   ressemblances   des   UE   ;   l'introduction   de 

certains critères permet de déterminer les longueurs.

­ La méthode de parcimonie. L’objectif, qui rappelle celui de la méthode cladistique, 

est d’obtenir un arbre non enraciné le plus court possible avec une minimisation des 

homoplasies.

­ Les méthodes d'agglomération. La classification est hiérarchique car les UE sont 

classées en fonction de leurs ressemblances. La méthode agglomérative dite UPGMA, 

abréviation anglaise de  Unweighted Pair Group Method with Arlthmetic Mean, a été 

très employée par les phénéticiens pour traiter les données moléculaires (séquençage, 

etc.). Si la notion de l'horloge moléculaire est admise ; elle implique que le taux de 

mutations   et   la   vitesse   d'évolution   d'un   caractère   donné   sont   constants.   Par 

conséquent,  les longueurs des branches de l'arbre peuvent être proportionnelles au 

temps. En revanche, la méthode dite « du plus proche voisin » (neighbor joining), qui 

se développe rapidement, n'utilise pas le postulat de l'horloge moléculaire. Les paires 

d'UE  sont   regroupées  d'après   leurs   ressemblances,  de   telle  sorte  que   l'arbre  non 

enraciné construit soit le plus court possible.

Les   résultats  qui  proviennent  de   l'étude  de  séquençage  sont  exprimés  sous 

forme de chiffres qu’on soumet à  un certain nombre de manipulations :  ce tableau 

devient   alors   une   matrice.   La   manière   la   plus   simple   consiste   à   quantifier   les 

différences entre chaînes peptidiques  (protéines)  et  nucléotidiques (ADN ou ARN). 

Tout   calcul   doit   être   précédé   de   l'alignement   des   séquences,   même   lorsque   les 

chaînes  sont  de   longueur   identique.  La   figure 2.16  donne  un  exemple  de  matrice 

simple où  sont   reportés  les nombres d'acides aminés différents de  la chaîne  α  de 

l'hémoglobine, chez quelques Vertébrés ; les séquences sont comparées deux à deux.

106

Le nombre de différences correspond à une distance génétique : deux espèces seront 

d'autant plus proches que leurs différences seront faibles.

La figure 2.17 montre un exemple simple de calculs permettant la construction d'un 

phénogramme avec les transformations successives subies par la matrice.

107

Toutes   les   unités   taxinomiques   (espèces,   familles,   classes...)   qui   doivent   être 

comparées   sont   des   Unités   Taxinomiques   Opérationnelles   (UTO)   ou  Operational  

Taxinomic Units  (OTU). Au cours de l'établissement du phénogramme, on regroupe 

les deux espèces qui présentent la différence la plus petite, ici Homme­Chimpanzé, en 

une seule OTU : l'Homme et le Chimpanzé ont la différence la plus faible (1,45) des 

quatre (1,45­1,57­3,04 et 7,1).

La 2ème matrice se réalise comme il est indiqué sur la figure 2.17. Par exemple, la 

différence entre le Rhésus et l'OTU (Homme­Chimpanzé) est égale à la somme des 

108

différences   Homme­Macaque   rhésus   :   7,51   et   Chimpanzé­Macaque   rhésus   :   7,5, 

divisée  par  2  puisque  Homme­Chimpanzé   constitue  un  groupe.  Pour   le  Gorille  et 

l'Orang­outan, le raisonnement est identique. Dans cette 2ème matrice, la différence la 

plus faible concerne l'OTU (Homme­Chimpanzé) et le Gorille ; on regroupe donc en 

une 2ème OTU ces trois animaux.

La 3ème  matrice est établie selon les mêmes règles. La différence entre l'OTU 

(Homme­Chimpanzé­Gorille)  et  l'Orang­outan est égale à  la somme des différences 

Homme­Orang­outan 2,98, Chimpanzé­Orang­outan 2,94 et Gorille­Orang­outan 3,04, 

divisée   par   trois.   La   différence   est   la   plus   faible   entre   la   2ème  OTU   (Homme­

Chimpanzé­Gorille) et l'Orang­outan ; ces quatre animaux constituent une 3ème OTU à 

l'origine de la dernière matrice.

Tous les calculs s'effectuent avec les résultats de la première matrice, et non avec les 

moyennes calculées par la suite.

Le phénogramme est bâti à partir des résultats suivants :

­   La   différence   Homme­Chimpanzé   est   de   1,45   ;   on   construit   deux   branches 

parallèles de longueur égale 1,45/2 = 0,725.

­  La  différence   (Homme­Chimpanzé)­Gorille  est  de  1,54   :   la  branche  du Gorille 

mesure 1,54/2 = 0,77. L'OTU (Homme­Chimpanzé) comprend déjà deux branches de 

0,725 ; pour obtenir un segment horizontal de longueur égale à 0,77, on rajoute un 

court segment de 0,045, soit (0,77 ­ 0,725), à ce groupe.

­ La différence (Homme­Chimpanzé­Gorille)­Orang­outan est de 1,495. La branche 

Orang­outan est donc de 1,495 et la 2ème branche, de 0,77, doit être rallongée de 0,725 

soit (1,495 ­ 0,77).

­  La différence (Homme­Chimpanzé­Gorille­Orang­outan)­Macaque rhésus est de 

3,695. Les deux dernières branches s'établissent comme ci­dessus.

La figure 2.18 donne un autre exemple un peu plus compliqué,  non commenté ; au 

lecteur de s'exercer à reconstituer les OTU, les matrices et le phénogramme.

109

110

Les phénogrammes d’espèces identiques diffèrent parfois pour trois raisons : soit les 

caractères choisis comme critères varient d’une classification à l’autre, soit les indices 

de distance sont différents, soit les opérations matricielles ne sont pas identiques.

2.2.2 ­ L'horloge moléculaire

Ce concept se révèle très précieux  pour traiter les données moléculaires, mais 

sa fiabilité  est  loin d'être démontrée. Les conclusions  issues de son utilisation sont 

vivement   controversées,   comme   on   le   verra   dans   la   section   4.4.3,   à   propos   de 

l'émergence   de   l'Homme   moderne :   « Le   modèle   unirégional   ou   monocentrique, 

discussion ».

Sa découverte 

Entre   1962   et   1965,   Émile   ZUCKERKANDL  et   Linus   PAULING,   ainsi   que 

Emmanuel MARGOLIASH  en   1963,   ont   travaillé   respectivement   sur   les   séquences 

polypeptidiques de l'hémoglobine et du cytochrome C, molécule intervenant dans le 

transfert   d'électrons   au   cours   de   la   chaîne   respiratoire   des  mitochondries.   Ils   ont 

remarqué  que  le rythme de substitution des acides aminés de ces deux molécules 

demeurait   constant   chez   différents   Mammifères.   La   représentation   graphique   des 

ressemblances   des   molécules   homologues   de   plusieurs   espèces   de   Mammifères 

correspond à un dendrogramme très semblable à celui obtenu par les méthodes de la 

paléontologie ;  de plus,   la  longueur  des branches du premier est proportionnelle  à 

celle du second. Il devient donc possible d’utiliser les degrés de ressemblance entre 

molécules   homologues   d’espèces   plus   ou   moins   apparentées   pour   dater   des 

événements   tels   que   la   séparation   de   deux   lignées,   l’âge   d’une   lignée...   Cette 

découverte   étendue   à   tous   les   groupes   est   à   l'origine   du   postulat   de   l'horloge 

moléculaire : chaque molécule possède un rythme de mutations qui lui est propre ; 

dénombrer   les   mutations   qui   ont   affecté   une   molécule   revient   donc   à   dater   son 

ancienneté.

La nature du matériel concerné

Les gènes sont les premières molécules affectées par cette horloge qui régule le 

rythme de  leurs mutations. Mais les résultats se rapportent  aux gènes de structure 

pour  lesquels les biologistes disposent d'une quantité   importante de données aussi 

bien qualitatives, connaissance du gène et de son fonctionnement, que quantitatives, 

connaissance du nombre de gènes.  Les  données qui  se  rapportent  aux gènes de 

régulation, beaucoup plus limitées, ne concernent souvent que l'aspect qualitatif ; on 

111

ignore encore la fréquence de leurs mutations. En général, l'horloge moléculaire règle 

donc   le   rythme   des   mutations   de   l'ADN   nucléaire,   mais   aussi   celui   de   l'ADN 

mitochondrial. Le taux de mutations peut être retrouvé indirectement par l'analyse des 

séquences  protéiniques,  par   l'hybridation  de   l'ADN ou  par   le  calcul  des  distances 

immunologiques.

L'utilité des calculs

L'horloge   constitue   un   outil   pratique   et   heuristique.   Chaque   gène,   chaque 

protéine en possède une originale. Si, pour une molécule, le rythme des mutations est 

constant,  on  peut  alors  calculer   l'âge  de  la  divergence  de  deux   lignées.  L'horloge 

donne une probabilité de mutation. Le calcul de son rythme est effectué par estimation 

du  nombre  de  mutations   intervenues  entre  deux  événements   connus  précisément 

dans une série fossile ou bien par le recensement des mutations présentes chez deux 

lignées dérivant d'un ancêtre commun ; il permet de tester la validité de la méthode. 

Aujourd'hui, la connaissance de nombreuses séquences d'ADN facilite la mesure du 

rythme de l'horloge, mieux certainement que ne pourraient le faire d'autres méthodes, 

comme   le   séquençage   des   protéines.   Le   rythme   s'exprime   en   pourcentage   de 

mutations par unité  de temps ; généralement il  est de quelques % pour un milliard 

d'années : la longueur des branches des arbres phylogénétiques représente alors un 

temps et non plus une unité arbitraire. Ces dernières années, l'ADN mitochondrial a 

acquis une importance considérable parce que sa vitesse de fixation des mutations est 

beaucoup   plus   rapide   (jusqu’à   10   fois   chez   les   Mammifères)   que   celle   de   l'ADN 

nucléaire   :   les  mutations   affectent   deux  à   quatre   nucléotides   sur   cent   par   million 

d'années. Cette horloge au rythme si rapide, qui permet de dater des phénomènes très 

récents, est utilisée en archéologie pour calculer l'âge des fossiles d'Hominidés et des 

ancêtres directs de l'Homme.

Les contestations

Les   résultats   établis   à   partir   de   l'horloge   ont   bouleversé   les   données 

paléontologiques,  car  ils  ont conduit  à  estimer  la séparation Homme­Chimpanzé    à 

5 Ma, alors que les fossiles, dont un petit nombre seulement étaient en bon état, la 

plaçaient à 15 Ma. Mais quinze ans après, en expérimentant plusieurs méthodes de 

séquençage   des   protéines,   de   l'ADN   nucléaire,   de   l'ADN   mitochondrial,   l’horloge 

moléculaire   a   confirmé   l'origine   récente   des   Hominidés   (5   à   10 Ma).   La 

reconnaissance de cette origine récente vient de la découverte d’Ardipithecus ramidus, 

112

forme   très   proche   des  Australopithecus,   daté   de   4,5 Ma,   dont   les   caractères 

anatomiques sont intermédiaires entre ceux de l’Homme et ceux du Chimpanzé.

D'autres   biologistes,   tel   Morris GOODMAN  (1981),   ont   contesté   également   la 

régularité  de   l'horloge.   Ils  pensent  que   l'évolution  suit   le   rythme des   fixations  des 

mutations,  qui  augmenterait  au moment des périodes de radiation adaptative.  Pour 

étayer leur thèse, ils prennent l'exemple extrême des gènes des hémoglobines α et β, 

chez lesquels la fréquence des mutations par substitution est très élevée lors de leur 

individualisation   et   de   leur   séparation.   Cette   fréquence   est   interprétée   comme   un 

phénomène peu courant : la sélection naturelle, dite positive, a favorisé les mutations 

qui ont permis à la fonction de l'hémoglobine de progresser. Dans l'immense majorité 

des cas, en revanche, la sélection naturelle est négative, c'est­à­dire qu'elle élimine les 

mutations.

Les erreurs et leurs remèdes

Les erreurs peuvent provenir d'estimations faussées :

1) Si les mutations s’annulent mutuellement, le gène est maintenu dans son état 

ancestral ; la datation de son apparition est alors sous­estimée, car le faible nombre de 

mutations apparentes lui donne un âge plus récent qu’il ne l’est en réalité.

2)   Si   la   sélection   naturelle   augmente   le   rythme   des   mutations,   le   gène   sera 

considéré comme plus ancien qu'il ne l'est.

3)   Si   deux   lignées   qui   ont   divergé   s'hybrident,   les   gènes   des   hybrides   seront 

donnés pour récents.

Dans une population, le nombre de mutations par génération (taux de mutation) peut 

être  élevé,  mais  on  ne  peut  étudier  que   les  mutations   fixées   ;   le   taux  de  fixation 

(nombre de mutations fixées par génération) dépend ­ en raison de la dérive génique 

fortuite ­ de l'effectif des populations.

Pour améliorer la fiabilité de l'outil, les biologistes s'accordent maintenant sur ces 

conditions à respecter : 

­   Les   ressemblances   entre   les   organismes   étudiés   doivent   provenir   de   leur 

parenté ;  mais  la comparaison des séquences homologues n’élimine pas toutes les 

homoplasies.

­  Le  nombre  de   leurs  différences  doit  être  proportionnel  à   l'ancienneté   de   leur 

séparation d'un ancêtre commun. Mais on ne peut le savoir a priori.

­ Les lignées qui ont divergé ne doivent pas être mélangées. Généralement, elles 

ne le sont pas si l’on compare des espèces.

113

En définitive,   il  semble que  l'hypothèse de  l'horloge moléculaire soit  utilisable 

pour des lignées voisines et non pour des lignées trop éloignées, car dans ce dernier 

cas, l'horloge souffre de dysfonctionnement.

Le test de la fréquence relative

Pour éviter les désaccords fréquents au sujet de la datation des divergences de 

lignées, Vincent SARICH et Allan WILSON ont mis au point, en 1973, un test sans datation 

absolue : celui de la fréquence relative. Plusieurs propositions doivent être admises :

1) Le fonctionnement de l'horloge est régulier.

2) Après divergence, les lignées évoluent à la même vitesse.

3) Le test utilise trois lignées, deux dont on veut apprécier le degré de divergence et 

la troisième, servant de référence, qui s'est séparée d'un tronc commun bien avant les 

deux premières (c'est la notion de l'UE extra­groupe déjà évoquée plus haut).

L'arbre phylétique de ces  trois   lignées A,  B et  C possède  l'aspect  représenté  à   la 

figure 2.19

La fréquence des mutations par substitution de l'espèce A par rapport au point O 

est Koa, celle de l'espèce B est Kob  et celle de C est Koc. On peut écrire les égalités 

suivantes :

(1) Kac = Koa + Koc

114

(2) Kbc = Kob + Koc

(3) Kab = Koa + Kob

Si l'horloge est régulière, on peut écrire :

(4) Koa = Kob 

et d'après les égalités (1) et (2) :

(5) Koa ­ Kob = Kac ­ Kbc

L'égalité (5) permet donc d'apprécier le rythme de fixation des mutations de A et de B 

par rapport à C. En fait, le taux de fixation dépend à la fois de l'effectif de la population, 

en raison de la dérive génique fortuite (voir  les sections 3.1.3 : « La variabilité et  la 

dérive génique fortuite », 3.3.2 : « La spéciation par révolution génétique », 4.2.3 : « La 

théorie  synthétique »  et  4.3.2 :  « La  théorie  neutraliste,   le  hasard »)  et  du   taux  de 

mutations par génération qui est, seul, pris en compte ici.

Les fréquences de mutations fixées synonymes sont égales chez la Souris (A) et 

le Rat (B), l'espèce (C) de référence est l'Homme (fig. 2.20).

115

En revanche, elles sont deux fois plus fréquentes chez le Singe africain (A) que chez 

l'Homme (B), l'espèce (C) de référence est le Lémur pour l'exemple de la β­globine et 

le Chien pour celui de l'insuline (fig. 2.20).

Le Rat et la Souris possèdent par rapport à l'Homme un taux de mutations et un taux 

de fixation beaucoup plus élevés que ceux du Singe. Deux explications non exclusives 

rendent compte de ces différences :

1) La durée de vie d'une génération est plus courte chez le Rongeur que chez le 

Singe,  et chez ces derniers  que chez  l'Homme.  Le rythme de vie des cellules des 

Rongeurs   est   accéléré   ;   les   divisions   cellulaires   plus   fréquentes   impliquent   de 

nombreuses   réplications   de   l'ADN,   au   cours   desquelles   les   mutations   peuvent 

s'accumuler rapidement.

2)  Le  système de   réparation  de   l'ADN au  moment  de  sa   réplication  est  moins 

performant chez les animaux que chez l'Homme, comme l'indiquent les études sur les 

Rongeurs réalisées par Roy BRITTEN (1986). Avant la division cellulaire, la réplication de 

l'ADN est  effectuée par  l'ADN­polymérase,  complexe enzymatique,  qui,  après avoir 

contrôlé la conformité des brins néoformés aux brins originaux, corrige les erreurs de 

transcription.

L'horloge moléculaire est donc fiable pour des lignées proches qui possèdent 

une physiologie cellulaire comparable, mais aussi une durée de vie semblable.

2.2.3 ­ La méthode cladistique

Alors   que   les   phénogrammes   représentent   des   degrés   de   ressemblances,   les 

cladogrammes représentent des relations de parenté.

Les particularités des caractères employés

Les cladistes admettent que les caractères évoluent  indépendamment les uns 

des autres et à des vitesses souvent inégales : la présence de cinq doigts à la main de 

l'Homme   est   un  caractère  ancestral   ou  plésiomorphe,  alors  que   la  présence  d'un 

cortex plissé est un caractère dérivé ou apomorphe. Des vitesses différentes pour des 

caractères différents donnent ce que Gavin De BEER (1954) a nommé une évolution en 

mosaïque.  Les variations de vitesse n'ont  aucune répercussion sur  l'élaboration de 

l'arbre phylogénétique, dont la construction est indépendante du temps et ne nécessite 

pas   le   postulat   de   l’horloge   moléculaire.   Les   cladistes   appliquent   dans   leurs 

recherches   et   dans   l'établissement   du   cladogramme   le   principe   de   parcimonie   : 

utilisation d'un nombre minimum d'hypothèses, choix du cladogramme le plus court.

116

La construction  d'un cladogramme  implique au préalable  le choix  de certains 

caractères   dont   il   faut   trouver   les   états   plésiomorphes   (ancestraux)   et   les   états 

apomorphes   (dérivés).   La   parenté   plus   ou   moins   proche   des   UE   est,   en   effet, 

déterminée par le partage de caractères apomorphes (synapomorphie) et non par la 

présence commune de plésiomorphies. La reconnaissance des plésiomorphies et des 

apomorphies nécessite l'emploi de plusieurs critères dont les deux premiers sont les 

plus importants :

­ Le critère de comparaison extra­groupe : un groupe non directement apparenté à 

celui étudié sert de référence. « ... Étant donné un caractère rencontré dans un groupe, si le  

caractère est rencontré également à l’extérieur du groupe il est primitif pour le groupe étudié ;  

si le caractère n’est rencontré que dans le groupe étudié il est dérivé » (P. TASSY,  L’Arbre à  

remonter le temps, Paris, Christian Bourgois, 1991, p. 165).

­ Le critère ontogénique déjà évoqué, qui est issu d'une nouvelle formulation de la 

loi de récapitulation. Les caractères apparaissent dans un ordre qui correspond à celui 

de leur généalogie ; les premiers caractères développés sont les plus « primitifs », les 

suivants sont de plus en plus « modernes ».

­ Le critère paléontologique : si un caractère est partagé par des fossiles, le fossile 

le plus ancien présente le caractère plésiomorphe. Ce critère n'est valable que si les 

fossiles appartiennent à un groupe monophylétique.

­ Le critère de distribution géographique, qui est presque abandonné. Un caractère 

apomorphe apparaît dans une espèce loin de l'aire de répartition principale de cette 

espèce.

Les cladistes travaillent sur des caractères apomorphes ou dérivés, mais aussi 

homologues afin que ces derniers demeurent comparables. Ils ont donc à rechercher 

les caractères homologues. Ils retracent la phylogénie de groupes monophylétiques, 

c'est­à­dire d'un ensemble de taxons étroitement apparentés ; lorsque les taxons ne le 

sont pas, le groupe est dit paraphylétique. Les taxons apparentés forment des groupes 

frères. Parfois certains caractères ne sont pas partagés avec des groupes frères, ils 

sont particuliers à un seul groupe ; on parle dans ce cas de caractères autapomorphes 

ou d'autapomorphies. La figure 2.21 résume quelques points exposés ci­dessus.

117

La reconnaissance des homologies

Après   avoir   reconnu   les   caractères   dérivés   et   les   caractères   ancestraux,   le 

problème fondamental  est d'identifier   les homologies avec  la plus grande certitude. 

Les cladistes disposent de trois critères :

­   Le   critère   de   ressemblance,   qui   correspond   au   principe   des   connexions   de 

É. GEOFFROY SAINT­HILAIRE.  Un organe maintient  avec ses voisins  toujours  les mêmes 

connexions, qui sont invariables. Par conséquent, des organes d’espèces différentes 

sont homologues s’ils ont des connexions identiques avec leurs voisins.

­ Le critère de non­coexistence : deux caractères homologues ne peuvent coexister 

chez un même organisme.  C'est  pourquoi   les  Centaures  sont  de pures   inventions 

mythologiques, car ils cumulent « bras » et « pattes antérieures ».

­ Le critère de parcimonie (ou de congruence). Toutes  les conclusions adoptées 

sont issues de l'utilisation d'un nombre d'hypothèses aussi faible que possible.

La notion d’homologie,  fondamentale dans  l’analyse cladistique, est appliquée 

également aux molécules. Mais l’assimilation courante d’une ressemblance ou d’une 

similitude moléculaire à une homologie heurte les convictions de certains spécialistes 

qui considèrent ce rapprochement abusif. C’est pourquoi W. FITCH (1970) a proposé la 

création   de   deux   termes   spécifiques  à   la   biologie   moléculaire   :   « orthologue »   et 

« paralogue »,  celui  d’homologue  étant   réservé  aux  caractères  morphologiques.  Le 

terme   « orthologue »   qualifie   des   séquences   similaires   issues   d’ascendants 

communs   ;   le   terme   « paralogue »   désigne   des   séquences   dont   la   similitude   est 

118

acquise par des mutations ou par des remaniements génétiques   dans des lignées 

différentes   ;   dans   tous   les   cas,   la   paralogie   est   acquise   indépendamment   de   la 

spéciation. 

Les caractéristiques du cladogramme

Le   cladogramme   possède   des   branches   internes   dont   la   longueur   est 

proportionnelle au nombre de caractères apomorphes. En revanche, la longueur des 

branches terminales est déterminée par le nombre de caractères autapomorphes. Le 

cladogramme n'est pas obligatoirement enraciné ; seules les relations de parenté sont 

indiquées. L'introduction d'un extra­groupe permet son enracinement ; l'ancêtre situé à 

la   racine   comme   ceux   présents   aux   différents   noeuds   de   l'arbre   sont   totalement 

hypothétiques, puisqu'ils sont déduits des caractères de leurs descendants.

119

Il  arrive que plusieurs arbres soient  aussi  parcimonieux,  bien  qu'ils  aient  des 

configurations   différentes   (fig. 2.22).   Des   homoplasies   non   détectées   en   sont 

responsables.   Le   cladogramme,   comme   le   phénogramme,   n'est   pas   directement 

phylogénétique à moins d'introduire des hypothèses évolutives : les observations sont 

équivalentes,   les   caractères   évoluent   indépendamment,   les   caractères   se 

transforment...

120

Le cladogramme est parfois qualifié indifféremment d’arbre « généalogique » ou 

d’arbre « phylogénétique ». Or ces deux termes ne sont pas tout à fait  équivalents : 

­ Dans un arbre généalogique, les ancêtres sont connus et bien identifiés.

­   Dans   un   arbre   phylogénétique   (un   cladogramme),   les   ancêtres   ­   comme, 

d’ailleurs,   les   intermédiaires   ­   ne   sont   pas   connus,   mais   ils   sont   inférés   par   les 

caractères qu’ils ont légués à leurs descendants. Seules les relations de parenté entre 

les U.E terminales sont mises en évidence.

L'établissement d'un cladogramme

L'exemple  choisi   concerne   des   données   moléculaires   d'une  protéine   homologue   ­ 

l'hémoglobine ­ de plusieurs Primates.  Par l'analyse des séquences partielles de la 

myoglobine des 11 Singes,  on reconstitue  la séquence ancestrale en appliquant   le 

critère de parcimonie : le caractère typique ancestral est le plus fréquent ­ c'est­à­dire, 

dans cet exemple, l'acide aminé le plus fréquent ­ puisque sa détermination nécessite 

un minimum d’hypothèses.

Au   lieu   de   reconstituer   une   classification   généalogique   comme   dans   le 

phénogramme, on veut suivre les étapes de l'évolution en reconstituant les relations 

de parenté  qui unissent, par exemple, le Singe laineux ou Lagothrix (La), le Saimiri 

(Sai) et le Marmouset (Mar). Trois arbres sont possibles (voir figure 2.23).

121

La construction du cladogramme obéit également aux principes de parcimonie et 

de   vraisemblance.   Ignorant   les   probabilités   de   chaque   mutation,   les   cladistes 

supposent que les différents types de mutations (substitution, insertion et délétion) ont 

une fréquence identique. Par exemple, les transformations Phe­­­­> Leu, Ile­­­­> Val, 

122

Val­­­­>  Ala...   se  produisent  au  même  rythme.  Retracer   l'apparentement  des   trois 

espèces de Singes,  le Lagothrix (La),  le Saïmiri (Sai) et le Marmouset (Mar), exige 

l'exploration   des   filiations   possibles   qui,   limitées   à   trois,   sont   présentées   dans   la 

figure 2.23. Pour bâtir l'un des trois cladogrammes, on choisira la solution exigeant les 

manipulations les moins nombreuses.

Le critère de référence est la séquence ancestrale. Dans le cas du cladogramme 

2.23­A, le passage direct de la séquence ancestrale à la séquence (Sai) a nécessité 

5 mutations, signalées sur  la branche du cladogramme ;  le passage à   la séquence 

(Mar) 1 mutation, et  le passage à  la séquence (La) 3 mutations. Trois de ces neuf 

mutations sont des convergences, car elles figurent sur deux branches au moins:

1ère convergence Val­­­­>Ile position 1 chez (Sai) et (La)

2e convergence His­­­­>Gln position 3 chez (Sai) et (La)

3e convergence Ile­­­­>Val position 5 chez (Sai) et (Mar)

Les 9 mutations et les 3 convergences forment 12 événements.

Pour   bâtir   le   cladogramme   2.23­B,   7   mutations   sont   nécessaires,   dont   une 

convergence : Ile­­­­>Val position 5 chez (Mar) et (Sai), soit un total de 8 événements.

Le cladogramme 2.23­C utilise  8  mutations,  dont  deux  convergences  et  une 

réversion :

1ère convergence Val­­­­>Ile position 1 chez (Sai) et (La)

2e convergence His­­­­>Gln position 3 chez (Sai) et (La)

Le principe de parcimonie situe  la mutation Ile­­­­>Val en position 5 sur  la branche 

commune à  (Sai)  et (Mar),  plutôt  que sur chacune des deux branches ;   il  est plus 

vraisemblable également que cette mutation s'est produite une fois au lieu de deux. 

Quoi qu'il en soit, cette mutation placée sur une branche commune, et non pas sur les 

deux branches séparées,  est une réversion. Le nombre d'événements est égal à  8 

mutations + 2 convergences + une réversion, soit 11 événements.

Finalement, le cladogramme retenu est le 2.23­B, car 8 événements en font le plus 

économique, et l’on admet qu’il retrace la phylogénie la plus exacte.

123

Discussion sur l'existence de la parcimonie dans l'évolution

Le principe de parcimonie est abondamment utilisé  sans que  l’on sache pour 

autant   si   l'évolution   est   réellement   parcimonieuse.   Si   les   événements   évolutifs 

(mutations) sont rares, la parcimonie de l'évolution est admise. En revanche, elle est 

rejetée si l'on pense que les homoplasies sont aussi fréquentes que les homologies et 

qu'elles ne renvoient à aucun modèle évolutif.

Si   l’emploi   du   terme   « parcimonie »   est   récent   (1965),   le   principe   en   est   ancien. 

Guillaume d’OCKHAM  (1288­1349)   l’a   introduit   définitivement   dans   la   démarche 

scientifique   :   la   meilleure   explication   d’un   fait   est   celle   qui   utilise   le   minimum 

d’hypothèses. La science actuelle continue à rejeter les hypothèses  ad hoc, c’est­à­

dire celles qui ne sont pas nécessaires à la compréhension d’un fait particulier. Il est 

donc admis qu’un caractère dérivé  partagé  par deux taxons est hérité  d’un ancêtre 

commun ; et l’hypothèse soutenant l’apparition indépendante de ce même caractère 

chez   les   deux   taxons   est   rejetée   parce   qu’elle   est   moins   parcimonieuse   que   la 

première.

Les   méthodes   phénétiques   utilisent   des   critères   de   ressemblance   issus   de 

caractères plésiomorphes (ancestraux).  Elles traitent aussi bien les homologies que 

les   homoplasies,   convergences   et   réversions.   Pourtant   cet   amalgame   fausse   la 

reconstruction phylogénétique, car il réunit des espèces non étroitement apparentées, 

qui ont adopté une même solution adaptative. La méthode cladistique s’attache, autant 

que possible, à limiter la prise en compte des homoplasies. C’est pourquoi le choix des 

caractères de référence est très strict et l’arbre le plus parcimonieux est retenu. La 

parcimonie   permet   de   dégager   un   arbre   qui   se   rapproche   le   plus   possible   de   la 

phylogénie réelle, car il est bâti à partir d’un maximum d’homologies et d’un minimum 

d’homoplasies.

Deux  autres  méthodes  existent  également,  mais   elles   sont   beaucoup   moins 

employées. La méthode de compatibilité, l'arbre choisi est celui qui ne nécessite pas 

l'hypothèse de l'homoplasie. La méthode probabiliste, l'évolution obéit à certaines lois 

probabilistes définies a priori, l'arbre choisi est le plus probable.

Dans   la   reconstitution   des   filiations,   l’anatomie   comparée   occupe   une   place 

importante, car quelques indices suffisent pour reconstituer tout un ensemble, qu’il est 

alors possible d’intégrer dans une histoire évolutive.

124

Bibliographie de la section 2.2

Livres

DARLU   P. et  TASSY   P. , Reconstruction phylogénétique, concept et méthodes,  Paris, Masson, 1993.

LECOINTRE   G. et LE GUYADER   H. ,  Classification phylogénétique du vivant, Paris, Belin, 2001.

LI  W. et GRAUR  D. , Molecular evolution, Sunderland (Massachussetts, USA), Sinauer Associates Inc., 1991.

NINIO J. , Approches moléculaires de l'évolution, Paris, Masson, 1979. 

TASSY  P., L’Arbre à remonter le temps, Christian Bourgois, 1991.Le Message des fossiles, Paris, Hachette, 1992.

TASSY  P. (coordonné par), L’Ordre et la diversité du vivant, Paris, Fayard, 1986.

Articles

BOULIGAND   Y.  ,  « Morphologie »,  Dictionnaire du darwinisme et de  l'évolution,  Paris, PUF, 1996.

DEVILLERS   Ch. , « Homologie/analogie »,  Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.

GASC   J.­P. , « Tendances évolutives et progrès »,  Dictionnaire du darwinisme et de  l'évolution, Paris, PUF, 1996.

GÉNERMONT  J. , « Dendrogramme », « Horloge moléculaire de l'évolution », Dictionnaire  du darwinisme et de l'évolution, Paris, PUF, 1996.

GILLOIS   M. : « Homologie »,  Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.

GOUJET    D.   ,   « Arbre   phylogénétique »,   « Cladisme »,   «   Grade »,   « Hennig », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.

GUY   Y.   ,  « Phylogénétique   (arbre)»,  Dictionnaire  du  darwinisme  et  de   l'évolution, Paris, PUF, 1996.

JANVIER    Ph.,  TASSY    P.   et  THOMAS    H.   ,   « Le   cladisme »,  La   Recherche,   n°   117, décembre 1980.

125

LECOINTRE G. , « La construction des phylogénies », APBG (revue de l'Association des Professeurs de Biologie et de Géologie), n° 1, 1995.

TASSY  P., « La critique cladistique du néo­darwinisme et comment s’en servir », Pour  Darwin (dir. P. TORT), Paris, PUF, 1997.

TORT  P. , « Adanson », « Monophylie/ polyphylie », Dictionnaire du darwinisme et de l'évolution, Paris, PUF, 1996.

126