acp par anne b. dufour.pdf

29
Introduction Repr´ esentation des individus Repr´ esentation des variables Conclusion Analyse en Composantes Principales Anne B Dufour Septembre 2008 Anne B Dufour Analyse en Composantes Principales

Upload: erhan01

Post on 26-Dec-2015

14 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Analyse en Composantes Principales

Anne B Dufour

Septembre 2008

Anne B Dufour Analyse en Composantes Principales

Page 2: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Introduction

Soit X un tableau contenant p variables mesurees sur n individus.

I Situation A : n points-lignes dans Rp

I Situation B : p points-colonnes dans Rn

Objectif :

Projection d’un nuage de points sur des axes qui maximisentl’inertie projetee

Anne B Dufour Analyse en Composantes Principales

Page 3: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Enonce (1)

Deux variables x et y sont mesurees sur n individus.

L’etude de la liaison entre x et y est la recherche d’une droiteoptimum. Quel est le critere d’optimisation ?

Anne B Dufour Analyse en Composantes Principales

Page 4: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Enonce (2)

Cette droite minimise

1n

n∑i=1

Mimi2

ou●

−3 −2 −1 0 1 2 3

−1.

5−

0.5

0.5

1.5

O

m

M

I Mi est le point i du plan

I mi est la projection orthogonale de Mi sur la droite.

Elle est dite direction principale du nuage centre.

Anne B Dufour Analyse en Composantes Principales

Page 5: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Nuage centre ?

La droite qui minimise la moyenne des carres des distances despoints a cette droite passe par le point moyen de coordonnees(m(x),m(y))

Anne B Dufour Analyse en Composantes Principales

Page 6: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Demonstration

Soient deux droites D et D ′ paralleles, la premiere passant par lepoint moyen et la deuxieme ne passant pas par ce point moyen.

‖ Mi −m ′i ‖2 = ‖ Mi + mi −mi −m ′i ‖

2

= ‖ Mi −mi ‖2 + ‖ mi −m ′i ‖2 + 2〈Mi −mi |mi −m ′i〉

Les vecteurs mi −m ′i sont tous egaux. On note w = mi −m ′i eton obtient la relation suivante :

1n

n∑i=1

‖ Mi −m ′i ‖2 =

1n

n∑i=1

‖ Mi −mi ‖2 + ‖ w ‖2

>1n

n∑i=1

‖ Mi −mi ‖2

Anne B Dufour Analyse en Composantes Principales

Page 7: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Inertie Totale

Rappel :

1. X est une matrice a n lignes et p colonnes : X = [xij ].2. Chaque point a un poids 1

n (ponderation uniforme).

L’ensemble des n points forme un nuage dont l’inertie autour del’origine vaut :

IT =1n

n∑i=1

‖ Mi ‖2 =1n

n∑i=1

p∑j=1

x 2ij

C’est la variabilite totale de la position des points dans l’espace.

Anne B Dufour Analyse en Composantes Principales

Page 8: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Exemple en dimension 2

La droite passe par le point moyen. Donc on place l’origine aucentre de gravite en utilisant les nouvelles coordonnees centrees :{

Xi = xi −m(x)Yi = yi −m(y)

IT =1n

n∑i=1

(X 2

i + Y 2i

)=

1n

n∑i=1

((xi −m(x))2 + (yi −m(y))2

)=

1n

n∑i=1

(xi −m(x))2 +1n

n∑i=1

(yi −m(y))2

= v(x) + v(y)Anne B Dufour Analyse en Composantes Principales

Page 9: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Decomposition de l’inertie totale

Quand on prend dans Rp un vecteur unitaire u, il definit un axe. Lepoint Mi se projette sur cet axe en mi . On a :

Mi = mi + (Mi −mi) et ‖ Mi ‖2 = ‖ mi ‖2 + ‖ Mi −mi ‖2

IT = IS (u) + IM (u) =1n

n∑i=1

‖ mi ‖2 +1n

n∑i=1

‖ Mi −mi ‖2

IT = IS (u)︸ ︷︷ ︸a maximiser

+ IM (u)︸ ︷︷ ︸a minimiser

Anne B Dufour Analyse en Composantes Principales

Page 10: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Recherche du vecteur directeur u (1)

La matrice X contient les n points centres.

X =

x1 −m(x) y1 −m(y)...

...xn −m(x) yn −m(y)

Le vecteur u recherche est unitaire. On l’ecrit sous la forme

u =[

ab

]avec a2 + b2 = 1.

Anne B Dufour Analyse en Composantes Principales

Page 11: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Recherche du vecteur directeur u (2)

L’inertie statistique ou inertie projetee est :

IS (u) =1n

n∑i=1

‖ mi ‖2 =1n

(Xu)T Xu = uT

(1nXTX

)u

= [a b][

v(x) c(x, y)c(x, y) v(y)

] [ab

]= v(x)a2 + 2c(x, y)ab + v(y)b2

Anne B Dufour Analyse en Composantes Principales

Page 12: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Recherche du vecteur directeur u (3)

La matrice

[v(x) c(x, y)

c(x, y) v(y)

]est dite matrice de

variance-covariance des deux variables. On la note

C =1nXTX

Elle est symetrique. Son polynome catacteristique s’ecrit :

|C− λI2| =∣∣∣∣ v(x)− λ c(x, y)

c(x, y) v(y)− λ

∣∣∣∣ = λ2−λ (v(x) + v(y))−c2(x, y)

Anne B Dufour Analyse en Composantes Principales

Page 13: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Recherche du vecteur directeur u (4)

I Le polynome caracteristique a toujours deux racines donc C atoujours deux valeurs propres et deux vecteurs propres.

I Les valeurs propres sont en general distinctes. On les note λ1

et λ2.I λ1 + λ2 = v(x) + v(y)I λ1 × λ2 = −v(x)× v(y) + c2(x, y)

Toute matrice symetrique admet une base de vecteurs propresorthogonaux. Donc,

C = UΛUT

avec U =[

u11 u21

u12 u22

]et Λ =

[λ1 00 λ2

]

Anne B Dufour Analyse en Composantes Principales

Page 14: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Recherche du vecteur directeur u (5)

IS (u) = uTCu

= [a b][

u11 u21

u12 u22

] [λ1 00 λ2

] [u11 u12

u21 u22

] [ab

]= [α β]

[λ1 00 λ2

] [αβ

]= λ1α

2 + λ2β2 ≤ λ1α

2 + λ1β2 = λ1[

αβ

]represente les coordonnees du vecteur u dans la base des

vecteurs propres.

Anne B Dufour Analyse en Composantes Principales

Page 15: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Recherche du vecteur directeur u (6)

L’inertie ne peut depasser la premiere valeur propre et l’atteint

pour

[αβ

]=[

10

], donc le premier vecteur propre.

Conclusion dans le cas de 2 variables :

L’axe principal d’un nuage bivarie est le premier vecteurpropre de la matrice de variance-covariance des deux

variables.

Anne B Dufour Analyse en Composantes Principales

Page 16: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Recherche du vecteur directeur u (7)

Generalisation a p variables

C = UΛUT admet une base de p vecteurs propres orthonormes.

I Le premier vecteur propre norme u1 est un vecteur de Rp quimaximise l’inertie projetee.

I Le deuxieme vecteur propre norme u2 est un vecteur de Rp ,orthogonal a u1 qui maximise a nouveau l’inertie projetee.

I et ainsi de suite pour u3 . . .up axes suivants.

Anne B Dufour Analyse en Composantes Principales

Page 17: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Coordonnees des projections

Si uk est le vecteur propre de rang k , les coordonnees desprojections des n points sont obtenus simplement par :

lk =

l1k...

lnk

=

〈M1|uk 〉...

〈Mn |uk 〉

=

∑p

j=1(x1j − xj )ujk...∑p

j=1(xnj − xj )ujk

soit en ecriture matricielle : lk = Xuk .

Anne B Dufour Analyse en Composantes Principales

Page 18: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Axes principaux et coordonnees

I uk est appele axe principal de rang k .I lk est appele vecteur des coordonnees sur l’axe principal.

C’est une variable artificielle de moyenne nulle et de varianceλk .

m(lk ) =1n

n∑i=1

lik =1n

n∑i=1

p∑j=1

(xij − xj )ujk

=p∑

j=1

ujk1n

n∑i=1

(xij − xj ) = 0

v(lk ) =1n

n∑i=1

l2ik =1n

(Xuk )T Xuk = uTk Cuk

= λkuTk uk = λk

Anne B Dufour Analyse en Composantes Principales

Page 19: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

Le graphe des valeurs propres

I La coordonnees sur l’axe de rang k est donc centree devariance λk .

I La somme des valeurs propres est l’inertie totale.

p∑j=1

λj =p∑

j=1

v(xj )

ou xj est la variable j du tableau X.

Le graphe des valeurs propres exprime la maniere dont la variabilitedes donnees se repartit dans l’espace.C’est une representation en batons avec k sur l’axe horizontal etλk sur l’axe vertical . En anglais, on parle de screeplot.

Anne B Dufour Analyse en Composantes Principales

Page 20: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Exemple en deux dimensionsInertie d’un nuage de pointsRepresentations graphiques

La carte factorielle

La representation du nuage projete sur un couple d’axes principauxest appelee carte factorielle. C’est une maniere de voirl’information multidimensionnelle.La carte factorielle des axes 1 et 2 est dite premier plan factoriel etrepresente la part maximale de la variabilite. Chaque point i estpositionne par ses deux coordonnees (li1, li2).

Anne B Dufour Analyse en Composantes Principales

Page 21: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Retour a l’enonceRecherche du vecteur y norme

Enonce (1)

On vient d’etudier la projection d’un nuage de n points sur desaxes qui maximisent l’inertie projetee (situation A).

On s’interesse maintenant a l’ensemble de p points dans Rn

(situation B).

Anne B Dufour Analyse en Composantes Principales

Page 22: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Retour a l’enonceRecherche du vecteur y norme

Enonce (2)

Le point de vue de cette analyse a ete propose par Hotelling(1933) dans le cas ou les donnees sont centrees reduites.Soit y une variable quelconque. On peut calculer sa correlationavec chacune des variables de depart xj (j = 1, p). Le lien entre yet X peut se mesurer par la relation :

L (y,X) =p∑

j=1

r2(y,xj

)Objectif : Trouver une variable y qui optimise cette quantite.Le probleme reste inchange si on suppose y de moyenne nulle et devariance 1.

Anne B Dufour Analyse en Composantes Principales

Page 23: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Retour a l’enonceRecherche du vecteur y norme

Enonce (3)

r2(y,xk

)est :

I le carre de la norme du projete de y sur le vecteur xk• , vecteur

centre reduit,

I le carre de la norme du projete de xk• sur le vecteur y.

Le lien est alors l’inertie projetee du nuage des variables sur y enpensant que le poids de chaque variable est 1 et que le produitscalaire de Rn est D = 1

n In .C’est donc le meme probleme que precedemment.

Anne B Dufour Analyse en Composantes Principales

Page 24: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Retour a l’enonceRecherche du vecteur y norme

Donnees centrees reduites

Reprenant les resultats de la representation des individus lorsque lesvariables du tableau X sont centrees reduites. Il est alors note X•.On cherche les axes principaux, vecteurs propres de la matrice1n XT• X•. On est passe de la matrice de variance-covariance C a la

matrice des correlations R.

R =1nXT• X• = UΛUT et L = X•U

Anne B Dufour Analyse en Composantes Principales

Page 25: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Retour a l’enonceRecherche du vecteur y norme

Recherche du vecteur y (1)

L (y,X) =p∑

k=1

r2(y,xk

)= 1〈y|xk

•〉2

L (y,X) =(

1nXT• y)T ( 1

nXT• y)

=1n2

yTX•XT• y

On cherche y norme pour le produit scalaire D sous la contrainte1n

∑ni=1 y2

i = 1.

Anne B Dufour Analyse en Composantes Principales

Page 26: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Retour a l’enonceRecherche du vecteur y norme

Recherche du vecteur y (2)

On note que 1n

∑ni=1 y2

i peut s’ecrire =∑n

i=1

(1√nyi

)2.

On pose donc z = 1√ny et on cherche z norme pour le produit

scalaire ordinaire maximisant :

1nzTX•XT

• z

On pose S = 1n X•XT

• . C’est une matrice symetrique qui admetune base de vecteurs propres orthogonaux :

S = VΛVT

Anne B Dufour Analyse en Composantes Principales

Page 27: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Retour a l’enonceRecherche du vecteur y norme

Vecteurs propres de S

SL =1nX•XT

• X•U = X•RU = X•UΛ = LΛ

I Les matrices S et R ont les memes valeurs propres non nulles.

I Les vecteurs que l’on cherche sont connus : a une constantede normalisation pres, les coordonnees des individus sur lesaxes principaux.

V = LΛ−1/2

Anne B Dufour Analyse en Composantes Principales

Page 28: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Retour a l’enonceRecherche du vecteur y norme

Solution et representation graphique

L (y,X) ne peut pas depasser λ1 et l’atteint pour la variablenormee 1√

λ1l1.

Ce vecteur est appele premiere composante principale. C’est lavariable qui est la plus correlee avec toutes les variables du tableau.Quand on projette les variables sur les composantes principales, onobtient les coordonnees des variables.

K =1nXT• LΛ−1/2 =

1nXT• X•UΛ−1/2 = RUΛ−1/2 = UΛ1/2

La representation liant variables et composantes principales estappelee cercle des correlations.

Anne B Dufour Analyse en Composantes Principales

Page 29: ACP par Anne B. Dufour.pdf

IntroductionRepresentation des individusRepresentation des variables

Conclusion

Conclusion

L’Analyse en Composantes Principales dite A.C.P. est l’etude dutriplet

(X, Ip , 1

n In).

I Si les donnees sont centrees, on parle d’ ACP centree.

I Si les donnees sont normees, on parle d’ ACP normee.

Pour des complements d’informations, consulter les fiches decours : BS4, BS5.

Anne B Dufour Analyse en Composantes Principales