micha el genin - accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... ·...

.

......Tests statistiques

Michael Genin

Universite de Lille 2EA 2694 - Sante Publique : Epidemiologie et Qualite des soins

[email protected]

Plan

...1 Principe des tests statistiquesExemple introductifDefinitions

...2 Grands echantillons n ⩾ 30Comparaison d’une moyenne observee a une moyenne theoriqueComparaison de deux moyennes / Echantillons independantsComparaison de deux moyennes / Echantillons appariesComparaison d’une proportion observee a une proportion theoriqueComparaison de deux proportions / Echantillons independants

...3 Petits echantillons n < 30Comparaison d’une moyenne observee a une moyenne theoriqueComparaison de deux moyennes / Echantillons independantsComparaison de deux moyennes / Echantillons apparies

...4 Conclusions

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 1 / 103

Principe des tests statistiques Exemple introductif

Exemple introductif

Exemple 1 : efficacite d’un nouveau medicament

On souhaite tester l’efficacite d’un nouveau medicament par rapport aumedicament couramment utilise.

On dispose d’un echantillon de 100 patients divise en 2 groupes :

Groupe A (50 individus) : nouveau medicament

Groupe B (50 individus) : medicament classique

En observant la guerison a 1 mois :

Groupe A : 75% de guerison

Groupe B : 65% de guerison



Exemple introductif

Exemple 1 : efficacite d’un nouveau medicament

Le nouveau medicament est-il plus efficace que le medicament classique ?

D’un point de vue descriptif → OUI

Si on tire un autre echantillon de patients, retrouve-t-on la meme differenced’efficacite ? (fluctuations d’echantillonnage)

Peut-on extrapoler cette difference d’efficacite a la population ?

Les tests statistiques permettent de fixer une regle de decision objective.



Exemple introductif

Exemple 2 : identification d’un facteur de risque

On s’interesse au lien entre le tabagisme et et le cancer du poumon sur unechantillon de 200 individus.

On procede a une etude cas/temoins :

Malade Non maladeFumeur 70 20

Non fumeur 30 80

Chez les malades, on observe 70% de fumeurs

Chez les non-malades, on observe 20% de fumeurs



Exemple introductif

Exemple 2 : identification d’un facteur de risque

Comment interpreter la proportion plus elevee de fumeurs dans l’echantillon demalades que dans celui des non-malades ?

Existence d’un reel lien entre le tabagisme et le cancer du poumon ?

Difference de proportion liee a l’echantillon ?

Cette difference est-elle extrapolable a la population ?

Les tests statistiques permettent de fixer une regle de decision objective.


Principe des tests statistiques Definitions

Definitions

Objectif : Valider ou non une hypothese faite sur une ou plusieurs populations

...1 Outil pour effectuer une preuve

Medicament A est meilleur que le le medicament BUn facteur F est lie a la pathologie P

...2 Methode experimentale (non deterministe)

On se base sur un ou plusieurs echantillonsLa prise de decision peut etre influencee par le choix de l’echantillonLa conclusion ne pourra se faire de maniere certaine (notion de risque)

...3 Raisonnement mathematique particulier : raisonnement par l’absurde → Testd’hypothese



Definitions

Notion d’hypothese (H0, H1)

On pose une hypothese, appelee Hypothese nulle, notee H0.Souvent, cette hypothese est le contraire ce que l’on cherche a prouver(raisonnement par l’absurde) :

H0 : Le medicament classique et le nouveau ont la meme efficacite

C’est cette hypothese qu’on va tester a l’aide des observations sur le (ou les)echantillon(s).

Un test statistique peut amener a deux decisions possibles :

Conservation de H0

Rejet de H0



Definitions

Notion d’hypothese (H0, H1)

Si l’hypothese testee est rejetee, alors on ”accepte” le complementaire de cettehypothese, appelee hypothese alternative, notee H1

H1 : Le nouveau medicament et le classique ont des efficacites differentes

Un test statistique presente donc deux hypotheses, H0 et H1 :





Definitions

Notion de risque

Le jugement d’une hypothese se fait sur un ou plusieurs echantillons.

→ La conclusion du test n’est pas certaine mais lui est associe un risque d’erreurfaible..Le risque de premiere espece α........ Risque de rejeter H0 sachant qu’elle est vraie.

Les deux medicaments n’ont pas la meme efficacite

alors qu’en realite leur efficacite est equivalente

La preuve n’est pas certaine, on lui associe un risque fixe a l’avance(ex : α = 5%)



Definitions

Notion de risque

Si on rejette H0, le test est dit significatif au risque α.

.Le risque de seconde espece β........ Risque de conserver H0 sachant que H1 est vraie.

Les deux medicaments ont la meme efficacite

alors qu’en realite leur efficacite est differente

Si on conserve H0, le test est dit non significatif au risque β



Definitions

Risques associes a un test

Realite

Decision H0 H1

H0 conclusion correcte risque de deuxieme espece

H1 risque de premiere espece conclusion correcte



Definitions

Regle de decision

Se base sur une statistique de test ST : variable aleatoire observable telle quesa loi est completement connue sous H0

La realisation de ST est observee sur l’echantillon

Les valeurs peu probables de ST observees mettent en cause la validite de H0

Exemple : efficacite de deux medicaments



On suppose de ST ∼ N (0, 1) sous H0.On observe sT (realisation de ST ) sur un echantillon de taille 200 et sT = 3.sT = 3 est une valeur tres peu probable pour une loi N (0, 1).

P(ST > 3) < 0.025



Exemple : efficacite de deux medicaments

0

Sous H0

ST ! N (0, 1)

Valeur de ST observee

3

Si H0 etait vraie, on aurait du obtenir une valeur de ST plus probable et non unevaleur extreme.2 explications possibles :

H0 n’est pas vraie ( les deux medicaments ont des efficacites differentes)Probleme d’echantillonnage

Quelles valeurs de ST conduisent au rejet de H0 ???Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 16 / 103


Definitions

Region critique

On appelle region critique W l’ensemble des valeurs de ST qui conduisent au rejetde H0 au profit de H1.

P(ST ∈ W /H0) = α

P(ST /∈ W /H0) = 1− α

EtP(ST /∈ W /H1) = β

P(ST ∈ W /H1) = 1− β

1− β est appelee la puissance du test



Definitions

Exemple avec ST ∼ N (0, 1) sous H0 et α = 0.05

z0.975!z0.975 0

N (0, 1)

2.5%2.5% 95%

W =]−∞;−z0.975] ∪ [z0.975; +∞[

Le test est dit bilateral

H1 : Les deux medicaments ont une efficacite differente



Definitions

Exemple avec ST ∼ N (0, 1) sous H0 et α = 0.05

Test unilateral a gauche

!z0.95 0

N (0, 1)

5% 95%

W =]−∞;−Z0.95]

H1 : Le nouveau medicament est moins efficace que le classique

Test unilateral a droite

z0.950

N (0, 1)

5%95%

W = [z0.95; +∞[

H1 : Le nouveau medicament est plus efficace que le classique



Definitions

Risques associes a un test

Realite

Decision H0 H1

H0 Niveau de confiance 1− α β

H1 α Puissance 1− β



Definitions

Remarques

Le choix de α conditionne la capacite du test a rejeter H0

Si α est trop petit → on ne rejette que tres rarement H0 (test conservatif)Si α est trop grand → on va rejeter tres souvent H0, mais le risque de setromper est grand...

Le risque β se calcule si la loi de ST sous H1 est connue

α et β varient en sens inverse

Si on diminue α alors β augmente

Il est d’usage de fixer α = 1%, 5%, 10%



Definitions

Distribution sous H0 Distribution sous H1

Zone de conservation de H0 Zone de rejet de H0

Risque αSeuil



Definitions


Zone de rejet de H0 Zone de conservation de H0

Risque β

Seuil



Definitions


Zone de rejet de H0 Zone de conservation de H0

Puissance 1− β

Seuil



Definitions

P-value

En pratique, au lieu de calculer la region critique W , on prefere donner un seuilcritique appele p-value.

La p-value correspond a la plus petite valeur de α conduisant a rejeter H0.

C’est le degre de signification du test. Plus elle faible par rapport a α, plus le testa un degre de signification important.

En pratique :

P-value < α alors on rejette H0

P-value ⩾ α alors on ne rejette pas H0



Principe des tests statistiques

Demarche d’un test statistique

...1 Choix de H0 et de H1

...2 Choix d’un risque α

...3 Choix d’une statistique de test ST et de sa loi sous H0

...4 Determination de la region critique W

...5 Conclusion : observation de la realisation de ST sur l’echantillon :

Si sT ∈ W alors Rejet de H0

Si sT /∈ W alors Non rejet de H0

Types de tests

Tests parametriques : comparaison de parametres (moyennes, variances...)

Tests semi et non-parametriques : comparaison de distributions


Grands echantillons n ⩾ 30 Comparaison d’une moyenne observee a une moyenne theorique

Test Z ou de l’ecart reduit

Exemple : QI et prisonniers...

Objectif : on cherche a determiner si le QI des prisonniers est le meme (enmoyenne) que le QI de la population generale dont on connait la moyenne :µ0 = 100, l’ecart-type etant σ.

Considerons que dans la population de prisonniers le QI est une va X de moyenneµ et d’ecart-type est σ′.

Nous ne pouvons faire des tests de QI sur tous les prisonniers, donc on procede aun echantillonnage.

Soit un echantillon de n = 100 prisonniers sur lequel on calcul la moyenneempirique x = 85 et l’ecart-type empirique sn−1 = 10.




1. Choix des hypotheses

Soit X la va qui associe a un prisonnier son QI

H0 : le QI moyen des prisonniers est identique a celui de la populationgenerale

H1 : le QI moyen des prisonniers est different de celui de la populationgenerale

H0 : µ = µ0

H1 : µ = µ0

2. Choix d’un risque α

α = 5%




3. Choix de la statistique de test et de sa loi sous H0

Sous H0,.

......Z =

X − µ0

Sn−1/√n∼ N (0, 1)

Pourquoi ?Sous H0, on considere que les QI moyens sont egaux. Aussi, l’echantillon deprisonniers est tout simplement un echantillon de 100 individus de la populationgenerale de moyenne µ0 et d’ecart-type σ (pas de difference).

Or, on sait d’apres le T.C.L., que si n ⩾ 30 alors

X ∼ N (µ0, σ/√n)




4. Determination de la region critique W

z0.975!z0.975 0

N (0, 1)

2.5%2.5% 95%

W =]−∞;−z0.975] ∪ [z0.975; +∞[

W =]−∞;−1.96] ∪ [1.96;+∞[




5. Calcul de Z sur l’echantillon et conclusions

z =x − µ0

sn−1/√n

z =85− 100

10/10= −15

z ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.La moyenne observee sur l’echantillon est significativement differente de lamoyenne theorique.




Remarques

Test bilateral → H1 : µ = µ0

Calcul de la p-value :

P(Z > |z |) = 2P(Z > z) = 2× P(Z > 15) ≈ 0

Comme P(Z > |z |) ≪ 0.05, on rejette H0

Si la methodologie d’echantillonnage est bonne (la difference n’est pas due aun echantillon peu representatif)

Inference a la population des prisonniers : Le QI des prisonniers est enmoyenne inferieur a celui de la population generale


Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants

Test de Z ou de l’ecart reduit

Exemple : patients diabetiques et taux de mauvais cholesterol (LDL)

Objectif : on desire savoir si le LDL est different entre les patients diabetiques etles personnes saines.

En population generale, on considere que le LDL moyen chez les diabetiques apour valeur µ1 et un ecart-type σ1.

En population generale, on considere que le LDL moyen chez les personnes sainesa pour valeur µ2 et un ecart-type σ2.

On dispose de 2 groupes de sujets :

Malades (n1 = 100) : x1 = 1.8, s1 = 0.5

Temoins (n2 = 50) : x2 = 1.3, s2 = 0.2





H0 : Le LDL est identique entre les temoins et les malades

H1 : Le LDL est different entre les temoins et les malades

H0 : µ1 = µ2

H1 : µ1 = µ2


α = 5%





Sous H0,.

......

Z =X1 − X2√S21

n1+

S22

n2

∼ N (0, 1)

Pourquoi ? Comme n1 et n2 sont > 30, on applique le T.C.L. :

X1 ∼ N (µ1, σ1/√n1)

X2 ∼ N (µ2, σ2/√n2)





Donc

X1 − X2 ∼ N

µ1 − µ2,

√σ21

n1+

σ22

n2

Et

X1 − X2 − (µ1 − µ2)√σ21

n1+

σ22

n2

∼ N (0, 1)

Car les echantillons sont independants





Or sous H0, µ1 = µ2

Donc

X1 − X2√σ21

n1+

σ22

n2

∼ N (0, 1)

Comme σ1 et σ2 sont inconnus, on utilise S1 et S2 (estimateurs non baisees del’ecart-type)

Sous H0, la statistique de test sera ”en moyenne” nulle.





z0.975!z0.975 0

N (0, 1)

2.5%2.5% 95%

W =]−∞;−z0.975] ∪ [z0.975; +∞[

W =]−∞;−1.96] ∪ [1.96;+∞[





z =x1 − x2√s21n1

+s22n2

∼ N (0, 1)

z =1.8− 1.3√0.52

100+

0.22

50

= 9.3

z ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.La moyenne observee sur l’echantillon de malades est significativement differentede la moyenne chez les temoins.




Remarques

Test bilateral → H1 : µ1 = µ2


P(Z > |z |) = 2P(Z > z) = 2× P(Z > 9.3) ≈ 0


Si la methodologie d’echantillonnage est bonne (la difference n’est pas due ades echantillons peu representatifs)

Inference a la population de malades : Le LDL est en moyenne superieur acelui de la population generale.


Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies

Definition de l’appariement

Un echantillon A et un echantillon B sont des echantillons apparies si chaqueobservation de A est liee a une observation homologue de B.

Chaque couple de valeurs forme alors une paire.

Exemples :

On mesure la taille pour differents couples de frere et soeur, et l’on souhaitecomparer la taille entre les hommes et les femmes

Mesure d’un parametre biologique chez des patients, avant et apres uneintervention (donnees repetees)



Test Z pour echantillons apparies

Principe du test

On se base sur la difference des valeurs associees a chaque observation.L’hypothese nulle testee stipule qu’en moyenne ces differences sont nulles.

On se libere de la variabilite intra-echantillon (entre les observations d’un memeechantillon) afin de prendre en compte uniquement la variabilite inter-echantillons(variabilite des differences entre paires).

Dans le cadre des donnees appariees, un test Z apparie est plus puissant qu’untest Z de comparaison de moyennes.




Exemple : evaluation d’un traitement contre le cholesterol

Objectif : Un traitement a pour but de reduire le taux de LDL. On veut montrerque ce traitement est efficace.

Dans la population de malades, on pose :

X1 la mesure du LDL avant TTT

X2 la mesure du LDL apres TTT

On dispose d’un echantillon de n = 100 patients pour lesquels on a mesure

le LDL avant TTT (x1 = 1.8)

le LDL apres TTT (x2 = 1.6)




Exemple : evaluation d’un traitement contre le cholesterol

Dans la population de malades, si le traitement n’a aucun effet, on considere que :

D = X1 − X2 une va d’esperance µD = 0 et de variance σ2D

Dans la population de malades, si le traitement a un effet, on considere que :

D = X1 − X2 une va d’esperance µD = ∆ et de variance σ2D

Ce sont ces considerations qui vont permettre de definir les hypotheses ainsi quela statistique de test.





H0 : Le TTT n’a pas d’effet

H1 : Le TTT a un effet

H0 : µD = 0

H1 : µD = ∆, ∆ = 0


α = 5%




3. Choix de la statistique de test

Z =D −∆

SD/√n∼ N (0, 1)

Or sous H0, ∆ = 0, donc :.

......

Z =D

SD/√n∼ N (0, 1)

Avec :D = X1 − X2

et

SD =

√∑ni=1 Di −

∑ni=1(Di )2

n

n − 1





z0.975!z0.975 0

N (0, 1)

2.5%2.5% 95%

W =]−∞;−z0.975] ∪ [z0.975; +∞[

W =]−∞;−1.96] ∪ [1.96;+∞[





Posons sur l’echantillon, sD = 0.2

z =d

sD/√n

z =1.8− 1.6

0.2/√100

= 10

z ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.Le TTT est efficace.




Remarques

Test bilateral → H1 : µD = ∆ = 0


P(Z > |z |) = 2P(Z > z) = 2× P(Z > 10) ≈ 0



Inference a la population de malades : Le LDL est en moyenne inferieur apresTTT. Le TTT est efficace.

Relation de causalite


Grands echantillons n ⩾ 30 Comparaison d’une proportion observee a une proportion theorique

Test sur une proportion

Exemple : Sondage electoral

Objectif On desire comparer les intentions de votes entre le departement du Nordet Pas-De-Calais pour un candidat a l’election presidentielle.

On sait que dans le Nord, le candidat a π0 = 54% d’intention de vote.

On ne peut recenser l’ensemble des habitants du Pas-De-Calais pour determiner laproportion π d’intention de vote. On procede donc a un echantillonnage.

On dispose d’un echantillon de n = 200 individus dans lequel la proportiond’intention de vote pour le candidat est de π = 42%





H0 : La proportion d’intention de vote est identique entre le Nord et lePas-De-Calais (H0 : π = π0)

H1 : La proportion d’intention de vote est differente entre le Nord et lePas-De-Calais (H1 : π = π0)


α = 5%


Sous H0

.

......

Z =π − π0√π0(1−π0)

n

∼ N (0, 1)





z0.975!z0.975 0

N (0, 1)

2.5%2.5% 95%

W =]−∞;−z0.975] ∪ [z0.975; +∞[

W =]−∞;−1.96] ∪ [1.96;+∞[





z =π − π0√π0(1−π0)

n

z =0.42− 0.54√

0.54(1−0.54)100

= −2.41

z ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.Les intentions de vote dans le Nord et le Pas-De-Calais sont significativementdifferentes .




Remarques

Test bilateral → H1 : π = π0


P(Z > |z |) = 2P(Z > z) = 2× P(Z > 2.41) = 0.0159

Comme P(Z > |z |) < 0.05, on rejette H0


Inference a la population du Pas-De-Calais : La proportion d’intention devote pour le candidat est significativement plus faible que dans le Nord.


Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants

Comparaison de deux proportions / echantillonsindependants

Exemple : comparaison de l’efficacite de deux medicaments

Objectif : On veut montrer qu’il y a une difference d’efficacite entre unmedicament classique et un nouveau medicament.

Dans la population de malades prenant le medicament classique, on considerequ’il y a une proportion π1 de guerison a 1 mois.

Dans la population de malades prenant le nouveau medicament, on considere qu’ily a une proportion π2 de guerison a 1 mois.

On dispose de deux echantillons :

Medic. classique (n1 = 50) observant π1 = 65% de guerison a 1 mois.

Nouveau medic. (n2 = 50) observant π2 = 75% de guerison a 1 mois.





H0 : Les deux medicaments ont la meme efficacite

H1 : Les deux medicaments ont une efficacite differente

H0 : π1 = π2

H1 : π1 = π2


α = 5%





Z =π1 − π2 − (π1 − π2)√

π1(1−π1)n1

+ π2(1−π2)n2

∼ N (0, 1)

Sous H0, π1 = π2, donc :.

......

Z =π1 − π2√

π1(1−π1)n1

+ π2(1−π2)n2

∼ N (0, 1)





z0.975!z0.975 0

N (0, 1)

2.5%2.5% 95%

W =]−∞;−z0.975] ∪ [z0.975; +∞[

W =]−∞;−1.96] ∪ [1.96;+∞[





z =π1 − π2√

π1(1−π1)n1

+ π2(1−π2)n2

z =0.65− 0.75√

0.65(1−0.65)50 + 0.75(1−0.75)

50

= −1.10

z /∈ W donc on ne rejette pas H0 au risque de seconde espece β non quantifiable.A la vue des donnees, il n’y a pas de difference d’efficacite significative entre lenouveau medicament et le classique.




Remarques - 1

Test bilateral → H1 : π1 = π2


P(Z > |z |) = 2P(Z > z) = 2× P(Z > 1.10) = 0.2713

Comme P(Z > |z |) > 0.05, on ne rejette pas H0

Causes probables du non-rejet de H0 :

Les deux medicaments ont effectivement des efficacites identiques (H0 vraie)

On ne dispose de pas assez d’individus pour montrer une differencesignificative (puissance statistique)




Remarques - 2

Si l’on considere deux echantillons (n1 = 200) et (n2 = 200) dans lesquels lesproportions de guerison a 1 mois sont identique (π1 = 0.65 et π2 = 0.75), alors :

z =0.65− 0.75√

0.65(1−0.65)200 + 0.75(1−0.75)

200

= −2.19

P − value = 0.0285 < α

Le test est significatif : il y a une difference d’efficacite entre le nouveaumedicament et le classique. Le premier semble est plus efficace que le deuxieme.




Remarques - 3

La puissance d’un test est en partie fonction du nombre d’observationsdisponibles

Theoriquement, plus on augmente le nombre d’observations, plus le test seracapable de detecter une difference infime comme significative

En pratique : on se fixe une difference clinique minimale (ex : 10%)...

Estimation du nombre de sujets necessaires...


Petits echantillons n < 30 Comparaison d’une moyenne observee a une moyenne theorique

Test T de Student

Remarques preliminaires :

Le principe est tres proche du test Z

On doit supposer que X ∼ N (µ, σ) dans la population

Retour a l’exemple sur le QI des prisonniers

Objectif : on cherche a determiner si le QI des prisonnier est le meme (enmoyenne) que le QI de la population generale distribue selon une loi normale demoyenne : µ0 = 100, et d’ecart-type σ.

Considerons la population de prisonniers dans laquelle le QI est distribue selon uneloi normale de moyenne µ et d’ecart-type σ′.

Soit un echantillon de n = 10 prisonniers sur lequel on calcul la moyenneempirique x = 85 et l’ecart-type empirique sn−1 = 10.



Test T de Student


H0 : le QI moyen des prisonniers est identique a celui de la populationgenerale (H0 : µ = µ0)

H1 : le QI moyen des prisonniers est different de celui de la populationgenerale (H1 : µ = µ0)


α = 5%


Sous H0,.

......T =

X − µ0

Sn−1/√n∼ Tn−1 d.d.l



Test T de Student


t0.975, 9!t0.975, 9 0

T(9 ddl)

2.5% 2.5%95%

W =]−∞;−t0.975,, 9ddl ] ∪ [t0.975,, 9ddl ; +∞[

W =]−∞;−2.26] ∪ [2.26;+∞[



Test T de Student

5. Calcul de T sur l’echantillon et conclusions

t =x − µ0

sn−1/√n

t =85− 100

10/√10

= −4.74

t ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.La moyenne observee sur l’echantillon est significativement differente de lamoyenne theorique.



Test T de Student

Remarques

Test bilateral → H1 : µ = µ0


P(T9ddl > |t|) = 2P(T9ddl > t) = 2× P(T9ddl > 4.74) = 0.001

Comme P(T > |t|) < 0.05, on rejette H0


Inference a la population des prisonniers : Le QI des prisonniers est enmoyenne inferieur a celui de la population generale


Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants

Conditions necessaires au Test T de Student

Remarques preliminaires :

On doit supposer que dans la population :

X1 ∼ N (µ1, σ1)

X2 ∼ N (µ2, σ2)

On distingue deux cas de figure :

...1 σ21 = σ2

2

...2 σ21 = σ2

2

Pour differencier ces deux cas, on procede a un test de comparaison de deuxvariances



Test F - Comparaison de deux variances

Considerons :X1 ∼ N (µ1, σ1) et X2 ∼ N (µ2, σ2)

Les hypotheses du test

H0 : σ21 = σ2

2

H1 : σ21 > σ2

2

Soient deux echantillons de taille n1 et n2 :

S21 =

1

n1 − 1

n1∑i=1

(X1i − X1)2 et S2

2 =1

n2 − 1

n2∑i=1

(X2i − X2)2

Statistique de test sous H0

.

......F =

S21

S22

∼ F(n1−1,n2−1)ddl

En pratique :

Test unilateral a droiteOn prend la valeur la plus elevee entre s21 et s22 comme numerateur de lastatistique de testLe rapport est ⩾ 1.




Region critique W

Fn1!1,n2!1

5%

f1!!n1!1,n2!1

0 1 2 3 4 5 6

W = [f 1−αn1−1,n2−1; +∞[




Remarques

Les variances σ1 et σ2 sont dites homogenes si le test F est non significatif

→ Notion d’homoscedasticite

Si le test est significatif, les variances sont dites heterogenes

→ Notion d’heteroscedasticite

Le test necessite la normalite de X1 et X2

X1 et X2 doivent etre independantes



Test de T de Student

Exemple : patients diabetiques et taux de mauvais cholesterol (LDL)

Objectif : on desire savoir si le LDL est different entre les patients diabetiques etles personnes saines.

En population generale, on considere que le LDL chez les diabetiques est distribueselon une loi normale de moyenne µ1 et d’ecart-type σ1.

En population generale, on considere que le LDL chez les personnes saines estdistribue selon une loi normale de moyenne µ2 et d’ecart-type σ2.

On dispose de 2 groupes de sujets :

Malades (n1 = 25) : x1 = 1.8, s1 = 0.5

Temoins (n2 = 20) : x2 = 1.3, s2 = 0.2





H0 : Le LDL est identique entre les temoins et les malades

H1 : Le LDL est different entre les temoins et les malades

H0 : µ1 = µ2

H1 : µ1 = µ2


α = 5%




3. Choix de la statistique de test...1 Si σ2

1 = σ22 = σ2, alors sous H0 :

.

......

T =X1 − X2

S√

1n1

+ 1n2

∼ Tn1+n2−2 ddl

Avec S2 l’estimateur de la variance commune σ2..

......S2 =

(n1 − 1)S21 + (n2 − 1)S2

2

n1 + n2 − 2

...2 Si σ21 = σ2

2 , alors sous H0 :

.

......

T =X1 − X2√S21

n1+

S22

n2

∼ Tn1+n2−2 ddl



Test T de Student


t0.975, 43!t0.975, 43 0

T(43 ddl)

2.5% 2.5%95%

W =]−∞;−t0.975,, 43ddl ] ∪ [t0.975,, 43ddl ; +∞[

W =]−∞;−2.017] ∪ [2.017;+∞[



Test T de Student


Il faut tout d’abord tester l’egalite des variances σ21 et σ2

2 :

On pose un risque α = 5%

H0 : σ21 = σ2

2

H1 : σ21 > σ2

2

f =s21s22

=(0.5)2

(0.1)2= 25



Test T de Student

Region critique W

F24,19

5%

f0.9524,19

0 1 2 3

W = [f 0.9524,19; +∞[

W = [2.11;+∞[



Test T de Student

f ∈ W donc on rejette H0 avec un risque α de premiere espece.

Les variances σ21 et σ2

2 sont differentes. (Heteroscedasticite).

Pour le test de Student, on choisit donc comme statistique de test :

T =X1 − X2√S21

n1+

S22

n2

∼ Tn1+n2−2 ddl

t =1.8− 1.3√(0.5)2

25 + (0.2)2

20

= 4.56



Test T de Student

t ∈ W =]−∞;−2.017] ∪ [2.017;+∞[ donc on rejette H0 avec un risque α depremiere espece.

La moyenne observee sur l’echantillon de malades est significativement differentede la moyenne chez les temoins.



Test T de Student

Remarques

Test bilateral → H1 : µ1 = µ2


P(T > |t|) = 2P(T > t) = 2× P(T > 4.56) ≈ 4.10−6

Comme P(T > |t|) ≪ 0.05, on rejette H0

Si la methodologie d’echantillonnage est bonne (la difference n’est pas due ades echantillons peu representatifs)

Inference a la population de malades : Le LDL est en moyenne superieur acelui de la population generale.


Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies

Test T de Student sur echantillons apparies

Exemple : Traitement du diabete 1

Objectif : On desire etudier l’effet d’une nouvelle strategie de traitement dudiabete en mesurant l’effet sur la glycemie. On dose la glycemie (g/L) chez 15sujets avant le debut du nouveau protocole et 3 mois apres.

Dans la population de malades, on pose :

X1 la mesure de glycemie avant TTT

X2 la mesure de glycemie apres TTT (3 mois apres)

D = X1 − X2 une va distribuee selon une loi normale d’esperance µD et devariance σ2

D

1. Statistique - Epidemiologie, T. Ancelle, p. 141Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 91 / 103


Test T de Student sur echantillons apparies

Exemple : Traitement du diabete

Sur l’echantillon

Les mesures sont appariees car elles sont effectuees sur les memes individus.

La moyenne des differences entre les mesures :

d = 0.1

L’ecart-type des differences entre les mesures :

sD = 0.091



Test T de Student pour echantillons apparies


H0 : les glycemies sont identiques avant et apres le nouveau protocole

H1 unilaterale : la glycemie est reduite grace au nouveau protocole

H0 : µD = 0

H1 : µD = ∆, ∆ > 0


α = 5%





T =D −∆

SD/√n∼ Tn−1 ddl

Or sous H0, ∆ = 0, donc :.

......

T =D

SD/√n∼ Tn−1 ddl

AvecD = X1 − X2

et

SD =

√√√√ n

n − 1

[1

n

n∑i=1

D2i −

(D)2]




Region critique W

t0.95, 140

T(14 ddl)

5%95%

W = [t0.95, 14; +∞[

W = [1.761;+∞[





t =d

sD/√n

z =0.1

0.91/√15

= 4.25

t ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.La glycemie est significativement plus basse apres administration de la nouvellestrategie.




Remarques

Test unilateral → H1 : µD > 0


P(T14ddl > t) = P(T14ddl > 4.25) ≈ 4.10−4

Comme P(T > t) ≪ 0.05, on rejette H0


Conclusions

Tests de comparaison

Les tests de comparaison servent a comparer des parametres entre des populationsdifferentes.

2 types :

Comparaison d’un echantillon observe a une population de reference

Comparaison de deux echantillons observes (les deux populations sontinconnues)

Le principe fondamental est le test de la difference des deux parametres.

Sous H0 cette difference est en moyenne nulle

Sous H1 cette difference est en moyenne non-nulle

Sous H0, la loi de probabilite de cette difference est toujours connue !!


Conclusions

Tests de comparaison

Porter une attention double sur :

Le type de parametres en jeu (moyennes, proportions, variances...)

Les conditions d’application du test

Distinguer deux cas de figure :

n ⩾ 30

n < 30

Se poser la question :

Les echantillons sont-ils independants ?


Conclusions

Tests de comparaison - Resume

Test Comparaison Conditions d’applications

Test Z moyenne observee/theorique n ⩾ 30

2 moyennes n1 et n2 ⩾ 30

2 moyennes appariees n ⩾ 30

Test T moyenne observee/theorique X1 ∼ N (µ, σ)

2 moyennes X1 ∼ N (µ1, σ1) et X2 ∼ N (µ2, σ2)

2 moyennes appariees (X1 − X2) = D ∼ N (µD , σD)

Test sur % prop. observee/prop. theorique n ⩾ 30 et min{np, n(1 − p)} > 5

2 proportions n1, n2 ⩾ 30min{nip,ni (1 − pi )} > 5, i = 1, 2


Conclusions

Tests de comparaison - Resume

Il reste des cas de figure sans reponse !!

n ⩾ 30 et comparaison de deux proportions sur echantillons apparies

Ex : % avant et apres un TTT chez les meme individus→ χ2 de McNemar

n < 30 Comparaison de moyennes (ind. ou apparies) et conditions denormalite non respectees

→ Test non parametrique : Test de Wilcoxon pour echantillons inde.→ Test non parametrique : Test de Wilcoxon pour echantillons apparies

Comparaison de plus de 2 moyennes

n ⩾ 30 → ANOVAn < 30 → si normalite alors ANOVAn < 30 → si non normalite alors Test de Kruskal - Wallis


Conclusions

Allons plus loin...

Cours essentiellement base sur les tests de comparaison.

On peut tester la liaison entre deux variables :

2 variables qualitatives

Ex : Existe-t-il un lien significatif entre le fait d’etre malade (non malade) et lesexe ?→ Test du χ2 d’independance

2 variables quantitatives

Ex : Existe-t-il un lien significatif entre le taux de prothrombine et l’age ?→ Test sur le coefficient de correlation / Regression lineaire


micha el genin - accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... ·...

Documents