micha el genin - accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... ·...

90
. . Tests statistiques Micha¨ el Genin Universit´ e de Lille 2 EA 2694 - Sant´ e Publique : Epid´ emiologie et Qualit´ e des soins [email protected]

Upload: truongquynh

Post on 16-Sep-2018

226 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

.

......Tests statistiques

Michael Genin

Universite de Lille 2EA 2694 - Sante Publique : Epidemiologie et Qualite des soins

[email protected]

Page 2: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Plan

...1 Principe des tests statistiquesExemple introductifDefinitions

...2 Grands echantillons n ⩾ 30Comparaison d’une moyenne observee a une moyenne theoriqueComparaison de deux moyennes / Echantillons independantsComparaison de deux moyennes / Echantillons appariesComparaison d’une proportion observee a une proportion theoriqueComparaison de deux proportions / Echantillons independants

...3 Petits echantillons n < 30Comparaison d’une moyenne observee a une moyenne theoriqueComparaison de deux moyennes / Echantillons independantsComparaison de deux moyennes / Echantillons apparies

...4 Conclusions

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 1 / 103

Page 3: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Exemple introductif

Exemple introductif

Exemple 1 : efficacite d’un nouveau medicament

On souhaite tester l’efficacite d’un nouveau medicament par rapport aumedicament couramment utilise.

On dispose d’un echantillon de 100 patients divise en 2 groupes :

Groupe A (50 individus) : nouveau medicament

Groupe B (50 individus) : medicament classique

En observant la guerison a 1 mois :

Groupe A : 75% de guerison

Groupe B : 65% de guerison

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 4 / 103

Page 4: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Exemple introductif

Exemple introductif

Exemple 1 : efficacite d’un nouveau medicament

Le nouveau medicament est-il plus efficace que le medicament classique ?

D’un point de vue descriptif → OUI

Si on tire un autre echantillon de patients, retrouve-t-on la meme differenced’efficacite ? (fluctuations d’echantillonnage)

Peut-on extrapoler cette difference d’efficacite a la population ?

Les tests statistiques permettent de fixer une regle de decision objective.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 5 / 103

Page 5: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Exemple introductif

Exemple introductif

Exemple 2 : identification d’un facteur de risque

On s’interesse au lien entre le tabagisme et et le cancer du poumon sur unechantillon de 200 individus.

On procede a une etude cas/temoins :

Malade Non maladeFumeur 70 20

Non fumeur 30 80

Chez les malades, on observe 70% de fumeurs

Chez les non-malades, on observe 20% de fumeurs

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 6 / 103

Page 6: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Exemple introductif

Exemple introductif

Exemple 2 : identification d’un facteur de risque

Comment interpreter la proportion plus elevee de fumeurs dans l’echantillon demalades que dans celui des non-malades ?

Existence d’un reel lien entre le tabagisme et le cancer du poumon ?

Difference de proportion liee a l’echantillon ?

Cette difference est-elle extrapolable a la population ?

Les tests statistiques permettent de fixer une regle de decision objective.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 7 / 103

Page 7: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Objectif : Valider ou non une hypothese faite sur une ou plusieurs populations

...1 Outil pour effectuer une preuve

Medicament A est meilleur que le le medicament BUn facteur F est lie a la pathologie P

...2 Methode experimentale (non deterministe)

On se base sur un ou plusieurs echantillonsLa prise de decision peut etre influencee par le choix de l’echantillonLa conclusion ne pourra se faire de maniere certaine (notion de risque)

...3 Raisonnement mathematique particulier : raisonnement par l’absurde → Testd’hypothese

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 9 / 103

Page 8: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Notion d’hypothese (H0, H1)

On pose une hypothese, appelee Hypothese nulle, notee H0.Souvent, cette hypothese est le contraire ce que l’on cherche a prouver(raisonnement par l’absurde) :

H0 : Le medicament classique et le nouveau ont la meme efficacite

C’est cette hypothese qu’on va tester a l’aide des observations sur le (ou les)echantillon(s).

Un test statistique peut amener a deux decisions possibles :

Conservation de H0

Rejet de H0

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 10 / 103

Page 9: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Notion d’hypothese (H0, H1)

Si l’hypothese testee est rejetee, alors on ”accepte” le complementaire de cettehypothese, appelee hypothese alternative, notee H1

H1 : Le nouveau medicament et le classique ont des efficacites differentes

Un test statistique presente donc deux hypotheses, H0 et H1 :

H0 : Le medicament classique et le nouveau ont la meme efficacite

H1 : Le nouveau medicament et le classique ont des efficacites differentes

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 11 / 103

Page 10: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Notion de risque

Le jugement d’une hypothese se fait sur un ou plusieurs echantillons.

→ La conclusion du test n’est pas certaine mais lui est associe un risque d’erreurfaible..Le risque de premiere espece α........ Risque de rejeter H0 sachant qu’elle est vraie.

Les deux medicaments n’ont pas la meme efficacite

alors qu’en realite leur efficacite est equivalente

La preuve n’est pas certaine, on lui associe un risque fixe a l’avance(ex : α = 5%)

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 12 / 103

Page 11: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Notion de risque

Si on rejette H0, le test est dit significatif au risque α.

.Le risque de seconde espece β........ Risque de conserver H0 sachant que H1 est vraie.

Les deux medicaments ont la meme efficacite

alors qu’en realite leur efficacite est differente

Si on conserve H0, le test est dit non significatif au risque β

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 13 / 103

Page 12: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Risques associes a un test

Realite

Decision H0 H1

H0 conclusion correcte risque de deuxieme espece

H1 risque de premiere espece conclusion correcte

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 14 / 103

Page 13: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Regle de decision

Se base sur une statistique de test ST : variable aleatoire observable telle quesa loi est completement connue sous H0

La realisation de ST est observee sur l’echantillon

Les valeurs peu probables de ST observees mettent en cause la validite de H0

Exemple : efficacite de deux medicaments

H0 : Le medicament classique et le nouveau ont la meme efficacite

H1 : Le nouveau medicament et le classique ont des efficacites differentes

On suppose de ST ∼ N (0, 1) sous H0.On observe sT (realisation de ST ) sur un echantillon de taille 200 et sT = 3.sT = 3 est une valeur tres peu probable pour une loi N (0, 1).

P(ST > 3) < 0.025

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 15 / 103

Page 14: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Exemple : efficacite de deux medicaments

0

Sous H0

ST ! N (0, 1)

Valeur de ST observee

3

Si H0 etait vraie, on aurait du obtenir une valeur de ST plus probable et non unevaleur extreme.2 explications possibles :

H0 n’est pas vraie ( les deux medicaments ont des efficacites differentes)Probleme d’echantillonnage

Quelles valeurs de ST conduisent au rejet de H0 ???Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 16 / 103

Page 15: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Region critique

On appelle region critique W l’ensemble des valeurs de ST qui conduisent au rejetde H0 au profit de H1.

P(ST ∈ W /H0) = α

P(ST /∈ W /H0) = 1− α

EtP(ST /∈ W /H1) = β

P(ST ∈ W /H1) = 1− β

1− β est appelee la puissance du test

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 17 / 103

Page 16: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Exemple avec ST ∼ N (0, 1) sous H0 et α = 0.05

z0.975!z0.975 0

N (0, 1)

2.5%2.5% 95%

W =]−∞;−z0.975] ∪ [z0.975; +∞[

Le test est dit bilateral

H1 : Les deux medicaments ont une efficacite differente

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 18 / 103

Page 17: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Exemple avec ST ∼ N (0, 1) sous H0 et α = 0.05

Test unilateral a gauche

!z0.95 0

N (0, 1)

5% 95%

W =]−∞;−Z0.95]

H1 : Le nouveau medicament est moins efficace que le classique

Test unilateral a droite

z0.950

N (0, 1)

5%95%

W = [z0.95; +∞[

H1 : Le nouveau medicament est plus efficace que le classique

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 19 / 103

Page 18: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Risques associes a un test

Realite

Decision H0 H1

H0 Niveau de confiance 1− α β

H1 α Puissance 1− β

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 20 / 103

Page 19: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Remarques

Le choix de α conditionne la capacite du test a rejeter H0

Si α est trop petit → on ne rejette que tres rarement H0 (test conservatif)Si α est trop grand → on va rejeter tres souvent H0, mais le risque de setromper est grand...

Le risque β se calcule si la loi de ST sous H1 est connue

α et β varient en sens inverse

Si on diminue α alors β augmente

Il est d’usage de fixer α = 1%, 5%, 10%

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 21 / 103

Page 20: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Distribution sous H0 Distribution sous H1

Zone de conservation de H0 Zone de rejet de H0

Risque αSeuil

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 22 / 103

Page 21: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Distribution sous H0 Distribution sous H1

Zone de rejet de H0 Zone de conservation de H0

Risque β

Seuil

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 23 / 103

Page 22: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

Distribution sous H0 Distribution sous H1

Zone de rejet de H0 Zone de conservation de H0

Puissance 1− β

Seuil

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 24 / 103

Page 23: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Definitions

P-value

En pratique, au lieu de calculer la region critique W , on prefere donner un seuilcritique appele p-value.

La p-value correspond a la plus petite valeur de α conduisant a rejeter H0.

C’est le degre de signification du test. Plus elle faible par rapport a α, plus le testa un degre de signification important.

En pratique :

P-value < α alors on rejette H0

P-value ⩾ α alors on ne rejette pas H0

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 25 / 103

Page 24: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Principe des tests statistiques Definitions

Principe des tests statistiques

Demarche d’un test statistique

...1 Choix de H0 et de H1

...2 Choix d’un risque α

...3 Choix d’une statistique de test ST et de sa loi sous H0

...4 Determination de la region critique W

...5 Conclusion : observation de la realisation de ST sur l’echantillon :

Si sT ∈ W alors Rejet de H0

Si sT /∈ W alors Non rejet de H0

Types de tests

Tests parametriques : comparaison de parametres (moyennes, variances...)

Tests semi et non-parametriques : comparaison de distributions

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 26 / 103

Page 25: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison d’une moyenne observee a une moyenne theorique

Test Z ou de l’ecart reduit

Exemple : QI et prisonniers...

Objectif : on cherche a determiner si le QI des prisonniers est le meme (enmoyenne) que le QI de la population generale dont on connait la moyenne :µ0 = 100, l’ecart-type etant σ.

Considerons que dans la population de prisonniers le QI est une va X de moyenneµ et d’ecart-type est σ′.

Nous ne pouvons faire des tests de QI sur tous les prisonniers, donc on procede aun echantillonnage.

Soit un echantillon de n = 100 prisonniers sur lequel on calcul la moyenneempirique x = 85 et l’ecart-type empirique sn−1 = 10.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 29 / 103

Page 26: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison d’une moyenne observee a une moyenne theorique

Test Z ou de l’ecart reduit

1. Choix des hypotheses

Soit X la va qui associe a un prisonnier son QI

H0 : le QI moyen des prisonniers est identique a celui de la populationgenerale

H1 : le QI moyen des prisonniers est different de celui de la populationgenerale

H0 : µ = µ0

H1 : µ = µ0

2. Choix d’un risque α

α = 5%

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 30 / 103

Page 27: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison d’une moyenne observee a une moyenne theorique

Test Z ou de l’ecart reduit

3. Choix de la statistique de test et de sa loi sous H0

Sous H0,.

......Z =

X − µ0

Sn−1/√n∼ N (0, 1)

Pourquoi ?Sous H0, on considere que les QI moyens sont egaux. Aussi, l’echantillon deprisonniers est tout simplement un echantillon de 100 individus de la populationgenerale de moyenne µ0 et d’ecart-type σ (pas de difference).

Or, on sait d’apres le T.C.L., que si n ⩾ 30 alors

X ∼ N (µ0, σ/√n)

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 31 / 103

Page 28: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison d’une moyenne observee a une moyenne theorique

Test Z ou de l’ecart reduit

4. Determination de la region critique W

z0.975!z0.975 0

N (0, 1)

2.5%2.5% 95%

W =]−∞;−z0.975] ∪ [z0.975; +∞[

W =]−∞;−1.96] ∪ [1.96;+∞[

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 32 / 103

Page 29: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison d’une moyenne observee a une moyenne theorique

Test Z ou de l’ecart reduit

5. Calcul de Z sur l’echantillon et conclusions

z =x − µ0

sn−1/√n

z =85− 100

10/10= −15

z ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.La moyenne observee sur l’echantillon est significativement differente de lamoyenne theorique.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 33 / 103

Page 30: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison d’une moyenne observee a une moyenne theorique

Test Z ou de l’ecart reduit

Remarques

Test bilateral → H1 : µ = µ0

Calcul de la p-value :

P(Z > |z |) = 2P(Z > z) = 2× P(Z > 15) ≈ 0

Comme P(Z > |z |) ≪ 0.05, on rejette H0

Si la methodologie d’echantillonnage est bonne (la difference n’est pas due aun echantillon peu representatif)

Inference a la population des prisonniers : Le QI des prisonniers est enmoyenne inferieur a celui de la population generale

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 34 / 103

Page 31: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants

Test de Z ou de l’ecart reduit

Exemple : patients diabetiques et taux de mauvais cholesterol (LDL)

Objectif : on desire savoir si le LDL est different entre les patients diabetiques etles personnes saines.

En population generale, on considere que le LDL moyen chez les diabetiques apour valeur µ1 et un ecart-type σ1.

En population generale, on considere que le LDL moyen chez les personnes sainesa pour valeur µ2 et un ecart-type σ2.

On dispose de 2 groupes de sujets :

Malades (n1 = 100) : x1 = 1.8, s1 = 0.5

Temoins (n2 = 50) : x2 = 1.3, s2 = 0.2

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 36 / 103

Page 32: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants

Test de Z ou de l’ecart reduit

1. Choix des hypotheses

H0 : Le LDL est identique entre les temoins et les malades

H1 : Le LDL est different entre les temoins et les malades

H0 : µ1 = µ2

H1 : µ1 = µ2

2. Choix d’un risque α

α = 5%

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 37 / 103

Page 33: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants

Test de Z ou de l’ecart reduit

3. Choix de la statistique de test et de sa loi sous H0

Sous H0,.

......

Z =X1 − X2√S21

n1+

S22

n2

∼ N (0, 1)

Pourquoi ? Comme n1 et n2 sont > 30, on applique le T.C.L. :

X1 ∼ N (µ1, σ1/√n1)

X2 ∼ N (µ2, σ2/√n2)

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 38 / 103

Page 34: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants

Test de Z ou de l’ecart reduit

3. Choix de la statistique de test et de sa loi sous H0

Donc

X1 − X2 ∼ N

µ1 − µ2,

√σ21

n1+

σ22

n2

Et

X1 − X2 − (µ1 − µ2)√σ21

n1+

σ22

n2

∼ N (0, 1)

Car les echantillons sont independants

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 39 / 103

Page 35: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants

Test de Z ou de l’ecart reduit

3. Choix de la statistique de test et de sa loi sous H0

Or sous H0, µ1 = µ2

Donc

X1 − X2√σ21

n1+

σ22

n2

∼ N (0, 1)

Comme σ1 et σ2 sont inconnus, on utilise S1 et S2 (estimateurs non baisees del’ecart-type)

Sous H0, la statistique de test sera ”en moyenne” nulle.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 40 / 103

Page 36: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants

Test Z ou de l’ecart reduit

4. Determination de la region critique W

z0.975!z0.975 0

N (0, 1)

2.5%2.5% 95%

W =]−∞;−z0.975] ∪ [z0.975; +∞[

W =]−∞;−1.96] ∪ [1.96;+∞[

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 41 / 103

Page 37: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants

Test Z ou de l’ecart reduit

5. Calcul de Z sur l’echantillon et conclusions

z =x1 − x2√s21n1

+s22n2

∼ N (0, 1)

z =1.8− 1.3√0.52

100+

0.22

50

= 9.3

z ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.La moyenne observee sur l’echantillon de malades est significativement differentede la moyenne chez les temoins.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 42 / 103

Page 38: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants

Test Z ou de l’ecart reduit

Remarques

Test bilateral → H1 : µ1 = µ2

Calcul de la p-value :

P(Z > |z |) = 2P(Z > z) = 2× P(Z > 9.3) ≈ 0

Comme P(Z > |z |) ≪ 0.05, on rejette H0

Si la methodologie d’echantillonnage est bonne (la difference n’est pas due ades echantillons peu representatifs)

Inference a la population de malades : Le LDL est en moyenne superieur acelui de la population generale.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 43 / 103

Page 39: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies

Definition de l’appariement

Un echantillon A et un echantillon B sont des echantillons apparies si chaqueobservation de A est liee a une observation homologue de B.

Chaque couple de valeurs forme alors une paire.

Exemples :

On mesure la taille pour differents couples de frere et soeur, et l’on souhaitecomparer la taille entre les hommes et les femmes

Mesure d’un parametre biologique chez des patients, avant et apres uneintervention (donnees repetees)

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 45 / 103

Page 40: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies

Test Z pour echantillons apparies

Principe du test

On se base sur la difference des valeurs associees a chaque observation.L’hypothese nulle testee stipule qu’en moyenne ces differences sont nulles.

On se libere de la variabilite intra-echantillon (entre les observations d’un memeechantillon) afin de prendre en compte uniquement la variabilite inter-echantillons(variabilite des differences entre paires).

Dans le cadre des donnees appariees, un test Z apparie est plus puissant qu’untest Z de comparaison de moyennes.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 46 / 103

Page 41: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies

Test Z pour echantillons apparies

Exemple : evaluation d’un traitement contre le cholesterol

Objectif : Un traitement a pour but de reduire le taux de LDL. On veut montrerque ce traitement est efficace.

Dans la population de malades, on pose :

X1 la mesure du LDL avant TTT

X2 la mesure du LDL apres TTT

On dispose d’un echantillon de n = 100 patients pour lesquels on a mesure

le LDL avant TTT (x1 = 1.8)

le LDL apres TTT (x2 = 1.6)

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 47 / 103

Page 42: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies

Test Z pour echantillons apparies

Exemple : evaluation d’un traitement contre le cholesterol

Dans la population de malades, si le traitement n’a aucun effet, on considere que :

D = X1 − X2 une va d’esperance µD = 0 et de variance σ2D

Dans la population de malades, si le traitement a un effet, on considere que :

D = X1 − X2 une va d’esperance µD = ∆ et de variance σ2D

Ce sont ces considerations qui vont permettre de definir les hypotheses ainsi quela statistique de test.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 48 / 103

Page 43: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies

Test Z pour echantillons apparies

1. Choix des hypotheses

H0 : Le TTT n’a pas d’effet

H1 : Le TTT a un effet

H0 : µD = 0

H1 : µD = ∆, ∆ = 0

2. Choix d’un risque α

α = 5%

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 49 / 103

Page 44: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies

Test Z pour echantillons apparies

3. Choix de la statistique de test

Z =D −∆

SD/√n∼ N (0, 1)

Or sous H0, ∆ = 0, donc :.

......

Z =D

SD/√n∼ N (0, 1)

Avec :D = X1 − X2

et

SD =

√∑ni=1 Di −

∑ni=1(Di )2

n

n − 1

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 50 / 103

Page 45: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies

Test Z pour echantillons apparies

4. Determination de la region critique W

z0.975!z0.975 0

N (0, 1)

2.5%2.5% 95%

W =]−∞;−z0.975] ∪ [z0.975; +∞[

W =]−∞;−1.96] ∪ [1.96;+∞[

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 51 / 103

Page 46: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies

Test Z pour echantillons apparies

5. Calcul de Z sur l’echantillon et conclusions

Posons sur l’echantillon, sD = 0.2

z =d

sD/√n

z =1.8− 1.6

0.2/√100

= 10

z ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.Le TTT est efficace.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 52 / 103

Page 47: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies

Test Z pour echantillons apparies

Remarques

Test bilateral → H1 : µD = ∆ = 0

Calcul de la p-value :

P(Z > |z |) = 2P(Z > z) = 2× P(Z > 10) ≈ 0

Comme P(Z > |z |) ≪ 0.05, on rejette H0

Si la methodologie d’echantillonnage est bonne (la difference n’est pas due aun echantillon peu representatif)

Inference a la population de malades : Le LDL est en moyenne inferieur apresTTT. Le TTT est efficace.

Relation de causalite

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 53 / 103

Page 48: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison d’une proportion observee a une proportion theorique

Test sur une proportion

Exemple : Sondage electoral

Objectif On desire comparer les intentions de votes entre le departement du Nordet Pas-De-Calais pour un candidat a l’election presidentielle.

On sait que dans le Nord, le candidat a π0 = 54% d’intention de vote.

On ne peut recenser l’ensemble des habitants du Pas-De-Calais pour determiner laproportion π d’intention de vote. On procede donc a un echantillonnage.

On dispose d’un echantillon de n = 200 individus dans lequel la proportiond’intention de vote pour le candidat est de π = 42%

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 55 / 103

Page 49: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison d’une proportion observee a une proportion theorique

Test sur une proportion

1. Choix des hypotheses

H0 : La proportion d’intention de vote est identique entre le Nord et lePas-De-Calais (H0 : π = π0)

H1 : La proportion d’intention de vote est differente entre le Nord et lePas-De-Calais (H1 : π = π0)

2. Choix d’un risque α

α = 5%

3. Choix de la statistique de test

Sous H0

.

......

Z =π − π0√π0(1−π0)

n

∼ N (0, 1)

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 56 / 103

Page 50: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison d’une proportion observee a une proportion theorique

Test sur une proportion

4. Determination de la region critique W

z0.975!z0.975 0

N (0, 1)

2.5%2.5% 95%

W =]−∞;−z0.975] ∪ [z0.975; +∞[

W =]−∞;−1.96] ∪ [1.96;+∞[

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 57 / 103

Page 51: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison d’une proportion observee a une proportion theorique

Test sur une proportion

5. Calcul de Z sur l’echantillon et conclusions

z =π − π0√π0(1−π0)

n

z =0.42− 0.54√

0.54(1−0.54)100

= −2.41

z ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.Les intentions de vote dans le Nord et le Pas-De-Calais sont significativementdifferentes .

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 58 / 103

Page 52: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison d’une proportion observee a une proportion theorique

Test sur une proportion

Remarques

Test bilateral → H1 : π = π0

Calcul de la p-value :

P(Z > |z |) = 2P(Z > z) = 2× P(Z > 2.41) = 0.0159

Comme P(Z > |z |) < 0.05, on rejette H0

Si la methodologie d’echantillonnage est bonne (la difference n’est pas due aun echantillon peu representatif)

Inference a la population du Pas-De-Calais : La proportion d’intention devote pour le candidat est significativement plus faible que dans le Nord.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 59 / 103

Page 53: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants

Comparaison de deux proportions / echantillonsindependants

Exemple : comparaison de l’efficacite de deux medicaments

Objectif : On veut montrer qu’il y a une difference d’efficacite entre unmedicament classique et un nouveau medicament.

Dans la population de malades prenant le medicament classique, on considerequ’il y a une proportion π1 de guerison a 1 mois.

Dans la population de malades prenant le nouveau medicament, on considere qu’ily a une proportion π2 de guerison a 1 mois.

On dispose de deux echantillons :

Medic. classique (n1 = 50) observant π1 = 65% de guerison a 1 mois.

Nouveau medic. (n2 = 50) observant π2 = 75% de guerison a 1 mois.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 61 / 103

Page 54: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants

Comparaison de deux proportions / echantillonsindependants

1. Choix des hypotheses

H0 : Les deux medicaments ont la meme efficacite

H1 : Les deux medicaments ont une efficacite differente

H0 : π1 = π2

H1 : π1 = π2

2. Choix d’un risque α

α = 5%

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 62 / 103

Page 55: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants

Comparaison de deux proportions / echantillonsindependants

3. Choix de la statistique de test

Z =π1 − π2 − (π1 − π2)√

π1(1−π1)n1

+ π2(1−π2)n2

∼ N (0, 1)

Sous H0, π1 = π2, donc :.

......

Z =π1 − π2√

π1(1−π1)n1

+ π2(1−π2)n2

∼ N (0, 1)

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 63 / 103

Page 56: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants

Comparaison de deux proportions / echantillonsindependants

4. Determination de la region critique W

z0.975!z0.975 0

N (0, 1)

2.5%2.5% 95%

W =]−∞;−z0.975] ∪ [z0.975; +∞[

W =]−∞;−1.96] ∪ [1.96;+∞[

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 64 / 103

Page 57: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants

Comparaison de deux proportions / echantillonsindependants

5. Calcul de Z sur l’echantillon et conclusions

z =π1 − π2√

π1(1−π1)n1

+ π2(1−π2)n2

z =0.65− 0.75√

0.65(1−0.65)50 + 0.75(1−0.75)

50

= −1.10

z /∈ W donc on ne rejette pas H0 au risque de seconde espece β non quantifiable.A la vue des donnees, il n’y a pas de difference d’efficacite significative entre lenouveau medicament et le classique.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 65 / 103

Page 58: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants

Comparaison de deux proportions / echantillonsindependants

Remarques - 1

Test bilateral → H1 : π1 = π2

Calcul de la p-value :

P(Z > |z |) = 2P(Z > z) = 2× P(Z > 1.10) = 0.2713

Comme P(Z > |z |) > 0.05, on ne rejette pas H0

Causes probables du non-rejet de H0 :

Les deux medicaments ont effectivement des efficacites identiques (H0 vraie)

On ne dispose de pas assez d’individus pour montrer une differencesignificative (puissance statistique)

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 66 / 103

Page 59: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants

Comparaison de deux proportions / echantillonsindependants

Remarques - 2

Si l’on considere deux echantillons (n1 = 200) et (n2 = 200) dans lesquels lesproportions de guerison a 1 mois sont identique (π1 = 0.65 et π2 = 0.75), alors :

z =0.65− 0.75√

0.65(1−0.65)200 + 0.75(1−0.75)

200

= −2.19

P − value = 0.0285 < α

Le test est significatif : il y a une difference d’efficacite entre le nouveaumedicament et le classique. Le premier semble est plus efficace que le deuxieme.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 67 / 103

Page 60: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants

Comparaison de deux proportions / echantillonsindependants

Remarques - 3

La puissance d’un test est en partie fonction du nombre d’observationsdisponibles

Theoriquement, plus on augmente le nombre d’observations, plus le test seracapable de detecter une difference infime comme significative

En pratique : on se fixe une difference clinique minimale (ex : 10%)...

Estimation du nombre de sujets necessaires...

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 68 / 103

Page 61: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison d’une moyenne observee a une moyenne theorique

Test T de Student

Remarques preliminaires :

Le principe est tres proche du test Z

On doit supposer que X ∼ N (µ, σ) dans la population

Retour a l’exemple sur le QI des prisonniers

Objectif : on cherche a determiner si le QI des prisonnier est le meme (enmoyenne) que le QI de la population generale distribue selon une loi normale demoyenne : µ0 = 100, et d’ecart-type σ.

Considerons la population de prisonniers dans laquelle le QI est distribue selon uneloi normale de moyenne µ et d’ecart-type σ′.

Soit un echantillon de n = 10 prisonniers sur lequel on calcul la moyenneempirique x = 85 et l’ecart-type empirique sn−1 = 10.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 71 / 103

Page 62: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison d’une moyenne observee a une moyenne theorique

Test T de Student

1. Choix des hypotheses

H0 : le QI moyen des prisonniers est identique a celui de la populationgenerale (H0 : µ = µ0)

H1 : le QI moyen des prisonniers est different de celui de la populationgenerale (H1 : µ = µ0)

2. Choix d’un risque α

α = 5%

3. Choix de la statistique de test et de sa loi sous H0

Sous H0,.

......T =

X − µ0

Sn−1/√n∼ Tn−1 d.d.l

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 72 / 103

Page 63: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison d’une moyenne observee a une moyenne theorique

Test T de Student

4. Determination de la region critique W

t0.975, 9!t0.975, 9 0

T(9 ddl)

2.5% 2.5%95%

W =]−∞;−t0.975,, 9ddl ] ∪ [t0.975,, 9ddl ; +∞[

W =]−∞;−2.26] ∪ [2.26;+∞[

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 73 / 103

Page 64: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison d’une moyenne observee a une moyenne theorique

Test T de Student

5. Calcul de T sur l’echantillon et conclusions

t =x − µ0

sn−1/√n

t =85− 100

10/√10

= −4.74

t ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.La moyenne observee sur l’echantillon est significativement differente de lamoyenne theorique.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 74 / 103

Page 65: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison d’une moyenne observee a une moyenne theorique

Test T de Student

Remarques

Test bilateral → H1 : µ = µ0

Calcul de la p-value :

P(T9ddl > |t|) = 2P(T9ddl > t) = 2× P(T9ddl > 4.74) = 0.001

Comme P(T > |t|) < 0.05, on rejette H0

Si la methodologie d’echantillonnage est bonne (la difference n’est pas due aun echantillon peu representatif)

Inference a la population des prisonniers : Le QI des prisonniers est enmoyenne inferieur a celui de la population generale

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 75 / 103

Page 66: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants

Conditions necessaires au Test T de Student

Remarques preliminaires :

On doit supposer que dans la population :

X1 ∼ N (µ1, σ1)

X2 ∼ N (µ2, σ2)

On distingue deux cas de figure :

...1 σ21 = σ2

2

...2 σ21 = σ2

2

Pour differencier ces deux cas, on procede a un test de comparaison de deuxvariances

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 77 / 103

Page 67: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants

Test F - Comparaison de deux variances

Considerons :X1 ∼ N (µ1, σ1) et X2 ∼ N (µ2, σ2)

Les hypotheses du test

H0 : σ21 = σ2

2

H1 : σ21 > σ2

2

Soient deux echantillons de taille n1 et n2 :

S21 =

1

n1 − 1

n1∑i=1

(X1i − X1)2 et S2

2 =1

n2 − 1

n2∑i=1

(X2i − X2)2

Statistique de test sous H0

.

......F =

S21

S22

∼ F(n1−1,n2−1)ddl

En pratique :

Test unilateral a droiteOn prend la valeur la plus elevee entre s21 et s22 comme numerateur de lastatistique de testLe rapport est ⩾ 1.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 78 / 103

Page 68: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants

Test F - Comparaison de deux variances

Region critique W

Fn1!1,n2!1

5%

f1!!n1!1,n2!1

0 1 2 3 4 5 6

W = [f 1−αn1−1,n2−1; +∞[

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 79 / 103

Page 69: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants

Test F - Comparaison de deux variances

Remarques

Les variances σ1 et σ2 sont dites homogenes si le test F est non significatif

→ Notion d’homoscedasticite

Si le test est significatif, les variances sont dites heterogenes

→ Notion d’heteroscedasticite

Le test necessite la normalite de X1 et X2

X1 et X2 doivent etre independantes

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 80 / 103

Page 70: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants

Test de T de Student

Exemple : patients diabetiques et taux de mauvais cholesterol (LDL)

Objectif : on desire savoir si le LDL est different entre les patients diabetiques etles personnes saines.

En population generale, on considere que le LDL chez les diabetiques est distribueselon une loi normale de moyenne µ1 et d’ecart-type σ1.

En population generale, on considere que le LDL chez les personnes saines estdistribue selon une loi normale de moyenne µ2 et d’ecart-type σ2.

On dispose de 2 groupes de sujets :

Malades (n1 = 25) : x1 = 1.8, s1 = 0.5

Temoins (n2 = 20) : x2 = 1.3, s2 = 0.2

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 81 / 103

Page 71: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants

Test de T de Student

1. Choix des hypotheses

H0 : Le LDL est identique entre les temoins et les malades

H1 : Le LDL est different entre les temoins et les malades

H0 : µ1 = µ2

H1 : µ1 = µ2

2. Choix d’un risque α

α = 5%

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 82 / 103

Page 72: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants

Test de T de Student

3. Choix de la statistique de test...1 Si σ2

1 = σ22 = σ2, alors sous H0 :

.

......

T =X1 − X2

S√

1n1

+ 1n2

∼ Tn1+n2−2 ddl

Avec S2 l’estimateur de la variance commune σ2..

......S2 =

(n1 − 1)S21 + (n2 − 1)S2

2

n1 + n2 − 2

...2 Si σ21 = σ2

2 , alors sous H0 :

.

......

T =X1 − X2√S21

n1+

S22

n2

∼ Tn1+n2−2 ddl

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 83 / 103

Page 73: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants

Test T de Student

4. Determination de la region critique W

t0.975, 43!t0.975, 43 0

T(43 ddl)

2.5% 2.5%95%

W =]−∞;−t0.975,, 43ddl ] ∪ [t0.975,, 43ddl ; +∞[

W =]−∞;−2.017] ∪ [2.017;+∞[

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 84 / 103

Page 74: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants

Test T de Student

5. Calcul de T sur l’echantillon et conclusions

Il faut tout d’abord tester l’egalite des variances σ21 et σ2

2 :

On pose un risque α = 5%

H0 : σ21 = σ2

2

H1 : σ21 > σ2

2

f =s21s22

=(0.5)2

(0.1)2= 25

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 85 / 103

Page 75: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants

Test T de Student

Region critique W

F24,19

5%

f0.9524,19

0 1 2 3

W = [f 0.9524,19; +∞[

W = [2.11;+∞[

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 86 / 103

Page 76: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants

Test T de Student

f ∈ W donc on rejette H0 avec un risque α de premiere espece.

Les variances σ21 et σ2

2 sont differentes. (Heteroscedasticite).

Pour le test de Student, on choisit donc comme statistique de test :

T =X1 − X2√S21

n1+

S22

n2

∼ Tn1+n2−2 ddl

t =1.8− 1.3√(0.5)2

25 + (0.2)2

20

= 4.56

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 87 / 103

Page 77: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants

Test T de Student

t ∈ W =]−∞;−2.017] ∪ [2.017;+∞[ donc on rejette H0 avec un risque α depremiere espece.

La moyenne observee sur l’echantillon de malades est significativement differentede la moyenne chez les temoins.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 88 / 103

Page 78: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants

Test T de Student

Remarques

Test bilateral → H1 : µ1 = µ2

Calcul de la p-value :

P(T > |t|) = 2P(T > t) = 2× P(T > 4.56) ≈ 4.10−6

Comme P(T > |t|) ≪ 0.05, on rejette H0

Si la methodologie d’echantillonnage est bonne (la difference n’est pas due ades echantillons peu representatifs)

Inference a la population de malades : Le LDL est en moyenne superieur acelui de la population generale.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 89 / 103

Page 79: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies

Test T de Student sur echantillons apparies

Exemple : Traitement du diabete 1

Objectif : On desire etudier l’effet d’une nouvelle strategie de traitement dudiabete en mesurant l’effet sur la glycemie. On dose la glycemie (g/L) chez 15sujets avant le debut du nouveau protocole et 3 mois apres.

Dans la population de malades, on pose :

X1 la mesure de glycemie avant TTT

X2 la mesure de glycemie apres TTT (3 mois apres)

D = X1 − X2 une va distribuee selon une loi normale d’esperance µD et devariance σ2

D

1. Statistique - Epidemiologie, T. Ancelle, p. 141Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 91 / 103

Page 80: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies

Test T de Student sur echantillons apparies

Exemple : Traitement du diabete

Sur l’echantillon

Les mesures sont appariees car elles sont effectuees sur les memes individus.

La moyenne des differences entre les mesures :

d = 0.1

L’ecart-type des differences entre les mesures :

sD = 0.091

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 92 / 103

Page 81: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies

Test T de Student pour echantillons apparies

1. Choix des hypotheses

H0 : les glycemies sont identiques avant et apres le nouveau protocole

H1 unilaterale : la glycemie est reduite grace au nouveau protocole

H0 : µD = 0

H1 : µD = ∆, ∆ > 0

2. Choix d’un risque α

α = 5%

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 93 / 103

Page 82: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies

Test T de Student pour echantillons apparies

3. Choix de la statistique de test

T =D −∆

SD/√n∼ Tn−1 ddl

Or sous H0, ∆ = 0, donc :.

......

T =D

SD/√n∼ Tn−1 ddl

AvecD = X1 − X2

et

SD =

√√√√ n

n − 1

[1

n

n∑i=1

D2i −

(D)2]

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 94 / 103

Page 83: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies

Test T de Student pour echantillons apparies

Region critique W

t0.95, 140

T(14 ddl)

5%95%

W = [t0.95, 14; +∞[

W = [1.761;+∞[

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 95 / 103

Page 84: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies

Test T de Student pour echantillons apparies

5. Calcul de T sur l’echantillon et conclusions

t =d

sD/√n

z =0.1

0.91/√15

= 4.25

t ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.La glycemie est significativement plus basse apres administration de la nouvellestrategie.

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 96 / 103

Page 85: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies

Test T de Student pour echantillons apparies

Remarques

Test unilateral → H1 : µD > 0

Calcul de la p-value :

P(T14ddl > t) = P(T14ddl > 4.25) ≈ 4.10−4

Comme P(T > t) ≪ 0.05, on rejette H0

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 97 / 103

Page 86: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Conclusions

Tests de comparaison

Les tests de comparaison servent a comparer des parametres entre des populationsdifferentes.

2 types :

Comparaison d’un echantillon observe a une population de reference

Comparaison de deux echantillons observes (les deux populations sontinconnues)

Le principe fondamental est le test de la difference des deux parametres.

Sous H0 cette difference est en moyenne nulle

Sous H1 cette difference est en moyenne non-nulle

Sous H0, la loi de probabilite de cette difference est toujours connue !!

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 99 / 103

Page 87: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Conclusions

Tests de comparaison

Porter une attention double sur :

Le type de parametres en jeu (moyennes, proportions, variances...)

Les conditions d’application du test

Distinguer deux cas de figure :

n ⩾ 30

n < 30

Se poser la question :

Les echantillons sont-ils independants ?

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 100 / 103

Page 88: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Conclusions

Tests de comparaison - Resume

Test Comparaison Conditions d’applications

Test Z moyenne observee/theorique n ⩾ 30

2 moyennes n1 et n2 ⩾ 30

2 moyennes appariees n ⩾ 30

Test T moyenne observee/theorique X1 ∼ N (µ, σ)

2 moyennes X1 ∼ N (µ1, σ1) et X2 ∼ N (µ2, σ2)

2 moyennes appariees (X1 − X2) = D ∼ N (µD , σD)

Test sur % prop. observee/prop. theorique n ⩾ 30 et min{np, n(1 − p)} > 5

2 proportions n1, n2 ⩾ 30min{nip,ni (1 − pi )} > 5, i = 1, 2

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 101 / 103

Page 89: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Conclusions

Tests de comparaison - Resume

Il reste des cas de figure sans reponse !!

n ⩾ 30 et comparaison de deux proportions sur echantillons apparies

Ex : % avant et apres un TTT chez les meme individus→ χ2 de McNemar

n < 30 Comparaison de moyennes (ind. ou apparies) et conditions denormalite non respectees

→ Test non parametrique : Test de Wilcoxon pour echantillons inde.→ Test non parametrique : Test de Wilcoxon pour echantillons apparies

Comparaison de plus de 2 moyennes

n ⩾ 30 → ANOVAn < 30 → si normalite alors ANOVAn < 30 → si non normalite alors Test de Kruskal - Wallis

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 102 / 103

Page 90: Micha el Genin - Accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... · Principe des tests statistiques Exemple introductif Exemple introductif Exemple 1 : ffi

Conclusions

Allons plus loin...

Cours essentiellement base sur les tests de comparaison.

On peut tester la liaison entre deux variables :

2 variables qualitatives

Ex : Existe-t-il un lien significatif entre le fait d’etre malade (non malade) et lesexe ?→ Test du χ2 d’independance

2 variables quantitatives

Ex : Existe-t-il un lien significatif entre le taux de prothrombine et l’age ?→ Test sur le coefficient de correlation / Regression lineaire

Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 103 / 103