micha el genin - accueilcerim.univ-lille2.fr/fileadmin/user_upload/statistiques/michael... ·...
TRANSCRIPT
.
......Tests statistiques
Michael Genin
Universite de Lille 2EA 2694 - Sante Publique : Epidemiologie et Qualite des soins
Plan
...1 Principe des tests statistiquesExemple introductifDefinitions
...2 Grands echantillons n ⩾ 30Comparaison d’une moyenne observee a une moyenne theoriqueComparaison de deux moyennes / Echantillons independantsComparaison de deux moyennes / Echantillons appariesComparaison d’une proportion observee a une proportion theoriqueComparaison de deux proportions / Echantillons independants
...3 Petits echantillons n < 30Comparaison d’une moyenne observee a une moyenne theoriqueComparaison de deux moyennes / Echantillons independantsComparaison de deux moyennes / Echantillons apparies
...4 Conclusions
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 1 / 103
Principe des tests statistiques Exemple introductif
Exemple introductif
Exemple 1 : efficacite d’un nouveau medicament
On souhaite tester l’efficacite d’un nouveau medicament par rapport aumedicament couramment utilise.
On dispose d’un echantillon de 100 patients divise en 2 groupes :
Groupe A (50 individus) : nouveau medicament
Groupe B (50 individus) : medicament classique
En observant la guerison a 1 mois :
Groupe A : 75% de guerison
Groupe B : 65% de guerison
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 4 / 103
Principe des tests statistiques Exemple introductif
Exemple introductif
Exemple 1 : efficacite d’un nouveau medicament
Le nouveau medicament est-il plus efficace que le medicament classique ?
D’un point de vue descriptif → OUI
Si on tire un autre echantillon de patients, retrouve-t-on la meme differenced’efficacite ? (fluctuations d’echantillonnage)
Peut-on extrapoler cette difference d’efficacite a la population ?
Les tests statistiques permettent de fixer une regle de decision objective.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 5 / 103
Principe des tests statistiques Exemple introductif
Exemple introductif
Exemple 2 : identification d’un facteur de risque
On s’interesse au lien entre le tabagisme et et le cancer du poumon sur unechantillon de 200 individus.
On procede a une etude cas/temoins :
Malade Non maladeFumeur 70 20
Non fumeur 30 80
Chez les malades, on observe 70% de fumeurs
Chez les non-malades, on observe 20% de fumeurs
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 6 / 103
Principe des tests statistiques Exemple introductif
Exemple introductif
Exemple 2 : identification d’un facteur de risque
Comment interpreter la proportion plus elevee de fumeurs dans l’echantillon demalades que dans celui des non-malades ?
Existence d’un reel lien entre le tabagisme et le cancer du poumon ?
Difference de proportion liee a l’echantillon ?
Cette difference est-elle extrapolable a la population ?
Les tests statistiques permettent de fixer une regle de decision objective.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 7 / 103
Principe des tests statistiques Definitions
Definitions
Objectif : Valider ou non une hypothese faite sur une ou plusieurs populations
...1 Outil pour effectuer une preuve
Medicament A est meilleur que le le medicament BUn facteur F est lie a la pathologie P
...2 Methode experimentale (non deterministe)
On se base sur un ou plusieurs echantillonsLa prise de decision peut etre influencee par le choix de l’echantillonLa conclusion ne pourra se faire de maniere certaine (notion de risque)
...3 Raisonnement mathematique particulier : raisonnement par l’absurde → Testd’hypothese
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 9 / 103
Principe des tests statistiques Definitions
Definitions
Notion d’hypothese (H0, H1)
On pose une hypothese, appelee Hypothese nulle, notee H0.Souvent, cette hypothese est le contraire ce que l’on cherche a prouver(raisonnement par l’absurde) :
H0 : Le medicament classique et le nouveau ont la meme efficacite
C’est cette hypothese qu’on va tester a l’aide des observations sur le (ou les)echantillon(s).
Un test statistique peut amener a deux decisions possibles :
Conservation de H0
Rejet de H0
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 10 / 103
Principe des tests statistiques Definitions
Definitions
Notion d’hypothese (H0, H1)
Si l’hypothese testee est rejetee, alors on ”accepte” le complementaire de cettehypothese, appelee hypothese alternative, notee H1
H1 : Le nouveau medicament et le classique ont des efficacites differentes
Un test statistique presente donc deux hypotheses, H0 et H1 :
H0 : Le medicament classique et le nouveau ont la meme efficacite
H1 : Le nouveau medicament et le classique ont des efficacites differentes
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 11 / 103
Principe des tests statistiques Definitions
Definitions
Notion de risque
Le jugement d’une hypothese se fait sur un ou plusieurs echantillons.
→ La conclusion du test n’est pas certaine mais lui est associe un risque d’erreurfaible..Le risque de premiere espece α........ Risque de rejeter H0 sachant qu’elle est vraie.
Les deux medicaments n’ont pas la meme efficacite
alors qu’en realite leur efficacite est equivalente
La preuve n’est pas certaine, on lui associe un risque fixe a l’avance(ex : α = 5%)
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 12 / 103
Principe des tests statistiques Definitions
Definitions
Notion de risque
Si on rejette H0, le test est dit significatif au risque α.
.Le risque de seconde espece β........ Risque de conserver H0 sachant que H1 est vraie.
Les deux medicaments ont la meme efficacite
alors qu’en realite leur efficacite est differente
Si on conserve H0, le test est dit non significatif au risque β
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 13 / 103
Principe des tests statistiques Definitions
Definitions
Risques associes a un test
Realite
Decision H0 H1
H0 conclusion correcte risque de deuxieme espece
H1 risque de premiere espece conclusion correcte
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 14 / 103
Principe des tests statistiques Definitions
Definitions
Regle de decision
Se base sur une statistique de test ST : variable aleatoire observable telle quesa loi est completement connue sous H0
La realisation de ST est observee sur l’echantillon
Les valeurs peu probables de ST observees mettent en cause la validite de H0
Exemple : efficacite de deux medicaments
H0 : Le medicament classique et le nouveau ont la meme efficacite
H1 : Le nouveau medicament et le classique ont des efficacites differentes
On suppose de ST ∼ N (0, 1) sous H0.On observe sT (realisation de ST ) sur un echantillon de taille 200 et sT = 3.sT = 3 est une valeur tres peu probable pour une loi N (0, 1).
P(ST > 3) < 0.025
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 15 / 103
Principe des tests statistiques Definitions
Exemple : efficacite de deux medicaments
0
Sous H0
ST ! N (0, 1)
Valeur de ST observee
3
Si H0 etait vraie, on aurait du obtenir une valeur de ST plus probable et non unevaleur extreme.2 explications possibles :
H0 n’est pas vraie ( les deux medicaments ont des efficacites differentes)Probleme d’echantillonnage
Quelles valeurs de ST conduisent au rejet de H0 ???Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 16 / 103
Principe des tests statistiques Definitions
Definitions
Region critique
On appelle region critique W l’ensemble des valeurs de ST qui conduisent au rejetde H0 au profit de H1.
P(ST ∈ W /H0) = α
P(ST /∈ W /H0) = 1− α
EtP(ST /∈ W /H1) = β
P(ST ∈ W /H1) = 1− β
1− β est appelee la puissance du test
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 17 / 103
Principe des tests statistiques Definitions
Definitions
Exemple avec ST ∼ N (0, 1) sous H0 et α = 0.05
z0.975!z0.975 0
N (0, 1)
2.5%2.5% 95%
W =]−∞;−z0.975] ∪ [z0.975; +∞[
Le test est dit bilateral
H1 : Les deux medicaments ont une efficacite differente
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 18 / 103
Principe des tests statistiques Definitions
Definitions
Exemple avec ST ∼ N (0, 1) sous H0 et α = 0.05
Test unilateral a gauche
!z0.95 0
N (0, 1)
5% 95%
W =]−∞;−Z0.95]
H1 : Le nouveau medicament est moins efficace que le classique
Test unilateral a droite
z0.950
N (0, 1)
5%95%
W = [z0.95; +∞[
H1 : Le nouveau medicament est plus efficace que le classique
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 19 / 103
Principe des tests statistiques Definitions
Definitions
Risques associes a un test
Realite
Decision H0 H1
H0 Niveau de confiance 1− α β
H1 α Puissance 1− β
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 20 / 103
Principe des tests statistiques Definitions
Definitions
Remarques
Le choix de α conditionne la capacite du test a rejeter H0
Si α est trop petit → on ne rejette que tres rarement H0 (test conservatif)Si α est trop grand → on va rejeter tres souvent H0, mais le risque de setromper est grand...
Le risque β se calcule si la loi de ST sous H1 est connue
α et β varient en sens inverse
Si on diminue α alors β augmente
Il est d’usage de fixer α = 1%, 5%, 10%
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 21 / 103
Principe des tests statistiques Definitions
Definitions
Distribution sous H0 Distribution sous H1
Zone de conservation de H0 Zone de rejet de H0
Risque αSeuil
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 22 / 103
Principe des tests statistiques Definitions
Definitions
Distribution sous H0 Distribution sous H1
Zone de rejet de H0 Zone de conservation de H0
Risque β
Seuil
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 23 / 103
Principe des tests statistiques Definitions
Definitions
Distribution sous H0 Distribution sous H1
Zone de rejet de H0 Zone de conservation de H0
Puissance 1− β
Seuil
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 24 / 103
Principe des tests statistiques Definitions
Definitions
P-value
En pratique, au lieu de calculer la region critique W , on prefere donner un seuilcritique appele p-value.
La p-value correspond a la plus petite valeur de α conduisant a rejeter H0.
C’est le degre de signification du test. Plus elle faible par rapport a α, plus le testa un degre de signification important.
En pratique :
P-value < α alors on rejette H0
P-value ⩾ α alors on ne rejette pas H0
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 25 / 103
Principe des tests statistiques Definitions
Principe des tests statistiques
Demarche d’un test statistique
...1 Choix de H0 et de H1
...2 Choix d’un risque α
...3 Choix d’une statistique de test ST et de sa loi sous H0
...4 Determination de la region critique W
...5 Conclusion : observation de la realisation de ST sur l’echantillon :
Si sT ∈ W alors Rejet de H0
Si sT /∈ W alors Non rejet de H0
Types de tests
Tests parametriques : comparaison de parametres (moyennes, variances...)
Tests semi et non-parametriques : comparaison de distributions
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 26 / 103
Grands echantillons n ⩾ 30 Comparaison d’une moyenne observee a une moyenne theorique
Test Z ou de l’ecart reduit
Exemple : QI et prisonniers...
Objectif : on cherche a determiner si le QI des prisonniers est le meme (enmoyenne) que le QI de la population generale dont on connait la moyenne :µ0 = 100, l’ecart-type etant σ.
Considerons que dans la population de prisonniers le QI est une va X de moyenneµ et d’ecart-type est σ′.
Nous ne pouvons faire des tests de QI sur tous les prisonniers, donc on procede aun echantillonnage.
Soit un echantillon de n = 100 prisonniers sur lequel on calcul la moyenneempirique x = 85 et l’ecart-type empirique sn−1 = 10.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 29 / 103
Grands echantillons n ⩾ 30 Comparaison d’une moyenne observee a une moyenne theorique
Test Z ou de l’ecart reduit
1. Choix des hypotheses
Soit X la va qui associe a un prisonnier son QI
H0 : le QI moyen des prisonniers est identique a celui de la populationgenerale
H1 : le QI moyen des prisonniers est different de celui de la populationgenerale
H0 : µ = µ0
H1 : µ = µ0
2. Choix d’un risque α
α = 5%
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 30 / 103
Grands echantillons n ⩾ 30 Comparaison d’une moyenne observee a une moyenne theorique
Test Z ou de l’ecart reduit
3. Choix de la statistique de test et de sa loi sous H0
Sous H0,.
......Z =
X − µ0
Sn−1/√n∼ N (0, 1)
Pourquoi ?Sous H0, on considere que les QI moyens sont egaux. Aussi, l’echantillon deprisonniers est tout simplement un echantillon de 100 individus de la populationgenerale de moyenne µ0 et d’ecart-type σ (pas de difference).
Or, on sait d’apres le T.C.L., que si n ⩾ 30 alors
X ∼ N (µ0, σ/√n)
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 31 / 103
Grands echantillons n ⩾ 30 Comparaison d’une moyenne observee a une moyenne theorique
Test Z ou de l’ecart reduit
4. Determination de la region critique W
z0.975!z0.975 0
N (0, 1)
2.5%2.5% 95%
W =]−∞;−z0.975] ∪ [z0.975; +∞[
W =]−∞;−1.96] ∪ [1.96;+∞[
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 32 / 103
Grands echantillons n ⩾ 30 Comparaison d’une moyenne observee a une moyenne theorique
Test Z ou de l’ecart reduit
5. Calcul de Z sur l’echantillon et conclusions
z =x − µ0
sn−1/√n
z =85− 100
10/10= −15
z ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.La moyenne observee sur l’echantillon est significativement differente de lamoyenne theorique.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 33 / 103
Grands echantillons n ⩾ 30 Comparaison d’une moyenne observee a une moyenne theorique
Test Z ou de l’ecart reduit
Remarques
Test bilateral → H1 : µ = µ0
Calcul de la p-value :
P(Z > |z |) = 2P(Z > z) = 2× P(Z > 15) ≈ 0
Comme P(Z > |z |) ≪ 0.05, on rejette H0
Si la methodologie d’echantillonnage est bonne (la difference n’est pas due aun echantillon peu representatif)
Inference a la population des prisonniers : Le QI des prisonniers est enmoyenne inferieur a celui de la population generale
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 34 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants
Test de Z ou de l’ecart reduit
Exemple : patients diabetiques et taux de mauvais cholesterol (LDL)
Objectif : on desire savoir si le LDL est different entre les patients diabetiques etles personnes saines.
En population generale, on considere que le LDL moyen chez les diabetiques apour valeur µ1 et un ecart-type σ1.
En population generale, on considere que le LDL moyen chez les personnes sainesa pour valeur µ2 et un ecart-type σ2.
On dispose de 2 groupes de sujets :
Malades (n1 = 100) : x1 = 1.8, s1 = 0.5
Temoins (n2 = 50) : x2 = 1.3, s2 = 0.2
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 36 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants
Test de Z ou de l’ecart reduit
1. Choix des hypotheses
H0 : Le LDL est identique entre les temoins et les malades
H1 : Le LDL est different entre les temoins et les malades
H0 : µ1 = µ2
H1 : µ1 = µ2
2. Choix d’un risque α
α = 5%
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 37 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants
Test de Z ou de l’ecart reduit
3. Choix de la statistique de test et de sa loi sous H0
Sous H0,.
......
Z =X1 − X2√S21
n1+
S22
n2
∼ N (0, 1)
Pourquoi ? Comme n1 et n2 sont > 30, on applique le T.C.L. :
X1 ∼ N (µ1, σ1/√n1)
X2 ∼ N (µ2, σ2/√n2)
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 38 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants
Test de Z ou de l’ecart reduit
3. Choix de la statistique de test et de sa loi sous H0
Donc
X1 − X2 ∼ N
µ1 − µ2,
√σ21
n1+
σ22
n2
Et
X1 − X2 − (µ1 − µ2)√σ21
n1+
σ22
n2
∼ N (0, 1)
Car les echantillons sont independants
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 39 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants
Test de Z ou de l’ecart reduit
3. Choix de la statistique de test et de sa loi sous H0
Or sous H0, µ1 = µ2
Donc
X1 − X2√σ21
n1+
σ22
n2
∼ N (0, 1)
Comme σ1 et σ2 sont inconnus, on utilise S1 et S2 (estimateurs non baisees del’ecart-type)
Sous H0, la statistique de test sera ”en moyenne” nulle.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 40 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants
Test Z ou de l’ecart reduit
4. Determination de la region critique W
z0.975!z0.975 0
N (0, 1)
2.5%2.5% 95%
W =]−∞;−z0.975] ∪ [z0.975; +∞[
W =]−∞;−1.96] ∪ [1.96;+∞[
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 41 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants
Test Z ou de l’ecart reduit
5. Calcul de Z sur l’echantillon et conclusions
z =x1 − x2√s21n1
+s22n2
∼ N (0, 1)
z =1.8− 1.3√0.52
100+
0.22
50
= 9.3
z ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.La moyenne observee sur l’echantillon de malades est significativement differentede la moyenne chez les temoins.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 42 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons independants
Test Z ou de l’ecart reduit
Remarques
Test bilateral → H1 : µ1 = µ2
Calcul de la p-value :
P(Z > |z |) = 2P(Z > z) = 2× P(Z > 9.3) ≈ 0
Comme P(Z > |z |) ≪ 0.05, on rejette H0
Si la methodologie d’echantillonnage est bonne (la difference n’est pas due ades echantillons peu representatifs)
Inference a la population de malades : Le LDL est en moyenne superieur acelui de la population generale.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 43 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies
Definition de l’appariement
Un echantillon A et un echantillon B sont des echantillons apparies si chaqueobservation de A est liee a une observation homologue de B.
Chaque couple de valeurs forme alors une paire.
Exemples :
On mesure la taille pour differents couples de frere et soeur, et l’on souhaitecomparer la taille entre les hommes et les femmes
Mesure d’un parametre biologique chez des patients, avant et apres uneintervention (donnees repetees)
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 45 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies
Test Z pour echantillons apparies
Principe du test
On se base sur la difference des valeurs associees a chaque observation.L’hypothese nulle testee stipule qu’en moyenne ces differences sont nulles.
On se libere de la variabilite intra-echantillon (entre les observations d’un memeechantillon) afin de prendre en compte uniquement la variabilite inter-echantillons(variabilite des differences entre paires).
Dans le cadre des donnees appariees, un test Z apparie est plus puissant qu’untest Z de comparaison de moyennes.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 46 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies
Test Z pour echantillons apparies
Exemple : evaluation d’un traitement contre le cholesterol
Objectif : Un traitement a pour but de reduire le taux de LDL. On veut montrerque ce traitement est efficace.
Dans la population de malades, on pose :
X1 la mesure du LDL avant TTT
X2 la mesure du LDL apres TTT
On dispose d’un echantillon de n = 100 patients pour lesquels on a mesure
le LDL avant TTT (x1 = 1.8)
le LDL apres TTT (x2 = 1.6)
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 47 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies
Test Z pour echantillons apparies
Exemple : evaluation d’un traitement contre le cholesterol
Dans la population de malades, si le traitement n’a aucun effet, on considere que :
D = X1 − X2 une va d’esperance µD = 0 et de variance σ2D
Dans la population de malades, si le traitement a un effet, on considere que :
D = X1 − X2 une va d’esperance µD = ∆ et de variance σ2D
Ce sont ces considerations qui vont permettre de definir les hypotheses ainsi quela statistique de test.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 48 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies
Test Z pour echantillons apparies
1. Choix des hypotheses
H0 : Le TTT n’a pas d’effet
H1 : Le TTT a un effet
H0 : µD = 0
H1 : µD = ∆, ∆ = 0
2. Choix d’un risque α
α = 5%
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 49 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies
Test Z pour echantillons apparies
3. Choix de la statistique de test
Z =D −∆
SD/√n∼ N (0, 1)
Or sous H0, ∆ = 0, donc :.
......
Z =D
SD/√n∼ N (0, 1)
Avec :D = X1 − X2
et
SD =
√∑ni=1 Di −
∑ni=1(Di )2
n
n − 1
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 50 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies
Test Z pour echantillons apparies
4. Determination de la region critique W
z0.975!z0.975 0
N (0, 1)
2.5%2.5% 95%
W =]−∞;−z0.975] ∪ [z0.975; +∞[
W =]−∞;−1.96] ∪ [1.96;+∞[
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 51 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies
Test Z pour echantillons apparies
5. Calcul de Z sur l’echantillon et conclusions
Posons sur l’echantillon, sD = 0.2
z =d
sD/√n
z =1.8− 1.6
0.2/√100
= 10
z ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.Le TTT est efficace.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 52 / 103
Grands echantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons apparies
Test Z pour echantillons apparies
Remarques
Test bilateral → H1 : µD = ∆ = 0
Calcul de la p-value :
P(Z > |z |) = 2P(Z > z) = 2× P(Z > 10) ≈ 0
Comme P(Z > |z |) ≪ 0.05, on rejette H0
Si la methodologie d’echantillonnage est bonne (la difference n’est pas due aun echantillon peu representatif)
Inference a la population de malades : Le LDL est en moyenne inferieur apresTTT. Le TTT est efficace.
Relation de causalite
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 53 / 103
Grands echantillons n ⩾ 30 Comparaison d’une proportion observee a une proportion theorique
Test sur une proportion
Exemple : Sondage electoral
Objectif On desire comparer les intentions de votes entre le departement du Nordet Pas-De-Calais pour un candidat a l’election presidentielle.
On sait que dans le Nord, le candidat a π0 = 54% d’intention de vote.
On ne peut recenser l’ensemble des habitants du Pas-De-Calais pour determiner laproportion π d’intention de vote. On procede donc a un echantillonnage.
On dispose d’un echantillon de n = 200 individus dans lequel la proportiond’intention de vote pour le candidat est de π = 42%
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 55 / 103
Grands echantillons n ⩾ 30 Comparaison d’une proportion observee a une proportion theorique
Test sur une proportion
1. Choix des hypotheses
H0 : La proportion d’intention de vote est identique entre le Nord et lePas-De-Calais (H0 : π = π0)
H1 : La proportion d’intention de vote est differente entre le Nord et lePas-De-Calais (H1 : π = π0)
2. Choix d’un risque α
α = 5%
3. Choix de la statistique de test
Sous H0
.
......
Z =π − π0√π0(1−π0)
n
∼ N (0, 1)
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 56 / 103
Grands echantillons n ⩾ 30 Comparaison d’une proportion observee a une proportion theorique
Test sur une proportion
4. Determination de la region critique W
z0.975!z0.975 0
N (0, 1)
2.5%2.5% 95%
W =]−∞;−z0.975] ∪ [z0.975; +∞[
W =]−∞;−1.96] ∪ [1.96;+∞[
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 57 / 103
Grands echantillons n ⩾ 30 Comparaison d’une proportion observee a une proportion theorique
Test sur une proportion
5. Calcul de Z sur l’echantillon et conclusions
z =π − π0√π0(1−π0)
n
z =0.42− 0.54√
0.54(1−0.54)100
= −2.41
z ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.Les intentions de vote dans le Nord et le Pas-De-Calais sont significativementdifferentes .
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 58 / 103
Grands echantillons n ⩾ 30 Comparaison d’une proportion observee a une proportion theorique
Test sur une proportion
Remarques
Test bilateral → H1 : π = π0
Calcul de la p-value :
P(Z > |z |) = 2P(Z > z) = 2× P(Z > 2.41) = 0.0159
Comme P(Z > |z |) < 0.05, on rejette H0
Si la methodologie d’echantillonnage est bonne (la difference n’est pas due aun echantillon peu representatif)
Inference a la population du Pas-De-Calais : La proportion d’intention devote pour le candidat est significativement plus faible que dans le Nord.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 59 / 103
Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants
Comparaison de deux proportions / echantillonsindependants
Exemple : comparaison de l’efficacite de deux medicaments
Objectif : On veut montrer qu’il y a une difference d’efficacite entre unmedicament classique et un nouveau medicament.
Dans la population de malades prenant le medicament classique, on considerequ’il y a une proportion π1 de guerison a 1 mois.
Dans la population de malades prenant le nouveau medicament, on considere qu’ily a une proportion π2 de guerison a 1 mois.
On dispose de deux echantillons :
Medic. classique (n1 = 50) observant π1 = 65% de guerison a 1 mois.
Nouveau medic. (n2 = 50) observant π2 = 75% de guerison a 1 mois.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 61 / 103
Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants
Comparaison de deux proportions / echantillonsindependants
1. Choix des hypotheses
H0 : Les deux medicaments ont la meme efficacite
H1 : Les deux medicaments ont une efficacite differente
H0 : π1 = π2
H1 : π1 = π2
2. Choix d’un risque α
α = 5%
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 62 / 103
Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants
Comparaison de deux proportions / echantillonsindependants
3. Choix de la statistique de test
Z =π1 − π2 − (π1 − π2)√
π1(1−π1)n1
+ π2(1−π2)n2
∼ N (0, 1)
Sous H0, π1 = π2, donc :.
......
Z =π1 − π2√
π1(1−π1)n1
+ π2(1−π2)n2
∼ N (0, 1)
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 63 / 103
Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants
Comparaison de deux proportions / echantillonsindependants
4. Determination de la region critique W
z0.975!z0.975 0
N (0, 1)
2.5%2.5% 95%
W =]−∞;−z0.975] ∪ [z0.975; +∞[
W =]−∞;−1.96] ∪ [1.96;+∞[
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 64 / 103
Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants
Comparaison de deux proportions / echantillonsindependants
5. Calcul de Z sur l’echantillon et conclusions
z =π1 − π2√
π1(1−π1)n1
+ π2(1−π2)n2
z =0.65− 0.75√
0.65(1−0.65)50 + 0.75(1−0.75)
50
= −1.10
z /∈ W donc on ne rejette pas H0 au risque de seconde espece β non quantifiable.A la vue des donnees, il n’y a pas de difference d’efficacite significative entre lenouveau medicament et le classique.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 65 / 103
Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants
Comparaison de deux proportions / echantillonsindependants
Remarques - 1
Test bilateral → H1 : π1 = π2
Calcul de la p-value :
P(Z > |z |) = 2P(Z > z) = 2× P(Z > 1.10) = 0.2713
Comme P(Z > |z |) > 0.05, on ne rejette pas H0
Causes probables du non-rejet de H0 :
Les deux medicaments ont effectivement des efficacites identiques (H0 vraie)
On ne dispose de pas assez d’individus pour montrer une differencesignificative (puissance statistique)
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 66 / 103
Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants
Comparaison de deux proportions / echantillonsindependants
Remarques - 2
Si l’on considere deux echantillons (n1 = 200) et (n2 = 200) dans lesquels lesproportions de guerison a 1 mois sont identique (π1 = 0.65 et π2 = 0.75), alors :
z =0.65− 0.75√
0.65(1−0.65)200 + 0.75(1−0.75)
200
= −2.19
P − value = 0.0285 < α
Le test est significatif : il y a une difference d’efficacite entre le nouveaumedicament et le classique. Le premier semble est plus efficace que le deuxieme.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 67 / 103
Grands echantillons n ⩾ 30 Comparaison de deux proportions / Echantillons independants
Comparaison de deux proportions / echantillonsindependants
Remarques - 3
La puissance d’un test est en partie fonction du nombre d’observationsdisponibles
Theoriquement, plus on augmente le nombre d’observations, plus le test seracapable de detecter une difference infime comme significative
En pratique : on se fixe une difference clinique minimale (ex : 10%)...
Estimation du nombre de sujets necessaires...
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 68 / 103
Petits echantillons n < 30 Comparaison d’une moyenne observee a une moyenne theorique
Test T de Student
Remarques preliminaires :
Le principe est tres proche du test Z
On doit supposer que X ∼ N (µ, σ) dans la population
Retour a l’exemple sur le QI des prisonniers
Objectif : on cherche a determiner si le QI des prisonnier est le meme (enmoyenne) que le QI de la population generale distribue selon une loi normale demoyenne : µ0 = 100, et d’ecart-type σ.
Considerons la population de prisonniers dans laquelle le QI est distribue selon uneloi normale de moyenne µ et d’ecart-type σ′.
Soit un echantillon de n = 10 prisonniers sur lequel on calcul la moyenneempirique x = 85 et l’ecart-type empirique sn−1 = 10.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 71 / 103
Petits echantillons n < 30 Comparaison d’une moyenne observee a une moyenne theorique
Test T de Student
1. Choix des hypotheses
H0 : le QI moyen des prisonniers est identique a celui de la populationgenerale (H0 : µ = µ0)
H1 : le QI moyen des prisonniers est different de celui de la populationgenerale (H1 : µ = µ0)
2. Choix d’un risque α
α = 5%
3. Choix de la statistique de test et de sa loi sous H0
Sous H0,.
......T =
X − µ0
Sn−1/√n∼ Tn−1 d.d.l
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 72 / 103
Petits echantillons n < 30 Comparaison d’une moyenne observee a une moyenne theorique
Test T de Student
4. Determination de la region critique W
t0.975, 9!t0.975, 9 0
T(9 ddl)
2.5% 2.5%95%
W =]−∞;−t0.975,, 9ddl ] ∪ [t0.975,, 9ddl ; +∞[
W =]−∞;−2.26] ∪ [2.26;+∞[
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 73 / 103
Petits echantillons n < 30 Comparaison d’une moyenne observee a une moyenne theorique
Test T de Student
5. Calcul de T sur l’echantillon et conclusions
t =x − µ0
sn−1/√n
t =85− 100
10/√10
= −4.74
t ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.La moyenne observee sur l’echantillon est significativement differente de lamoyenne theorique.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 74 / 103
Petits echantillons n < 30 Comparaison d’une moyenne observee a une moyenne theorique
Test T de Student
Remarques
Test bilateral → H1 : µ = µ0
Calcul de la p-value :
P(T9ddl > |t|) = 2P(T9ddl > t) = 2× P(T9ddl > 4.74) = 0.001
Comme P(T > |t|) < 0.05, on rejette H0
Si la methodologie d’echantillonnage est bonne (la difference n’est pas due aun echantillon peu representatif)
Inference a la population des prisonniers : Le QI des prisonniers est enmoyenne inferieur a celui de la population generale
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 75 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants
Conditions necessaires au Test T de Student
Remarques preliminaires :
On doit supposer que dans la population :
X1 ∼ N (µ1, σ1)
X2 ∼ N (µ2, σ2)
On distingue deux cas de figure :
...1 σ21 = σ2
2
...2 σ21 = σ2
2
Pour differencier ces deux cas, on procede a un test de comparaison de deuxvariances
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 77 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants
Test F - Comparaison de deux variances
Considerons :X1 ∼ N (µ1, σ1) et X2 ∼ N (µ2, σ2)
Les hypotheses du test
H0 : σ21 = σ2
2
H1 : σ21 > σ2
2
Soient deux echantillons de taille n1 et n2 :
S21 =
1
n1 − 1
n1∑i=1
(X1i − X1)2 et S2
2 =1
n2 − 1
n2∑i=1
(X2i − X2)2
Statistique de test sous H0
.
......F =
S21
S22
∼ F(n1−1,n2−1)ddl
En pratique :
Test unilateral a droiteOn prend la valeur la plus elevee entre s21 et s22 comme numerateur de lastatistique de testLe rapport est ⩾ 1.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 78 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants
Test F - Comparaison de deux variances
Region critique W
Fn1!1,n2!1
5%
f1!!n1!1,n2!1
0 1 2 3 4 5 6
W = [f 1−αn1−1,n2−1; +∞[
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 79 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants
Test F - Comparaison de deux variances
Remarques
Les variances σ1 et σ2 sont dites homogenes si le test F est non significatif
→ Notion d’homoscedasticite
Si le test est significatif, les variances sont dites heterogenes
→ Notion d’heteroscedasticite
Le test necessite la normalite de X1 et X2
X1 et X2 doivent etre independantes
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 80 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants
Test de T de Student
Exemple : patients diabetiques et taux de mauvais cholesterol (LDL)
Objectif : on desire savoir si le LDL est different entre les patients diabetiques etles personnes saines.
En population generale, on considere que le LDL chez les diabetiques est distribueselon une loi normale de moyenne µ1 et d’ecart-type σ1.
En population generale, on considere que le LDL chez les personnes saines estdistribue selon une loi normale de moyenne µ2 et d’ecart-type σ2.
On dispose de 2 groupes de sujets :
Malades (n1 = 25) : x1 = 1.8, s1 = 0.5
Temoins (n2 = 20) : x2 = 1.3, s2 = 0.2
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 81 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants
Test de T de Student
1. Choix des hypotheses
H0 : Le LDL est identique entre les temoins et les malades
H1 : Le LDL est different entre les temoins et les malades
H0 : µ1 = µ2
H1 : µ1 = µ2
2. Choix d’un risque α
α = 5%
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 82 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants
Test de T de Student
3. Choix de la statistique de test...1 Si σ2
1 = σ22 = σ2, alors sous H0 :
.
......
T =X1 − X2
S√
1n1
+ 1n2
∼ Tn1+n2−2 ddl
Avec S2 l’estimateur de la variance commune σ2..
......S2 =
(n1 − 1)S21 + (n2 − 1)S2
2
n1 + n2 − 2
...2 Si σ21 = σ2
2 , alors sous H0 :
.
......
T =X1 − X2√S21
n1+
S22
n2
∼ Tn1+n2−2 ddl
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 83 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants
Test T de Student
4. Determination de la region critique W
t0.975, 43!t0.975, 43 0
T(43 ddl)
2.5% 2.5%95%
W =]−∞;−t0.975,, 43ddl ] ∪ [t0.975,, 43ddl ; +∞[
W =]−∞;−2.017] ∪ [2.017;+∞[
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 84 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants
Test T de Student
5. Calcul de T sur l’echantillon et conclusions
Il faut tout d’abord tester l’egalite des variances σ21 et σ2
2 :
On pose un risque α = 5%
H0 : σ21 = σ2
2
H1 : σ21 > σ2
2
f =s21s22
=(0.5)2
(0.1)2= 25
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 85 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants
Test T de Student
Region critique W
F24,19
5%
f0.9524,19
0 1 2 3
W = [f 0.9524,19; +∞[
W = [2.11;+∞[
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 86 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants
Test T de Student
f ∈ W donc on rejette H0 avec un risque α de premiere espece.
Les variances σ21 et σ2
2 sont differentes. (Heteroscedasticite).
Pour le test de Student, on choisit donc comme statistique de test :
T =X1 − X2√S21
n1+
S22
n2
∼ Tn1+n2−2 ddl
t =1.8− 1.3√(0.5)2
25 + (0.2)2
20
= 4.56
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 87 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants
Test T de Student
t ∈ W =]−∞;−2.017] ∪ [2.017;+∞[ donc on rejette H0 avec un risque α depremiere espece.
La moyenne observee sur l’echantillon de malades est significativement differentede la moyenne chez les temoins.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 88 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons independants
Test T de Student
Remarques
Test bilateral → H1 : µ1 = µ2
Calcul de la p-value :
P(T > |t|) = 2P(T > t) = 2× P(T > 4.56) ≈ 4.10−6
Comme P(T > |t|) ≪ 0.05, on rejette H0
Si la methodologie d’echantillonnage est bonne (la difference n’est pas due ades echantillons peu representatifs)
Inference a la population de malades : Le LDL est en moyenne superieur acelui de la population generale.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 89 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies
Test T de Student sur echantillons apparies
Exemple : Traitement du diabete 1
Objectif : On desire etudier l’effet d’une nouvelle strategie de traitement dudiabete en mesurant l’effet sur la glycemie. On dose la glycemie (g/L) chez 15sujets avant le debut du nouveau protocole et 3 mois apres.
Dans la population de malades, on pose :
X1 la mesure de glycemie avant TTT
X2 la mesure de glycemie apres TTT (3 mois apres)
D = X1 − X2 une va distribuee selon une loi normale d’esperance µD et devariance σ2
D
1. Statistique - Epidemiologie, T. Ancelle, p. 141Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 91 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies
Test T de Student sur echantillons apparies
Exemple : Traitement du diabete
Sur l’echantillon
Les mesures sont appariees car elles sont effectuees sur les memes individus.
La moyenne des differences entre les mesures :
d = 0.1
L’ecart-type des differences entre les mesures :
sD = 0.091
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 92 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies
Test T de Student pour echantillons apparies
1. Choix des hypotheses
H0 : les glycemies sont identiques avant et apres le nouveau protocole
H1 unilaterale : la glycemie est reduite grace au nouveau protocole
H0 : µD = 0
H1 : µD = ∆, ∆ > 0
2. Choix d’un risque α
α = 5%
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 93 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies
Test T de Student pour echantillons apparies
3. Choix de la statistique de test
T =D −∆
SD/√n∼ Tn−1 ddl
Or sous H0, ∆ = 0, donc :.
......
T =D
SD/√n∼ Tn−1 ddl
AvecD = X1 − X2
et
SD =
√√√√ n
n − 1
[1
n
n∑i=1
D2i −
(D)2]
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 94 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies
Test T de Student pour echantillons apparies
Region critique W
t0.95, 140
T(14 ddl)
5%95%
W = [t0.95, 14; +∞[
W = [1.761;+∞[
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 95 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies
Test T de Student pour echantillons apparies
5. Calcul de T sur l’echantillon et conclusions
t =d
sD/√n
z =0.1
0.91/√15
= 4.25
t ∈ W donc on rejette H0 au risque de premiere espece α = 5% de se tromper.La glycemie est significativement plus basse apres administration de la nouvellestrategie.
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 96 / 103
Petits echantillons n < 30 Comparaison de deux moyennes / Echantillons apparies
Test T de Student pour echantillons apparies
Remarques
Test unilateral → H1 : µD > 0
Calcul de la p-value :
P(T14ddl > t) = P(T14ddl > 4.25) ≈ 4.10−4
Comme P(T > t) ≪ 0.05, on rejette H0
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 97 / 103
Conclusions
Tests de comparaison
Les tests de comparaison servent a comparer des parametres entre des populationsdifferentes.
2 types :
Comparaison d’un echantillon observe a une population de reference
Comparaison de deux echantillons observes (les deux populations sontinconnues)
Le principe fondamental est le test de la difference des deux parametres.
Sous H0 cette difference est en moyenne nulle
Sous H1 cette difference est en moyenne non-nulle
Sous H0, la loi de probabilite de cette difference est toujours connue !!
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 99 / 103
Conclusions
Tests de comparaison
Porter une attention double sur :
Le type de parametres en jeu (moyennes, proportions, variances...)
Les conditions d’application du test
Distinguer deux cas de figure :
n ⩾ 30
n < 30
Se poser la question :
Les echantillons sont-ils independants ?
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 100 / 103
Conclusions
Tests de comparaison - Resume
Test Comparaison Conditions d’applications
Test Z moyenne observee/theorique n ⩾ 30
2 moyennes n1 et n2 ⩾ 30
2 moyennes appariees n ⩾ 30
Test T moyenne observee/theorique X1 ∼ N (µ, σ)
2 moyennes X1 ∼ N (µ1, σ1) et X2 ∼ N (µ2, σ2)
2 moyennes appariees (X1 − X2) = D ∼ N (µD , σD)
Test sur % prop. observee/prop. theorique n ⩾ 30 et min{np, n(1 − p)} > 5
2 proportions n1, n2 ⩾ 30min{nip,ni (1 − pi )} > 5, i = 1, 2
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 101 / 103
Conclusions
Tests de comparaison - Resume
Il reste des cas de figure sans reponse !!
n ⩾ 30 et comparaison de deux proportions sur echantillons apparies
Ex : % avant et apres un TTT chez les meme individus→ χ2 de McNemar
n < 30 Comparaison de moyennes (ind. ou apparies) et conditions denormalite non respectees
→ Test non parametrique : Test de Wilcoxon pour echantillons inde.→ Test non parametrique : Test de Wilcoxon pour echantillons apparies
Comparaison de plus de 2 moyennes
n ⩾ 30 → ANOVAn < 30 → si normalite alors ANOVAn < 30 → si non normalite alors Test de Kruskal - Wallis
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 102 / 103
Conclusions
Allons plus loin...
Cours essentiellement base sur les tests de comparaison.
On peut tester la liaison entre deux variables :
2 variables qualitatives
Ex : Existe-t-il un lien significatif entre le fait d’etre malade (non malade) et lesexe ?→ Test du χ2 d’independance
2 variables quantitatives
Ex : Existe-t-il un lien significatif entre le taux de prothrombine et l’age ?→ Test sur le coefficient de correlation / Regression lineaire
Michael Genin (Universite de Lille 2) Tests statistiques Version - 19 fevrier 2015 103 / 103