probabilité échantillonage

45
Probabilit´ es - ´ Echantillonnage A. Fredet J.-M. Gourdon Table des mati` eres I Probabilit´ es 2 1 efinitions 2 2 Combinaisons, Arrangements 3 3 Probabilit´ es liant deux ´ ev´ enements 6 4 Probabilit´ es et statistiques 8 5 Variable al´ eatoire 9 6 Lois binomiales 13 7 Lois de Poisson 14 8 Lois normales 15 9 Solutions des exercices 20 II ´ Echantillonnage 30 1 ´ Echantillons 30 2 Estimation 30 3 Test d’ajustement 33 4 Comparaison d’´ echantillons 37 5 Solutions des exercices 40 III Tableur 45 1

Upload: taha-can

Post on 08-Jun-2015

2.460 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Probabilité   échantillonage

Probabilites - Echantillonnage

A. FredetJ.-M. Gourdon

Table des matieres

I Probabilites 2

1 Definitions 2

2 Combinaisons, Arrangements 3

3 Probabilites liant deux evenements 6

4 Probabilites et statistiques 8

5 Variable aleatoire 9

6 Lois binomiales 13

7 Lois de Poisson 14

8 Lois normales 15

9 Solutions des exercices 20

II Echantillonnage 30

1 Echantillons 30

2 Estimation 30

3 Test d’ajustement 33

4 Comparaison d’echantillons 37

5 Solutions des exercices 40

III Tableur 45

1

Page 2: Probabilité   échantillonage

Probabilites 1 DEFINITIONS

Premiere partie

Probabilites

1 Definitions

La probabilite a priori, subjective, d’un evenement est un nombre qui caracterise la croyance quel’on a que cet evenement sera realise avec plus ou moins de certitude avant l’execution de l’experience :l’evenement sera realise (probabilite 1) et l’evenement ne sera pas realise (probabilite 0).

Definition 1.1 Une epreuve est dite aleatoire si repetee dans des conditions identiques, elle donnedes resultats variables.Des evenements sont equiprobables s’ils ont la meme probabilite d’etre realises. Dans ce cas, la proba-bilite d’un evenement A est nombre de cas favorables

nombre de cas possibles .

Definition 1.2 L’ensemble de toutes les eventualites d’une experience aleatoire s’appelle l’univers. Engeneral, on le note Ω.

Exemple 1.1 On lance un de non truque a six faces numerotees de 1 a 6 et on note le nombre figurantsur la face superieure du de. Lancer ce de et noter le nombre figurant sur une des faces est une experiencedont on ne peut pas prevoir le resultat compris dans l’ensemble 1, 2, · · · , 6. Les eventualites sont 1,2, 3, 4, 5 et 6 et Ω = 1, 2, 3, 4, 5, 6.Si le de est non truque, chaque face a la meme probabilite de sortir, nous avons donc des evenementsequiprobables.Par exemple, on peut considerer l’evenement A = obtenir un nombre pair . On a A = 2; 4; 6 et laprobabilite que A se produise est 3

6 = 12 .

Definition 1.3 Un evenement est dit impossible s’il ne se realise jamais.Un evenement est dit certain s’il se realise toujours.Un evenement est dit elementaire s’il se reduit a une seule eventualite.

Proposition 1.1 Soient E,E1, E2 des evenements.1. p(E) ≥ 0 pour tout evenement E.2. p(Ω) = 1 donc l’evenement est certain3. p(∅) = 0 donc l’evenement est impossible

4. Si E1 ∩ E2 = ∅ alors E1 et E2 sont incompatibles etp(E1 ∪E2) = p(E1 ouE2) = p(E1) + p(E2),p(E1 ∩ E2) = p(E1 etE2) = 0

On en deduit les consequences suivantes :1. Si E est l’evenement contraire de E alors p(E) = 1− p(E).

En effet E ∪ E = Ω et E ∩ E = ∅ donc p(E ∪ E) = p(E) + p(E) = 1.2. Pour tout evenement E, 0 ≤ p(E) ≤ 1.

En effet, pour tout E, p(E) ≥ 0 et donc p(E) = 1− p(E) ≥ 0 ce qui nous amene a p(E) ≤ 1.

Exercice 1.1 On joue avec un de a six faces non truque. On effectue un lancer, et on considere lesdeux evenements suivants : E1 =le nombre est 3 ou 4 et E2 =le nombre est pair. Calculer p(E1), p(E2),p(E1 ∩ E2) et p(E1 ∪ E2).

Exercice 1.2 On joue avec deux des a six faces non truques. On lance les deux des et on effectuela somme des nombres obtenus. On considere les evenements suivants : E1 =la somme est 5, E2 =lasomme est 7 et E3 =la somme est paire. Calculer p(E1), p(E2), p(E3), p(E1∩E2), p(E1∩E3), p(E2∩E3)et p(E1 ∪ E2), p(E1 ∪ E3) et p(E2 ∪ E3).

2 A. Fredet & J.-M. Gourdon

Page 3: Probabilité   échantillonage

Probabilites 2 COMBINAISONS, ARRANGEMENTS

La probabilite de realisation d’un evenement peut etre consideree comme le rapport du nombre de casfavorables sur le nombre de cas possibles. Le calcul d’une probabilite peut donc souvent se ramener aun probleme de denombrement.

2 Combinaisons, Arrangements

Definition 2.1 Soit E un ensemble non vide de n elements. Une permutation de E est une listeordonnee des n elements de E.

Exemple 2.1 Si E = a, b, c, d, e alors (a, b, d, c) et (a, c, d, b) sont deux permutations de E.

Proposition 2.1 Le nombre de permutations d’un ensemble de n elements, n ≥ 1, est egal a

n! = n× (n− 1)× (n− 1)× · · · × 2× 1

Definition 2.2 Une liste sans repetition de p elements de E est une liste ordonnee de p elements deE deux a deux distincts

Exercice 2.1 Une urne contient dix boules sur lesquelles ont ete marquees les dix lettres de l’alphabetde A a J . On tire successivement quatre boules sans remise et l’on inscrit dans l’ordre les lettres porteespar les boules tirees. Combien de mots de quatre lettres (ayant un sens ou non) peut-on former ?

Exercice 2.2 Combien de mots de trois lettres peut-on former en utilisant les lettres du mot PARISet uniquement celles-la ?

Proposition 2.2 Si un ensemble E contient n elements, n ≥ 1, alors– il y a n× (n− 1)× · · · × (n− (p− 1)) = n!

(n−p)! listes sans repetition de p elements.– il y a np liste avec repetition de p elements.

Exercice 2.3 Lors d’une course de chevaux, il y a 8 partants. Combien de possibilites y-a-t-il pour letierce final ? Pour le quarte ?

Exercice 2.4 Combien de nombres de 4 chiffres puis-je ecrire en utilisant uniquement les chiffres3,6,7 ?

Exercice 2.5 Un facteur (employe de la poste) entre dans un immeuble avec 23 lettres qu’il va deposerdans les boites, au nombre de 40. Sachant qu’une boite peut evidemment recevoir plusieurs lettres, decombien de facon differentes les 23 lettres peuvent-elles etre deposees dans les 40 boites ?

Nous pouvons egalement chercher a selectionner k objets parmi n objets discernables, sans tenir comptede l’ordre. Ces k objets peuvent etre representes par une partie a k elements d’un ensemble a n elements.

Definition 2.3 Soit E un ensemble de n elements et p un entier tel que 0 ≤ p ≤ n. Une combinaisonde p elements de E est un sous-ensemble de E qui contient p elements.

Le nombre de combinaisons de p elements d’un ensemble de n elements est note(np

)ou Cpn.

Proposition 2.3

Cpn =n!

(n− p)!p!=n× (n− 1)× · · · × (n− p+ 1)

p!

3 A. Fredet & J.-M. Gourdon

Page 4: Probabilité   échantillonage

Probabilites 2 COMBINAISONS, ARRANGEMENTS

Exercice 2.6 Un facteur (employe de la poste) entre dans un immeuble avec 23 lettres qu’il va deposerdans les boites, au nombre de 40. En supposant qu’une boite ne peut pas recevoir plusieurs lettres, decombien de facon differentes les 23 lettres peuvent-elles etre deposees dans les 40 boites ?

Exercice 2.7 On appelle main toute combinaison de cinq cartes. Combien y a-t-il de mains de cinqcartes dans un jeu de 32 cartes ?

Exercice 2.8 On appelle main toute combinaison de cinq cartes. Dans un jeu de 32 cartes, combieny a-t-il de mains de cinq cartes contenant exactement 2 coeurs ?

Exercice 2.9 On appelle main toute combinaison de cinq cartes. Dans un jeu de 32 cartes, combieny a-t-il de mains de cinq cartes contenant au moins un roi ?

Exercice 2.10 Lors d’un tirage du loto de 4 numeros avec 10 boules, combien y-a-t-il de grilles pos-sibles ?

Proposition 2.4 On aCpn = Cn−pn

etCp−1n−1 + Cpn−1 = Cpn

Demo :

1. Choisir les p elements que l’on veut dans un ensemble de n elements revient exactement a choisirles n− p elements que l’on ne veut pas, d’ou le resultat.Mathematiquement, on a

Cn−pn =n!

(n− p)![n− (n− p)]!=

n!(n− p)!p!

= Cpn

2. Soit E une ensemble de n element. Soit A l’un de ces elements. Pour choisir p elements de E, jepeux soit prendre A et en choisir p−1 autres parmi les n−1 restants (j’ai alors Cp−1

n−1 possibilites),soit laisser A et en prendre p autres parmi les n− 1 restants (j’ai alors Cpn−1 possibilites). D’oule resultat.Mathematiquement, on a

Cp−1n−1 + Cpn−1 =

(n− 1)!(p− 1)!(n− p)!

+(n− 1)!

p!(n− p− 1)!

=p(n− 1)!p!(n− p)!

+(n− p)(n− 1)!p!(n− p)!

=(p+ n− p)(n− 1)!

p!(n− p)!

=n!

p!(n− p)!= Cpn

Proposition 2.5 (Formule du binome) Soient a et b deux reels et n un entier. Alors

(a+ b)n =n∑i=0

Cinaibn−i

Demo :Par iteration sur n :

– Si n = 0, alors (a+ b)n = (a+ b)0 = 1 = C0n

– Si n = 1 alors (a+ b)1 = a+ b = C01a

1b0 + C11a

0b1

– Si n = 2 alors (a+ b)2 = a2 + 2ab+ b2 = C02a

2b0 + C12a

1b1 + C22a

0b2

4 A. Fredet & J.-M. Gourdon

Page 5: Probabilité   échantillonage

Probabilites 2 COMBINAISONS, ARRANGEMENTS

– Si n = 3 alors

(a+ b)3 = a3 + 3ab2 + 3a2b+ b3

= C03a

3 + C13a

2b1 + C23a

1b2 + C33b

3

– On suppose maintenant que la formule est vraie pour (a + b)n−1 et donc que (a + b)n−1 =∑n−1i=0 C

pn−1a

ib(n−1)−i. On a

(a+ b)n = (a+ b)n−1 × (a+ b)

=

(n−1∑i=0

Cin−1aib(n−1)−i

)× (a+ b)

=n−1∑i=0

Cin−1ai+1b(n−1)−i +

n−1∑i=0

Cin−1aib(n−1)−i+1

=n−1∑i=0

Cin−1ai+1bn−(1+i) +

n−1∑i=0

Cin−1aibn−i

=n∑

j=1

Cj−1n−1a

jbn−j +n−1∑i=0

Cin−1aibn−i

=n−1∑j=1

Cj−1n−1a

jbn−j+Cn−1n−1anb0 +

n−1∑i=1

Cin−1aibn−i + C0

n−1a0bn

=n−1∑i=1

(Ci−1n−1 + Cin−1

)ajbn−j + an + bn

=n−1∑i=1

Cinaibn−i + an + bn =

n∑i=0

Cinaibn−i

d’ou le resultat 2

Triangle de PascalPour calculer les coefficients du binome, on utilise le triangle de Pascal : Le principe est le suivant :

∗→+ ∗

=↓∗

n = 0 1n = 1 1 +→ 1 (a+ b) = a+ b

↓=n = 2 1 2 +→ 1 (a+ b)2 = a2 + 2ab+ b2

↓=n = 3 1 +→ 3 3 1 (a+ b)3 = a3 + 3a2b+ 3ab2 + b3

↓=n = 4 1 4 +→ 6 4 +→ 1 (a+ b)4 = a4 + 4a3b+ 6a2b2 + 4ab3 + b4

↓= ↓=n = 5 1 5 10 10 5 1 (a+ b)5 = a5 + 5a4b+ 10a3b2 + 10a2b3 + 5ab4 + b5

...

5 A. Fredet & J.-M. Gourdon

Page 6: Probabilité   échantillonage

Probabilites 3 PROBABILITES LIANT DEUX EVENEMENTS

3 Probabilites liant deux evenements

On s’interesse parfois a une probabilite portant sur deux evenements, qu’ils soient independants ounon.

Definition 3.1 Soient A et B deux evenements.La probabilite que A ET B soient realises est p(A ∩B).La probabilite que A OU B soient realises est p(A ∪B).

Proposition 3.1 Soient A et B deux evenements. On a p(A ∪B) = p(A) + p(B)− p(A ∩B).

Demo :

1. Si A∪B = ∅ alors A et B sont incompatibles donc p(A∪B) = p(A)+p(B) et p(A∩B) = p(∅) = 0

2. Si A ∩B 6= ∅ alors A ∪B = (A ∩B) ∪ (A ∩B) ∪ (A ∪ B) d’apres le tableau suivant :

A A

B A ∩B A ∩B

B A ∩ B A ∩ B

Donc p(A ∪ B) = p(A ∩ B) + p(A ∩ B) + p(A ∪ B) car (A ∩ B) ∩ (A ∩ B) ∩ (A ∪ B) = ∅. Orp(A) = p(A ∩ B) + p(A ∪ B) car (A ∩ B) ∩ (A ∪ B) = ∅ et (A ∩ B) ∪ (A ∪ B) = A. De memep(B) = p(A ∩B) + p(A ∪B) d’ou p(A ∪B) = p(A) + p(B)− p(A ∩B).

Exercice 3.1 Dans un jeu de 32 cartes, on tire une carte. Quelle est la probabilite d’avoir soit un roi,soit un trefle ?

Exercice 3.2 Considerons un jeu de 32 cartes. Soit A l’evenement tirer deux coeurs et B l’evenementtirer deux figures. Quelles sont les probabilites de A, B, A ∪B et A ∩B ?

Exercice 3.3 Deux candidats A et B passent, dans deux centres differents, un examen avec des pro-babilites de reussites estimees respectivement a 3

4 et 23 . Calculer la probabilite

1. que les 2 candidats soient recus ?2. que les 2 candidats echouent ?3. que le candidat A soit seul recu ?

4. qu’un seul des deux candidats reussise ?5. qu’au moins 1 des candidats soit recu ?

Exercice 3.4 On dispose de deux urnes, designees respectivement par les lettres A et B. L’urne Acontient 5 boules bleues et 4 boules rouges. L’urne B contient 6 boules bleues et 5 boules rouges. Ontire une boule dans chaque urne. Quelle est la probabilite

1. de tirer deux boules rouges ?2. de tirer deux boules bleues ?

3. de tirer deux boules de meme couleur ?4. de tirer deux boules de couleurs differentes ?

Exercice 3.5 On considere 3 des differents, identifies par leur couleur. Le joueur A gagne la partie sile total des points est 11, le joueur B gagne si le total des points est 12. L’un des joueurs a-t-il plus dechance de gagner ?

6 A. Fredet & J.-M. Gourdon

Page 7: Probabilité   échantillonage

Probabilites 3 PROBABILITES LIANT DEUX EVENEMENTS

Exercice 3.6 Un concours de tir met aux prises deux equipes de deux joueurs. Chaque joueur del’equipe peut marquer 0,1 ou 2 points avec les probabilites suivantes :

equipe jaune equipe verte0 1 2 0 1 2

joueur A 0, 4 0, 4 0, 2 joueur C 0, 3 0, 5 0, 2joueur B 0, 3 0, 4 0, 3 joueur D 0, 5 0, 3 0, 2

Les resultats des differents joueurs et des differentes equipes sont independants entre eux. Soit X lavariable aleatoire egale au nombre de points marques par l’equipe jaune et Y la variable aleatoire egaleau nombre de points marques par l’equipe verte.

1. Determiner les distributions de probabilite de chacune des variables aleatoires X et Y .

2. Calculer la probabilite de l’evenement “il y a match nul”.

Definition 3.2 Soient A et B sont deux evenements associes a un univers tels que p(A) 6= 0 ; Laprobabilite de l’evenement B sachant que A est realise est :

pA(B) = p(B/A) =p(A ∩B)p(A)

Proposition 3.2 On a

p(A ∪B) = p(A)× p(B/A) = p(B)× p(A/B).

Definition 3.3 Deux evenements sont independants si p(A/B) = p(A) ou p(B/A) = p(B), soit encoresi p(A ∪B) = p(A)p(B).Deux evenements sont incompatibles si A∩B = ∅ et dans ce cas, p(A∩B) = 0 d’ou pA(B) = pB(A) = 0

Proposition 3.3 Si A est inclus dans B alors p(A ∩B) = p(A) et pB(A) = 1.

Exercice 3.7 Une urne contient 15 boules numerotees de 1 a 15. On tire une boule au hasard. On saitque le numero tire est impair. Quelle est la probabilite que ce numero soit aussi multiple de 3 ?

Exercice 3.8 A la fin de leur montage, on soumet des ampoules electriques a des tests de conformitequi ne sont pas fiables a 100%. Si une ampoule est conforme, on le dit dans 96 % des cas (et donc dans4 % des cas, une ampoule bonne est jetee). Si une ampoule est defectueuse, le test le detecte dans 94%des cas (et donc dans 6% des cas, on garde l’ampoule). On remarque que en moyenne 8% des ampoulessont defectueuses. On cherche a estimer la fiabilite du test :

1. Sachant que le test est positif, quelle est la probabilite que l’ampoule soit effectivement conforme ?

2. Sachant que le test est negatif, quelle est la probabilite que l’ampoule soit effectivement defectueuse ?

Exercice 3.9 Deux ateliers fabriquent les memes pieces. La cadence du premier atelier est le doublede celle du deuxieme. Il y a 3% de pieces defectueuses dans l’atelier 1 et 4% dans l’atelier 2. On preleveune piece au hasard. Calculer la probabilite des evenements suivants :

1. La piece provient de l’atelier 1,

2. La piece est defectueuse,

3. La piece provient de l’atelier 1, sachant qu’elle est defectueuse.

7 A. Fredet & J.-M. Gourdon

Page 8: Probabilité   échantillonage

Probabilites 4 PROBABILITES ET STATISTIQUES

Exercice 3.10 Dans une population donnee, 15 % des individus ont la maladie Ma. Parmi eux, 20%ont une maladie Mb. Parmi les personnes non atteintes par Ma, 4% ont la maladie Mb. On considereun individu. Calculer la probabilite des evenements suivants :

1. Il a la maladie Ma

2. Il a la maladie Mb sachant qu’il a Ma

3. Il a la maladie Mb sachant qu’il n’a pas Ma

4. Il a la maladie Ma et la maladie Mb

5. Il n’a pas la maladie Ma mais il a la maladie Mb

6. Il a la maladie Mb

7. Il a la maladie Ma sachant qu’il a Mb

Exercice 3.11 Trois etudiants A, B et C passent un examen le meme jour. Les trois examens sontdifferents et se passe dans des lieux differents. Les probabilites de succes sont estimees a 0,7 pour A,0,4 pour B et 0,6 pour C. Calculer la probabilite

1. que les 3 soient recus2. que les trois echouent3. que A seulement soit recu4. qu’un seul reussise

5. que B soit le seul a echouer6. qu’exactement deux soient recus7. qu’au moins un soit recu

Exercice 3.12 Une urne contient x boules dont 3 sont blanches, les autres etant rouges.

1. A l’occasion d’un tirage sans remise de deux boules, la probabilite d’obtenir une boule blanchepuis une boule rouge est 1

4 . Calculer le nombre de boules dans l’urne.

2. Meme question si le tirage est effectue avec remise

4 Probabilites et statistiques

De nombreux problemes peuvent etre regardes sous un aspect statistique et sous un aspect proba-biliste :

Exemple 4.1 Une population est compose de 47% d’hommes et de 53% de femmes. On suppose que24 % des hommes et que 34 % des femmes ont les yeux verts. Les hommes aux yeux verts representent24 % de 47 % de la population, soit 24

100 ×47100 = 1128

10000 = 0, 1128 = 11, 28%. On peut remplir le tableausuivant :

homme femmeyeux verts 0, 47× 0, 24 = 0, 1128 0, 53× 0, 34 = 0, 1802 0, 2930

yeux pas verts 0, 47× 0, 76 = 0, 3572 0, 53× 0, 66 = 0, 3498 0, 7070, 47 0, 53 1

On choisit une personne au hasard.

1. la probabilite qu’elle ait les yeux verts est p(yeux verts) = 0, 293

2. la probabilite qu’elle ait les yeux verts sachant que c’est un homme est

p( yeux verts / homme ) =p( homme aux yeux verts)

p(homme)=

0, 11280, 47

= 0, 24

3. la probabilite qu’elle soit une femme sachant qu’elle n’a pas les yeux verts est

p( femme / pas yeux verts ) =p( femme aux yeux pas verts)

p(pas yeux verts)=

0, 34980, 707

≈ 0, 4947

8 A. Fredet & J.-M. Gourdon

Page 9: Probabilité   échantillonage

Probabilites 5 VARIABLE ALEATOIRE

Jouons a pile ou face, un grand nombre de fois, avec une piece non truquee. Pile et face ont la memeprobabilite, egale a 1/2, d’apparaıtre a chaque lancer. Comptabilisons les resultats au fur et a mesureet supposons que, a une etape, le nombre de tirages sur face soit superieur de 100 a celui des pile :le nombre de pile a-t-il ensuite tendance a rattraper le nombre de face ? Ceux qui jouent a pile ouface sans en connaıtre les arcanes mathematiques evoquent parfois une loi des moyennes fondee surl’intuition que les nombres de pile et de face obtenus avec une piece non truquee devraient devenir peudifferents apres un grand nombre de lancers. Pourtant les pieces n’ont pas de memoire : la probabilited’obtenir pile ou face lors d’un lancer est toujours 1/2. Ne devrait-on pas penser plutot que les totauxn’ont pas de raison de devenir egaux ?

Les memes questions se posent dans des contextes varies. Si un accident d’avion se produit enmoyenne tous les quatre mois et si trois mois se sont passes sans accident, un accident est-il imminent ?

Dans tous les cas de ce type, la reponse est non : les processus aleatoires ou, plus exactement, lesmodeles mathematiques de ces processus n’ont pas de memoire.

Il n’existe pas de loi des moyennes : les probabilites des evenements futurs ne dependent pas desresultats passes.

5 Variable aleatoire

Definition 5.1 Soient une epreuve donnee, Ω l’univers associe a cette epreuve et p une probabilitedefinie sur Ω. On appelle variable aleatoire toute fonction X de Ω dans R qui, a tout element de Ω,fait correspondre un nombre reel x.On notera X(Ω) l’ensemble des valeurs prises par la v.a. X.Une variable aleatoire est caracterisee par l’ensemble des valeurs qu’elle peut prendre et par l’expres-sion mathematique de la probabilite de ces valeurs. Cette expression s’appelle la loi de probabilite (oudistribution de probabilite) de la variable aleatoire.

Il existe plusieurs types de valeurs que peut prendre une variable aleatoire :

Variable aleatoire discrete

Definition 5.2 Une variable aleatoire est discrete si elle ne prend que des valeurs discontinues dans unintervalle donne (borne ou non borne). L’ensemble des nombres entiers est discret. En regle generale,toutes les variables qui resultent d’un denombrement ou d’une numeration sont discretes.

Exemples :– le nombre de petits par portee pour une espece animale donnee (chat, marmotte, etc.),– le nombre de bacteries dans 100 ml de preparation,– le nombre de mutations dans une sequence d’ADN de 10 kb,

sont des variables aleatoires discretes.

La loi de probabilite d’une variable aleatoire discrete est entierement determinee par les probabilitespi des evenements X = xi, xi parcourant l’univers image Ω. La loi de probabilite est donnee par les(xi, pi)i.

Exercice 5.1 Une urne contient quatre boules numerotees 10, 20, 30 et 40. On effectue trois tiragessuccessifs avec remise, c’est-a-dire qu’apres chaque tirage on replace la boule tiree dans l’urne. Leresultat d’une experience peut alors etre represente par un triplet, une liste ordonnee de trois elementsde l’ensemble E = 10, 20, 30, 40.

1. Combien y a-t-il de resultats possibles ?2. Quelle est la probabilite d’obtenir les cas suivants :

9 A. Fredet & J.-M. Gourdon

Page 10: Probabilité   échantillonage

Probabilites 5 VARIABLE ALEATOIRE

(a) La premiere boule tiree porte le numero 10, la deuxieme le numero 40, la troisieme le numero20 ?

(b) La premiere boule tiree porte le numero 30 et la deuxieme le numero 20 ?

(c) La deuxieme boule porte le numero 20 ?

Exercice 5.2 Une urne contient quatre boules numerotees 10, 20, 30 et 40. On effectue trois tiragessuccessifs sans remise, c’est-a-dire qu’apres chaque tirage on ne replace pas la boule tiree dans l’urne. Leresultat d’une experience peut alors etre represente par un triplet, une liste ordonnee de trois elementsde l’ensemble E = 10, 20, 30, 40 mais cette fois les elements du triplet sont 2 a 2 distincts.

1. Combien y a-t-il de resultats possibles ?

2. Quelle est la probabilite d’obtenir les cas suivants :

(a) La premiere boule tiree porte le numero 10, la deuxieme le numero 40, la troisieme le numero20 ?

(b) La premiere boule tiree porte le numero 30 et la deuxieme le numero 20 ?

(c) La deuxieme boule porte le numero 20 ?

Exercice 5.3 Une urne contient quatre boules numerotees 10, 20, 30 et 40. On tire simultanementtrois boules de l’urne. Le resultat d’une experience peut alors etre represente par une partie a troiselements de l’ensemble E = 10, 20, 30, 40.

1. Combien y a-t-il de resultats possibles ?

2. Quelle est la probabilite d’avoir un resultat dans lequel figure le nombre 20 ?

3. Quelle est la probabilite d’avoir un resultat dans lequel figurent les nombres 30 et 40 ?

Definition 5.3 Etant donnee une v.a. discrete X prenant les valeurs x1, x2, · · · , xn avec les probabilitesrespectives p1, p2, · · · , pn.L’esperance mathematique de X est le nombre reel note E(X) defini par :

E(X) = x1p1 + x2p2 + · · ·+ xnpn.

La variance de la v.a. X est le nombre reel note V(X) et defini par :

V (X) = E(X2)− [E(X)]2.

L’ecart type d’une v.a. X est le reel positif note s(X) et defini par :

σ(X) =√V (X).

Exercice 5.4 On joue avec deux des a quatre faces. Sur le premier de, les faces portent les numeros1, 2, 3 et 3. Sur le deuxieme de, les faces portent les numeros 1, 2, 2 et 2. Deux regles du jeu sontpossibles :

1. La partie coute 1 euro. On lance les deux des.

(a) Si la somme est 2, on gagne 6 euros

(b) Si la somme est 3 ou 4, on gagne 2 euros

(c) Si la somme est 5, on ne gagne rien

2. La partie coute 10 euros. On lance les deux des.

(a) Si la somme est 2, on gagne 60 euros

(b) Si la somme est 3 ou 4, on gagne 12 euros

10 A. Fredet & J.-M. Gourdon

Page 11: Probabilité   échantillonage

Probabilites 5 VARIABLE ALEATOIRE

(c) Si la somme est 5, on ne gagne rien

En etudiant l’esperance et l’ecart-type de chacun de ces jeux, trouver lequel est le plus interessant.

Exercice 5.5 Un automibiliste rencontre sur son trajet 5 feux de circulation tricolores. Pour chacunde ces feux, le rouge dure 15 secondes, l’orange 5 secondes et le vert 40 secondes. Les 5 feux ne sontpas synchronises et l’on suppose que les alea de la circulation sont tels que l’etat d’un feu devant lequelse presente l’automobile ne depend pas de l’etat des autres feux rencontres.

1. L’automibile se presente devant un feux. Quelle est la probabilite que ce feu soit vert ?

2. Quelle est la probabilite que sur son trajet, l’automobile rencontre exactement 3 feux verts surles 5 feux rencontres ?

3. Soit X la variable aleatoire correspondant au nombre de feux verts rencontres sur le trajet. Quelleest sa loi de probabilite et son esperance E(X) ?

Variable aleatoire continue

Definition 5.4 Une variable aleatoire est continue si elle peut prendre toutes les valeurs dans unintervalle donne (borne ou non borne). En regle generale, toutes les variables qui resultent d’une mesuresont de type continu.

Exemples :– le masse corporelle des individus pour une espece animale donnee,– le taux de glucose dans le sang,

sont des variables aleatoires continues.

Dans le cas d’une variable aleatoire continue, la loi de probabilite f(x) associe une probabilite a chaqueensemble de valeurs definies dans un intervalle donne. En effet, pour une variable aleatoire continue,la probabilite associee a l’evenement X = a est nulle, car il est impossible d’observer exactement cettevaleur. On considere alors la probabilite P (x1 ≤ X ≤ x2) que la variable aleatoire X prenne des valeurscomprises dans un intervalle [x1, x2].Si cette loi prend des valeurs comprises entre [a, b], la somme des probabilites attachees aux valeurspossibles de la variable aleatoire est egale a 1.Elle est representee par la surface sous la courbe y = f(x), ce qui revient a considerer des integrales :∫ baf(x) dx = 1. Si on s’interesse aux valeurs comprises dans un intervalle [c, d], on a et donc p(c ≤ X ≤

d) =∫ dcf(x) dx.

Definition 5.5 Etant donnee une v.a. continue X, de densite de probabilite f(x) prenant des valeurscomprises dans l’intervalle [a, b] L’esperance mathematique de X est le nombre reel note E(X) defini

11 A. Fredet & J.-M. Gourdon

Page 12: Probabilité   échantillonage

Probabilites 5 VARIABLE ALEATOIRE

par :

E(X) =∫ b

a

xf(x) dx.

La variance de la v.a. X est le nombre reel note V(X) et defini par :

V (X) =∫ b

a

[x− E(X)]2 f(x) dx =∫ b

a

x2f(x) dx− [E(X)]2 .

L’ecart type de cette v.a. X est le reel positif note σ(X) et defini par :

σ(X) =√V (X).

Exemple 5.1 On considere une variable aleatoire pouvant prendre toutes les valeurs comprises dansl’intervalle [0, 2] et soit f(x) = x

2 sa densite de probabilite.On peut verifier que la somme des probabilites est egale a 1 :∫ 2

0

x

2dx =

[x2

4

]2

0

= 1

Son esperance mathematique est

E(x) =∫ 2

0

xx

2dx =

[x3

6

]2

0

=43

et sa variance est

V (x) =∫ 2

0

(x− 43

)2x

2dx =

∫ 2

0

x3

2dx−

(43

)2

=[x4

8

]2

0

−(

43

)2

0

=29

d’ou l’ecart-type σ =√

29 ≈ 0, 471

Exercice 5.6 Soit X une variable aleatoire continue ayant pour densite de probabilite f definie par– f(x) = 0 pour x ∈]−∞; 0[∪]2; +∞[– f(x) = x pour x ∈ [0; 1]– f(x) = −x+ 2 pour [1; 2]

1. Verifier que f est une densite de probabilite2. Calculer l’esperance et l’ecart-type de X3. Calculer p(0, 5 < X < 1, 32)

Exercice 5.7 Soit X une variable aleatoire continue ayant pour densite de probabilite f definie par– f(x) = 0 pour x ∈]−∞;−2[∪]4; +∞[– f(x) = k(4− x) pour x ∈ [−2; 4]

1. Calculer k pour que f soit une densite de probabilite2. Calculer l’esperance et l’ecart-type de X3. Calculer p(−1 < X < 2) et p(X ≥ 3)

Definition 5.6 Soit X une variable aleatoire reelle.– Si E(X) = 0, X est dite centree.– Si E(X) 6= 0 alors X − E(X) est appelee variable aleatoire centree associee a X.– Si σ(X) = 1 alors X est dite reduite– Si σ(X) 6= 1 et E(X) 6= 0 alors X−E(X)

σ(X) est appelee variable aleatoire centree reduite associee aX

12 A. Fredet & J.-M. Gourdon

Page 13: Probabilité   échantillonage

Probabilites 6 LOIS BINOMIALES

6 Lois binomiales

En probabilite, une epreuve de Bernoulli de parametre p (reel compris entre 0 et 1) est uneexperience aleatoire (c’est-a-dire soumise au hasard) comportant deux issues : le succes ou l’echec.Sur cet univers succes, echec, on peut definir une variable aleatoire X prenant la valeur 1 en cas desucces et 0 en cas d’echec. Cette variable aleatoire suit une loi de Bernoulli ou loi binomiale :

Definition 6.1 Etant donnee une epreuve definie sur un univers Ω. A l’issue de l’epreuve, on a deuxpossibilites : soit succes S (p(S) = p avec 0 ≤ p ≤ 1) ; soit echec E (p(E) = q = 1 − p). On repeten fois l’epreuve. On a une suite de n epreuves independantes. Soit X la v.a. definie sur Ωn qui prendpour valeur le nombre de realisations de S. La proba qque X = k (qu’il y ait k succes) est

p(X = k) = Cknpk(1− p)n−k avec k entier

X suit une loi binomiale B(n, p) de parametres n et p.

C’est une loi qui est souvent representee sous la forme d’un arbre. On compte alors le nombre debranches ayant k succes (cela correspon a Ckn) , et on le multiplie par la probabilite qu’une branche seproduise (cela correspond a pk(1− p)n−k ).

Exemple 6.1 Quelle est la loi de probabilite definissant le nombre de garcons dans une famille de 4enfants ?

x 0 1 2 3 4p C0

4

(12

)4 = 116 C1

4

(12

)4 = 416 C2

4

(12

)4 = 616 C3

4

(12

)4 = 416 C4

4

(12

)4 = 116

Proposition 6.1 Si X suit une loi binomiale B(n, p) de parametres n et p, alors

E(X) = np V (X) = npq = np(1− p)

Exercice 6.1 Une entreprise a effectue une enquete sur ses salaries. Elle a calcule que 6% des individussont retardataires. Sur 100 personnes, quelle est la probabilite de n’en avoir aucune en retard ?

Exercice 6.2 Une urne contient des boules blanches et des boules noires. La proportion de blanchesest p. Les tirages se font avec remise ainsi la proportion de boules blanches ne changent jamais. Soit Xl’evenement obtenir une boule blanche. Quelles sont l’esperance et la variance de cette variable ?

Exercice 6.3 On lance 10 fois un de. Quelle est la probabilite d’avoir 4 fois le 1 ?

Exercice 6.4 Un camp d’adolescents propose des stages d’activites nautiques pour debutants avec auchoix : Planche a voile , plongee ou ski nautique. Lors d’un stage donne, ce camp accueille vingt jeunesdon sept seront inities a la planche a voile, huit a la plongee et cinq au ski nautique. Chaque stagiairene pratique qu’une seule des trois activites.

1. On forme un groupe de 3 stagiaires choisis au hasard parmi les vingt.

(a) Combien de groupes est-il possible de former ?

(b) Determinez la probabilite de chacun des evenements suivants :A : les trois stagiaires pratiquent des activites differentesB : Les trois stagiaires pratiquent la meme activiteC : Au moins l’un des trois stagiaires pratique le ski nautique.

2. Parmi les trois stagiaires, un seul se prenomme Christian. Chaque jour, on choisit un groupe detrois stagiaires charge du service au repas de midi.

13 A. Fredet & J.-M. Gourdon

Page 14: Probabilité   échantillonage

Probabilites 7 LOIS DE POISSON

(a) Montrez que la probabilite que Christian soit choisi un jour donne pour le service de midiest egale a 0,15.

(b) La duree du stage est de cinq jours. Quelle est la probabilite de ne jamais choisir Christianpour le service de midi pendant le sejour ?

(c) Quelle est la probabilite de le choisir exactement une fois ?

(d) Montrez que la probabilite de choisir Christian au moins deux fois est inferieur a 0,2 .

La somme des probabilite fait 1 :

Theoreme 6.1 On an∑k=0

p(X = k) = 1

Demo :

n∑k=0

p(X = k) =n∑k=0

Cxnpxqn−x = (p+ q)n = 1

7 Lois de Poisson

Cette loi intervient dans des processus aleatoires dont les eventualites sont faiblement probables etsurvenant independamment les unes des autres : cas des phenomenes accidentels, d’anomalies diverses,des problemes d’encombrement (“files d’attente”), des ruptures de stocks, etc.

Definition 7.1 On dit que la variable aleatoire X suit une loi de Poisson de parametre m si

P (X = k) =mk

k!e−m

Remarque 7.1 Dans ce cas, P (X = k + 1) = mk+1P (X = k).

une loi de Poisson peut etre representee par un diagramme en batons. Ci-dessous sont representes lesdiagrammes en batons des lois de Poisson de parametres 1, 2 et 5 :

Exercice 7.1 Dans un atelier, le nombre d’accidents au cours d’une annee suit une loi de Poisson deparametre 5. Calculer la probabilite des evenements suivants :

1. Il n’y a pas d’accidents au cours d’une annee

2. Il y a exactement 4 accidents au cours de l’annee

3. Il y a plus de 6 accidents au cours de l’annee

14 A. Fredet & J.-M. Gourdon

Page 15: Probabilité   échantillonage

Probabilites 8 LOIS NORMALES

Proposition 7.1 Si X suit une loi de Poisson de parametre m alors E(X) = V (X) = m.

La loi de Poisson decrit bien la loi binomiale pour n tendant vers l’infini et q tendant vers zero, avecle produit nq tendant vers une constante. Elle modelise donc les experiences de Bernoulli avec unetres faible probabilite de succes, mais avec un grand nombre d’essais, du meme ordre de grandeur quel’inverse de la probabilite de succes.

Proposition 7.2 On peut approcher une loi binomiale B(n, p) par la loi de Poisson P(np) avec unbon pourcentage de reussite si n ≥ 30, p ≤ 0, 1 et np < 15.

Exercice 7.2 Suite a une vaccination contre le paludisme, dans une population a risque, on estime a2%, compte tenu du delai d’immunisation, la proportion de personnes qui seront pourtant atteintes dela maladie. En utilisant la loi binomiale puis la loi de Poisson, quelle est la probabilite de constater,lors d’un controle dans un petit village de 100 habitants tous recemment vaccines, plus d’une personnemalade ? (on supposera l’independance des eventualites).

Exercice 7.3 Une entreprise possede un parc de 200 machines fonctionnant sans arret pendant lesheures de travail. On a observe que la probabilite pour chaque machine de tomber en panne au coursd’une journee est p = 1/1000.

1. Calculer la probabilite pour une machine determinee de tomber en panne au moins une fois aucours des 25 jours ouvrables

2. Calculer la probabilite pour une machine determinee de tomber en panne plus d’une fois au coursdes 25 jours ouvrables

3. En approximant par une loi de Poisson, calculer la probabilite qu’au cours des 25 jours ouvrables4 machines au plus tombent en panne puis qu’on observe au moins 6 pannes.

Plutot que de refaire les calculs a chaque fois, on peut utiliser des tables de Poisson qui, connaissantle parametre m et la valeur k donne directement P (X = k) et P (X ≤ k).

8 Lois normales

La loi normale (ou de Laplace-Gauss) est la loi de certains phenomenes continus qui fluctuent autourd’une valeur moyenne m, de maniere aleatoire, resultante d’un grand nombre de causes algebriquementadditives et independantes. La dispersion des valeurs observees d’un meme caractere gaussien estrepresentee par un ecart type σ.

Definition 8.1 On parle de loi normale ou loi de Gauss lorsque l’on a affaire a une variable aleatoirecontinue dependant d’un grand nombre de causes independantes dont les effets s’additionnent et dontaucune n’est preponderante.

Les lois normales sont representees par des courbes en cloche :

15 A. Fredet & J.-M. Gourdon

Page 16: Probabilité   échantillonage

Probabilites 8 LOIS NORMALES

Exemple 8.1 On fabrique des pieces dont les dimensions dependent du reglage de l’appareil de fabrica-tion, des vibrations auxquelles il est soumis, de l’homogeneite de la matiere premiere, de la temperature,de l’humidite, ...

Une variable aleatoire continue X est distribuee selon une loi normale si sa densite de probabilite est

f(x) =1√2πe−(x−m)2

2σ2 oum est la moyenne de Xσ est l’ecart-type de X

La loi de probabilite depend donc de deux parametres m et σ et on l’ecrit N(m,σ).On effectue generalement le changement de variable T = X−m

σ . La loi de distribution de t est alors

f(T ) =1√2πe−

T22

Cette loi est notee N(0,1) et dite normale, centree, reduite.

Remarque 8.1 On admettra pour la suite que∫ +∞−∞ e−

T22 dT =

√2π et donc que

∫ +∞−infty f(T ) dT = 1.

Proposition 8.1 L’esperance mathematique d’une variable aleatoire distribuee selon la loi N(0,1) est0. La mediane et la valeur modale sont egales a l’esperance mathematiques c’est-a-dire sont egales a 0.Pour une loi N(m,σ), l’esperance mathematique, la mediane et le mode sont egaux a m et l’ecart-typeest σ.

Si X suit une loi N(m,σ), on pose T = X−mσ . T suit alors une loi N(0,1). On a

E(X) = E(σT +m) = σE(T ) +m = m

V (X) = V (σT +m) = V (σT ) = σ2V (T ) = σ2

σ(X) =√V (X) = σ

Proposition 8.2 Si on considere une loi N(0,1) alors

p(−1, 96 < t < 1, 96) = 0, 95p(−2, 58 < t < 2, 58) = 0, 99

De maniere plus generale, p(t < t0) = 1√2π

∫ t0−∞ e−

t22 dt.

On pose∫ T−∞ f(t)dt = Φ(T ). Plutot que d’effectuer les calculs a chaque fois, on utilise la table suivante :

Table de Gauss

T , 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 90 0, 5 0, 5398 0, 5793 0, 6179 0, 6554 0, 6915 0, 7257 0, 7580 0, 7881 0, 81591 0, 8413 0, 8643 0, 8849 0, 9032 0, 9192 0, 9332 0, 9452 0, 9554 0, 9641 0, 97132 0, 9772 0, 9821 0, 9861 0, 9893 0, 9918 0, 9938 0, 9953 0, 9965 0, 9974 0, 99813 0, 9987 0, 9990 0, 9993 0, 9995 0, 9997

ExplicationsPour trouver la valeur correspondant a T = 1, 3, on se place sur la deuxieme ligne (correspondant a 1)et sur la quatrieme colonne (correspondant a , 3) et on lit : P (T ≤ 1, 3) = 0, 9032. Donc

∫ 1,3

−∞ f(t)dt =0, 9032. Ce tableau n’est utilisable que pour des valeurs de T positives et des probabilite de typeinferieure ou egale a. Les regles suivantes permettent de resoudre tous les problemes rencontres :

1.∫ α−∞ f(t)dt+

∫ +∞α

f(t)dt = 1 donc∫ +∞α

f(t)dt = 1−∫ α−∞ f(t)dt, c’est--dire P (T > α) = 1−P (T ≤

α) = 1− Φ(α)2. Si α < 0 alors Φ(α) = 1− Φ(α).On aura parfois besoin d’une table de Gauss plus complete :

16 A. Fredet & J.-M. Gourdon

Page 17: Probabilité   échantillonage

Probabilites 8 LOIS NORMALES

17 A. Fredet & J.-M. Gourdon

Page 18: Probabilité   échantillonage

Probabilites 8 LOIS NORMALES

18 A. Fredet & J.-M. Gourdon

Page 19: Probabilité   échantillonage

Probabilites 8 LOIS NORMALES

Exercice 8.1 Sachant que la repartition des quotients intellectuels (QI), rapport entre l’age mentalet l’age reel, d’une personne est une loi normale de moyenne 0,90 et d’ecart-type 0,40,

1. Calculer la probabilite a 0,0001 pres, qu’une personne prise au hasard(a) ait un QI inferieur a 1(b) ait un QI inferieur a 0,1

(c) ait un QI superieur a 1,4(d) ait un QI compris entre 0,8 et 1,3

2. En deduire le nombre de personnes dans un village de 1000 habitants(a) ayant un QI inferieur a 1(b) ayant un QI inferieur a 0,1

(c) ayant un QI superieur a 1,4(d) ayant un QI compris entre 0,8 et 1,3

Exercice 8.2 On estime que le temps necessaire a un etudiant pour terminer une epreuve d’examenest une variable normale de moyenne 90 minutes et d’ecart-type 15 minutes. 240 candidats se presententa cet examen

1. Combien d’etudiants N termineront l’epreuve en moins de deux heures ?

2. Quelle devrait etre la duree D de l’epreuve si l’on souhaite que 200 etudiants puissent terminerl’epreuve ?

Exercice 8.3 Une entreprise fabrique, en grande quantite, des tiges metalliques cylindriques pourl’industrie. Leur longueur et leur diametre sont exprimes en millimetres. Une tige de ce type estconsideree comme conforme pour la longueur lorsque celle-ci appartient a l’intervalle [99,45 ; 100,55].On note X la variable aleatoire qui, a chaque tige prelevee au hasard dans la production, associe salongueur. On suppose que X suit une loi normale de moyenne 100 et d’ecart-type 0,25.

1. Calculer la probabilite qu’une tige prelevee au hasard dans la production soit conforme pour lalongueur.

2. Determiner le nombre reel h positif tel que : P (100− h < X < 100 + h) = 0, 95.

19 A. Fredet & J.-M. Gourdon

Page 20: Probabilité   échantillonage

Probabilites 9 SOLUTIONS DES EXERCICES

9 Solutions des exercices

Solution 1.1 On ap(E1) =

26

=13

p(E2) =36

=12

p(E1 ∩ E2) = p((avoir 3 ou 4) ET (avoir un nombre pair)) = p(avoir un 4) =16

p(E1 ∪ E2) = p(E1) + p(E2)− p(E1 ∩ E2) =12

+13− 1

6=

46

=23

= p((avoir 3 ou 4) ou (avoir un nombre pair)) = p(avoir 2,3,4 ou 6) =46

=23

Solution 1.2 On considere le tableau suivant, nous donnant la somme des deux nombres :

de 2\

de 11 2 3 4 5 6

1 2 3 4 5 6 72 3 4 5 6 7 83 4 5 6 7 8 94 5 6 7 8 9 105 6 7 8 9 10 116 7 8 9 10 11 12

De ce tableau, on deduit que p(E1) = 536 , p(E2) = 7

36 et p(E3) = 1836 = 1

2 .Les evenements E1, E2 et E3 sont incompatibles (on ne peut pas avoir simultanement une somme de5 et une somme de 7, ni une somme de 5 ou 7 et une somme paire). On a donc

p(E1 ∩ E2) = 0 p(E1 ∩ E3) = 0 p(E2 ∩ E3) = 0

p(E1 ∪ E2) = p(E1) + p(E2) =536

+736

=1236

=13

p(E1 ∪ E3) = p(E1) + p(E3) =536

+12

=2336

p(E2 ∪ E3) = p(E2) + p(E3) =736

+12

=2536

Solution 2.1 On peut former 10× 9× 8× 7 = 5 040 mots differents.

Solution 2.2 Il n’est pas interdit que les lettres puissent se repeter donc il y a 53 = 125 mots possibles.

Solution 2.3 Pour le tierce, il y a 8× 7× 6 = 336 possibilites. Pour le tierce, il y a 8× 7× 6× 5 = 1680possibilites.

Solution 2.4 Pour chaque chiffres du nombre, j’ai 3 possibilites. Il y a donc 3 × 3 × 3 × 3 = 34 = 81possibilites.

Solution 2.5 Il y a 4023 possibilites.

Solution 2.6 Il y a C2340 = 40!

23!(40−23)! = 40!23!17! = 88 732 378 800 possibilites.

Solution 2.7 Il y a C532 = 32×31×30×29×28

5×4×3×2×1 = 201 376 possibilites.

20 A. Fredet & J.-M. Gourdon

Page 21: Probabilité   échantillonage

Probabilites 9 SOLUTIONS DES EXERCICES

Solution 2.8 Il faut choisir 2 coeurs parmi 8, puis 3 cartes parmi les 24 restantes : il y a donc C28×C3

24 =56 672 possibilites.

Solution 2.9 Il est plus simple de calculer le nombre de mains de 5 cartes ne contenant aucun roi,cela revient a prendre 5 cartes parmi les 28 restantes : il y a C5

28 possibilites. Le nombre total demains de cinq cartes est C5

32 et donc le nombre de mains de cinq cartes contenant au moins un roi estC5

32 − C528 = 103 096.

On peut egalement calculer directement le nombre de mains de cinq cartes contenant au moins un roi :– nombre de mains de cinq cartes contenant exactement un roi : C1

4 × C428 = 81 900

– nombre de mains de cinq cartes contenant exactement deux rois : C24 × C3

28 = 19 656– nombre de mains de cinq cartes contenant exactement trois rois : C3

4 × C228 = 1 512

– nombre de mains de cinq cartes contenant exactement quatre rois : C44 × C1

28 = 28donc le nombre de mains de cinq cartes contenant au moins un roi est 81900+19656+1512+28 = 103 096

Solution 2.10 Il y a C410 = 10!

6!4! = 420 grilles possibles.

Solution 3.1 p = 432 + 8

32 −132 = 11

32

Solution 3.2 1. Il y a 8 coeurs dans le jeu donc p(A) = C28

C232

= 28496 ≈ 0, 05645

2. Il y a 12 figures dans le jeu donc p(B) = C212

C232

= 66496 ≈ 0, 13307

3. p(A ∩B) = p(deux figures a coeur) donc p(A ∩B) = C23

C232

= 3496 ≈ 0, 00605.

4. p(A ∪B) = p(A) + p(B)− p(A ∩B) = 91496 ≈ 0, 18347

Solution 3.3 Soit A l’evenement “le candidat A reussit” et B l’evenement “le candidat B reussit”.Calculer la probabilite

1. que les 2 candidats soient recus = p(A ∩B) = P (A)× p(B) = 34 ×

23 = 1

2

2. que les 2 candidats echouent = p(A ∩ B) = p(A)× p(B) = 14 ×

13 = 1

12

3. que le candidat A soit seul recu = p(A ∩ B) = p(A)× p(B) = 34 ×

13 = 1

4

4. qu’un seul des deux candidats reussise = p(A ∩ B) + p(A ∩ B) = p(A) × p(B) + p(A) × p(B) =14 + 2

12 = 512

5. qu’au moins 1 des candidats soit recu = 1− p(A ∩ B) = 1− 112 = 11

12

Solution 3.4 Soient RA l’evenement tirer une boule rouge dans l’urne A, BA l’evenement tirer uneboule bleue dans l’urne A, RB l’evenement tirer une boule rouge dans l’urne B, BB l’evenement tirerune boule bleue dans l’urne B. On a

1. Probabilite de tirer deux boules rouges = p(RA ∩RB) = 49 ×

511 = 20

99

2. Probabilite de tirer deux boules bleues = p(BA ∩BB) = 59 ×

611 = 30

99

3. Probabilite de tirer deux boules de meme couleur = p(RA∩RB)+p(BA∩BB) = 49×

511+ 5

9×611 = 50

99

4. Probabilite de tirer deux boules de couleurs differentes : on peut le faire par le calcul direct := p(BA ∩RB) + p(RA ∩BB) = 5

9 ×511 + 4

9 ×611 = 49

99 On peut egalement le faire en remarquantque cet evenement est l’oppose de l’evenement precedent et en deduire que la probabilite est1− (p(RA ∩RB) + p(BA ∩BB)) = 49

99

21 A. Fredet & J.-M. Gourdon

Page 22: Probabilité   échantillonage

Probabilites 9 SOLUTIONS DES EXERCICES

Solution 3.5 Calculons le nombre de possibilites pour obtenir 11 et 12 :

total 11 nbr de cas total 12 nbr de cas1− 5− 5 C2

3 = 3 1− 5− 6 61− 4− 6 6 2− 5− 5 32− 4− 5 6 2− 4− 6 62− 3− 6 6 3− 3− 6 33− 4− 4 3 3− 4− 5 63− 3− 5 3 4− 4− 4 1

27 25

Le nombre 11 peut donc etre obtenu de 27 facons differentes, contre 25 pour le nombre 12. Le joueurA est donc avantage.

Solution 3.6 X(Ω) = 0; 1; 2; 3; 4 et Y (Ω) = 0; 1; 2; 3; 4. Soient– Ai l’evenement “le joueur A marque i points” avec i ∈ 0; 1; 2– Bi l’evenement “le joueur B marque i points” avec i ∈ 0; 1; 2– Ci l’evenement “le joueur C marque i points” avec i ∈ 0; 1; 2– Di l’evenement “le joueur D marque i points” avec i ∈ 0; 1; 2

Les resultats des joueurs sont independants entre eux donc p(X = k) =∑i+j=k p(Ai ∩ Bj) =∑

i+j=k p(Ai)× p(Bj). On a– P (X = 0) = 0, 4× 0, 3 = 0, 12– P (X = 1) = p(A1)× p(B0) + p(A0)× p(B1) = 0, 4× 0, 3 + 0, 4× 0, 4 = 0, 28– P (X = 2) = p(A2)×p(B0)+p(A1)×p(B1)+p(A0)×p(B2) = 0, 2×0, 3+0, 4×0, 4+0, 4×0, 3 = 0, 34– P (X = 3) = p(A2)× p(B1) + p(A1)× p(B2) = 0, 2× 0, 4 + 0, 4× 0, 3 = 0, 2– P (X = 4) = p(A2)× p(B2) = 0, 2× 0, 3 = 0, 06

et donc

xi 0 1 2 3 4p(X = xi) 0, 12 0, 28 0, 34 0, 2 0, 06

et

yi 0 1 2 3 4p(Y = yi) 0, 15 0, 34 0, 31 0, 16 0, 04

Soit p(N) la probabilite que le match soit nul. On a

p(N) = p((X = 0) ∩ (Y = 0)) + p((X = 1) ∩ (Y = 1)) + p((X = 2) ∩ (Y = 2))+p((X = 3) ∩ (Y = 3)) + p((X = 4) ∩ (Y = 4))

= p(X = 0)× p(Y = 0) + p(X = 1)× p(Y = 1) + p(X = 2)× p(Y = 2)+p(X = 3)× p(Y = 3) + p(X = 4)× p(Y = 4)

= 0, 12× 0, 15 + 0, 28× 0, 34 + 0, 34× 0, 31 + 0, 2× 0, 16 + 0, 06× 0, 04= 0, 253

Solution 3.7 – raisonnement direct :1, 3, 5, 7, 9, 11, 13, 15 sont les numero impairs, 3, 9, 15 sont les multiples de 3 parmi les impairsdonc le nombre de cas favorables est 3 et le nombre de cas possibles est 8 : p = 3

8– Avec la formule :

Soit A l’evenement la boule a un numero impair et B l’evenement la boule a un numero multiplede 3. On a pA(B) = p(A∩B)

p(A) = 3/158/15 = 3

8 .

22 A. Fredet & J.-M. Gourdon

Page 23: Probabilité   échantillonage

Probabilites 9 SOLUTIONS DES EXERCICES

Solution 3.8 Soit T l’evenement le test est positif (et donc T l’evenement le test est negatif) et soitC l’evenement l’ampoule est conforme (et donc C l’evenement l’ampoule est non conforme). On ap(C) = 0, 92 et p(C) = 0, 08, et le tableau suivant

T TC 0, 92× 0, 96 = 0, 8832 0, 92× 0, 04 = 0, 0368 0, 92C 0, 08× 0, 06 = 0, 0048 0, 08× 0, 94 = 0, 0752 0, 08

0, 888 0, 112 1

p(T ) = 0, 888 et p(T ) = 0, 112. On en deduit que pT (C) = p(T∩C)p(T ) = 0,8832

0,888 = 0, 99 et pT C = p(T∩C)p(T )

=0,07520,112 = 0, 67.

Solution 3.9 Soit A1 l’evenement la piece provient de l’atelier 1 et A2 l’evenement elle provient del’atelier 2. Soit B l’evenement la piece est defectueuse.

1. La piece provient de l’atelier 1 :La cadence du 1 etant le double de celle de l’atelier 2, il fabrique deux fois plus de pieces doncp(A1) = 2

3

2. La piece est defectueuse : p(B) = p(B ∩A1) + p(B ∩A2) = PA1(B)× p(A1) +PA2(B)× p(A2) =0, 03× 2

3 + 0, 04× 13 = 0, 02 + 0, 013 = 0, 033. 3,3 % des pieces sont defectueuses.

3. La piece provient de l’atelier 1, sachant qu’elle est defectueuse : pB(A1) = p(B∩A1)p(B) = 0,02

0,033 =0, 6%.

Solution 3.10 Soit A l’evenement il a la maladie Ma et B l’evenement il a la maladie Mb. On a letableau suivant :

A AB 0, 15× 0, 2 = 0, 03 0, 85× 0, 04 = 0, 034 0, 064B 0, 15× 0, 8 = 0, 12 0, 85× 0, 96 = 0, 816 0, 936

0, 15 0, 85 1

On cherche1. Il a la maladie Ma : p(A) = 0, 15

2. Il a la maladie Mb sachant qu’il a Ma : pA(B) = p(A∩B)p(A) = 0,03

0,15 = 0, 2 (on retrouve les 20 % del’enonce, ce qui est bon signe ...)

3. Il a la maladie Mb sachant qu’il n’a pas Ma : pA(B) = p(A∩B)p(A)

= 0,0340,85 = 0, 04 (on retrouve les 4

% de l’enonce)4. Il a la maladie Ma et la maladie Mb : p(A ∪B) = 0, 035. Il n’a pas la maladie Ma mais il a la maladie Mb : p(A ∪B) = 0, 0346. Il a la maladie Mb : p(B) = 0, 0647. Il a la maladie Ma sachant qu’il a Mb : pB(A) = 0,03

0,064 = 0, 46875

Solution 3.11 Les trois evenements sont independants. On a donc1. que les 3 soient recus = p(A ∩B ∩ C) = p(A)× p(B)× p(C) = 0, 7× 0, 4× 0, 6 = 0, 1682. que les trois echouent = p(A ∩ B ∩ C) = 0, 3× 0, 6× 0, 4 = 0, 0723. que A seulement soit recu = p(A ∩ B ∩ C) = 0, 7× 0, 6× 0, 4 = 0, 1684. qu’un seul reussise = p(A ∩ B ∩ C) + p(A ∩ B ∩ C) + p(A ∩ B ∩ C) = 0, 7 × 0, 6 × 0, 4 + 0, 3 ×

0, 4× 0, 4 + 0, 3× 0, 6× 0, 6 = 0, 324

23 A. Fredet & J.-M. Gourdon

Page 24: Probabilité   échantillonage

Probabilites 9 SOLUTIONS DES EXERCICES

5. que B soit le seul a echouer = p(A ∩ B ∩ C) = 0, 7× 0, 6× 0, 6 = 0, 252

6. qu’exactement deux soient recus = p(A ∩B ∩ C) + p(A ∩ B ∩ C) + p(A ∩B ∩ C) = 0, 7× 0, 4×0, 4 + 0, 7× 0, 6× 0, 6 + 0, 3× 0, 4× 0, 6 = 0, 436

7. qu’au moins un soit recu = 1− p(A ∩ B ∩ C) = 1− 0, 072 = 0, 928

Solution 3.12 1. P (B ∩R) = p(B)× p(B/R) = 3x × x− 3x− 1 = 1

4 On se ramene donc a resoudrex2 − 13x+ 36 = 0 dont les racines sont 4 et 9. Il y a soit 4, soit 9 boules dans l’urne.

2. p(B ∩R) = p(B)× p(R) = 3x ×

x−3x = 1

4 . On se ramen donc a resoudre x2− 12x+ 36 = 0 qui n’aqu’une racine : x = 6. Il y a donc 6 boules dans l’urne.

Solution 5.1 1. nombres de resultats possibles : 43 = 64

2. Quelle est la probabilite d’obtenir les cas suivants :

(a) La premiere boule tiree porte le numero 10, la deuxieme le numero 40, la troisieme le numero20 : il n’y a qu’un cas possible donc une probabilite de 1

64

(b) La premiere boule tiree porte le numero 30 et la deuxieme le numero 20 : il y a 4 choix pourla troisieme boule, donc 4 cas possibles, d’ou une probabilite de 4

64 = 116

(c) La deuxieme boule porte le numero 20 : il y a 4 choix pour la 1ere boule et 4 pour la 3emed’ou 4× 4 = 16 cas possibles et une probabilite de 16

64 = 14

Solution 5.2 1. nombres de resultats possibles : 4× 3× 2 = 24

2. Quelle est la probabilite d’obtenir les cas suivants :

(a) La premiere boule tiree porte le numero 10, la deuxieme le numero 40, la troisieme le numero20 : il n’y a qu’un cas favorable donc une probabilite de 1

24

(b) La premiere boule tiree porte le numero 30 et la deuxieme le numero 20 : il y a 2 possibilitespour la troisieme boule d’ou une probabilite de 2

24 = 112

(c) La deuxieme boule porte le numero 20 : il y a 3 choix pour la 1ere boule (10, 30 ou 40) et 2pour la 3eme boule, soit une probabilite de 3×2

24 = 14 .

Solution 5.3 1. nombre de resultats possibles : C34 = 4

2. Quelle est la probabilite d’avoir un resultat dans lequel figure le nombre 20 : 34

3. Quelle est la probabilite d’avoir un resultat dans lequel figurent les nombres 30 et 40 : 12

Solution 5.4 Regardons quelles sont les probabilites d’apparition de ces valeurs :

de 1de 2

1 2 3 3

1 2 3 4 42 3 4 5 52 3 4 5 52 3 4 5 5

Si on appelle X la variable aleatoire somme des deux des, on a donc

xi 2 3 4 5P (X = xi) 1

16416

516

616

On s’interesse d’abord a l’esperance :

24 A. Fredet & J.-M. Gourdon

Page 25: Probabilité   échantillonage

Probabilites 9 SOLUTIONS DES EXERCICES

1. Partie 1 : les gains possibles sont 5, 1 et −1 euros. On note Z1 la variable aleatoire gain du joueur.On a le tableau suivant

xi 5 1 −1p(Z1 = xi) 1

16916

616

L’esperance de cette variable aleatoire est donc E(Z1) = 5× 116 + 1× 9

16 + (−1)× 616 = 0, 5.

2. Partie 2 : les gains possibles sont 50, 2 et −10 euros. On note Z2 la variable aleatoire gain dujoueur. On a le tableau suivant

xi 50 2 −10p(Z1 = xi) 1

16916

616

L’esperance de cette variable aleatoire est donc E(Z1) = 50× 116 + 2× 9

16 + (−10)× 616 = 0, 5.

On observe que les esperances sont egales, mais le risque est aussi lie a l’ecart existant entre l’esperancede la variable aleatoire et les valeurs prises par cette variable. On s’interesse maintenant a l’ecart-type :

V (Z1) = 52 × 116

+ 12 × 916

+ (−1)2 × 616− (0, 5)2 = 2, 25

σ(Z1) =√V (Z1) = 1, 5

V (Z2) = 502 × 116

+ 22 × 916

+ (−10)2 × 616− (0, 5)2 = 195, 75

σ(Z2) =√V (Z2) ≈ 14

L’ecart-type est plus grand dans le deuxieme cas, ce qui signifie que les valeurs de gains sont plusespacees pour le deuxieme jeu. A chacun de choisir le jeu suivant son gout du risque ...

Solution 5.5 Soit V l’evenement “le feu est vert” et V l’evenement “le feu n’est pas vert” (ie le feu estorange ou rouge).

1. p(V ) = 4060 = 2

3

2. p(V3) = C35p(V )3p(V )2 = 80

243

3. La loi de probabilite est :

x 0 1 2 3 4 5p(X = x) 1

24310243

40243

80243

80243

32243

et donc

E(X) =5∑i=0

xp(X = x) = 0× 1243

+ 1× 10243

+ 2× 40243

+ 3× 80243

+ 4× 80243

+ 5× 32243

=103

Solution 5.6 1. Pour tout x ∈ R, f(x) ≥ 0 et de plus,∫ +∞

−∞f(x) dx =

∫ 1

0

x dx+∫ 2

1

(−x+ 2) dx =[x2

2

]1

0

+[−x2

2+ 2x

]2

1

= 1

2.

E(X) =∫ +∞

−∞xf(x) dx =

∫ 1

0

x2 dx+∫ 2

1

x(−x+ 2) dx =[

13x3

]1

0

+[−1

3x3 + x2

]2

1

= 1

25 A. Fredet & J.-M. Gourdon

Page 26: Probabilité   échantillonage

Probabilites 9 SOLUTIONS DES EXERCICES

et

E(X2) =∫ +∞

−∞x2f(x) dx =

∫ 1

0

x3 dx+∫ 2

1

x2(−x+ 2) dx

=[

14x4

]1

0

+[−1

4x4 +

23x32)2

1

=76

V (X) = E(X2)− E(X)2 =16

σ(X) =√V (X) ≈ 0, 408

3.

p(0, 5 < X < 1, 32) =∫ 1,32

0,5

f(x) dx =∫ 1

0,5

x dx+∫ 1,3

1

(−x+ 2) dx = 0, 63

Solution 5.7 1.∫ +∞−∞ f(x) dx = 18k donc il faut que k = 1

18

2. E(X) = 0 et V (X) = 2 donc σ(X) =√

2

3. p(−1 < X < 2) = 712 et p(X ≥ 3) = 1

36

Solution 6.1 Soit X le nombre de personne en retard. X suit la loi B(100 ;0,06) d’ou p(X = 0) =C0

1000, 0600, 94100 = 0, 002.

Solution 6.2 On effectue un seul tirage donc n = 1.

x p(x)0 (echec) q = 1− p1 (succes) p

donc E(X) = 0× q + 1× p = p et V (X) = pq

Solution 6.3

x poui 1 1

6

non 0 56

La probabilite d’avoir 4 reussites est C410p

4q6 = C410

(16

)4 ( 56

)6 = 0, 0542 = 5, 42%.

Solution 6.4 1. Il y a 20 stagiaires. On veut en choisir 3. Cela revient a chosir 3 elements parmi20. C’est donc le nombre de combinaisons de 3 elements parmi 20. Le nombre de choix possiblespour les groupes de 3 est donc : C3

20 = 20!3!×17! = 1140.

2. A est l’evenement les 3 stagiaires pratiquent des activites differentes.Comme on suppose qu’il y a equiprobabilite des choix des stagiaires, on a : P (A) = Card(A)

1140 .Si on appelle V l’ensemble des stagiaires qui seront inities a la planche a voile, P l’ensembledes stagiares qui seront inities a la plongee et S l’ensemble des stagiaires qui seront inities auski nautique, un evenement elementaire appartient a A si et seulement il contient exactement1 element de V , 1 element de P et 1 element de S. Comme Card(V ) = 7 , Card(P ) = 8 etCard(S) = 5, on obtient : Card(A) = 7× 8× 5 = 280. Donc P (A) = 280

1140 .L’evement B les 3 stagiaires pratiquent la meme activite correspond a choisir 3 stagiaires parmiV ou P ou S. Comme Card(V) = 7, le nombre de choix de 3 elements de V est le nombre de

26 A. Fredet & J.-M. Gourdon

Page 27: Probabilité   échantillonage

Probabilites 9 SOLUTIONS DES EXERCICES

combinaisons de 3 elements parmi 7. De meme, le nombre de choix de 3 elements de P est lenombre de combinaisons de 3 elements parmi 8 et le nombre de choix de 3elements de S est lenombre de combinaisons de 3 elements parmi 5. Donc , on a : card(B) = C3

7 + C38 + C3

5 = 101.D’ou p(B) = 101

1140 .L’evenement C est au moins un des trois stagiaires pratique le ski nautique. L’evenement contrairede C est aucun des trois stagiaires ne pratique le ski nautique. Il correspond au choix de 3 stagiairesparmi les 15 qui ne font pas de ski nautique. Son cardinal est alors : card(C) = C3

15 = 455. Donccard(C) = 1140− 455 = 685 et p(C) = 685

1140 .

3. On sait qu’il y a chaque jour 1140 choix possibles de 3 stagiaires parmi les 20. Choisir un groupede 3 avec Christian revient a choisir Christian et 2 stagiaires parmi les 19 qui ne sont pasChristian. Il y a 171 choix possibles de deux autres stagiaires. C’est le nombre de combinaisonsde 2 elements parmi 19. Parmi les 1140 groupes possibles de 3 stagiaires, il y a donc exactement175 groupes qui contiennent Christian. La probabilite que Christian soit choisi un jour donne estdonc : 171

1140 = 0, 15.Si on appelle X la variable aleatoire egale au nombre de fois que Christian est choisi durant lesejour de 5 jours, X suit une loi binomiale de parametre (n = 5 , p = 0,15 ). Donc, pour tout kentier, on a :

p(X = k) = Ck5 (0, 15)k × (0, 85)5−k

En particulier, la probabilite de ne jamais choisir Christian durant le sejour est :

p(X = 0) = C05 (0, 15)0 × (0, 85)5 = (0, 85)5 ≈ 0, 4437

La probabilite de choisir exactement une fois Christian est :

p(X = 1) = C15 (0, 15)1 × (0, 85)4 = 5× (0, 15)× (0, 85)4 ≈ 0, 3915

La probabilite de choisir au moins 2 fois Christian est : P (X ≥ 2). Or P (X ≥ 2) = 1 − P (X =0) − P (X = 1). Les calculs precedents montrent bien alors que cette probabilite est inferieure a0,2.

Solution 7.1 1. P (X = 0) = e−5 ≈ 0, 0067

2. P (X = 4) = 54

4! e−5 ≈ 0, 1755

3. P (X > 6) = 1− P (X ≤ 6) ≈ 1− 0, 7622 ≈ 0, 2378

Solution 7.2 Compte tenu des hypotheses, le nombre de malades est ici regi par une loi binomiale deparametres n = 100 et p = 0,02. On a np = 2 et les conditions d’approximation par une loi de Poissonsont realisees. Soit m la probabilite cherchee.En utlisant la loi binomiale, on a 1−m = (0, 98)100 + 2× (0, 98)99 ≈ 0, 403. Soit m ≈ 0, 597.En utilisant la loi de Poisson, on a Prob(X = k) = e−2× 2k

k! , donc 1−m ≈ Prob(X = 0) +Prob(X =1) = 0, 406 , soit m ≈ 0, 594. L’approximation est donc ici excellente.

Solution 7.3 Soit X la variable aleatoire associee au nombre de pannes durant 25 jours ouvrables. Ces25 epreuves sont identiques et independantes donc X suit une loi binomiale B(25 ;1/1000).

1. Calculer la probabilite pour une machine determine de tomber en panne au moins une fois aucours des 25 jours ouvrables : p(X ≥ 1) = 1− p(X = 0) = 1− 0, 99925 ≈ 0, 0247

2. Calculer la probabilite pour une machine determine de tomber en panne plus d’une fois au coursdes 25 jours ouvrables : p(X > 1) = 1− ((p(X = 0) + p(X = 1)) = 1− (0, 99925 + 25× 0, 001×0, 99924) ≈ 0, 0003

27 A. Fredet & J.-M. Gourdon

Page 28: Probabilité   échantillonage

Probabilites 9 SOLUTIONS DES EXERCICES

3. Soit Y la variable aleatoire associee au nombre de pannes pour 200 machines en 25 jours. Y suitla loi binomiale B(5000 ;0,001). On l’approche la loi binomiale par la loi de Poisson de mememoyenne np = 5000× 0, 001 = 5 (on a bien n ≥ 30; p ≤ 0, 1 et np < 15). On en deduit

p(Y ≤ 4) = p(Y = 0) + p(Y = 1) + p(Y = 2) + p(Y = 3) + p(Y = 4)

= e−5

(1 +

51!

+52

2!+

53

3!+

54

4!

)≈ 0, 4405

P (Y < 6) = P (Y ≤ 5) = e−5

(1 +

51!

+52

2!+

53

3!+

54

4!+

55

5!

)≈ 0, 6160

Solution 8.1 La variable aleatoire suit une loi normale de moyenne m = 9 et d’ecart-type σ = 0, 4. Onpose T = Q−0,9

0,4 . T suit une loi normale centree reduite N(0,1).

1. Calculer la probabilite a 0,0001 pres, qu’une personne prise au hasard

(a) ait un QI inferieur a 1 : Q < 1⇔ T < 0, 25 et p(T < 0, 25) ≈ 0, 5987

(b) ait un QI inferieur a 0,1 : Q < 0, 1⇔ T < −2 et p(T < −2) ≈ 0, 0228

(c) ait un QI superieur a 1,4 : Q > 1, 4⇔ T > 1, 25 et p(T > 1, 25) ≈ 0, 1056

(d) ait un QI compris entre 0,8 et 1,3 : 0, 8 ≤ Q ≤ 1, 3 ⇔ −0, 25 ≤ T ≤ 1 et p(−0, 25 ≤ T ≤1) ≈ 0, 4400.

2. En deduire le nombre e personnes dans un village de 1000 habitants

(a) ayant un QI inferieur a 1 : ≈ 599

(b) ayant un QI inferieur a 0,1 : ≈ 23

(c) ayant un QI superieur a 1,4 : ≈ 106

(d) ayant un QI compris entre 0,8 et 1,3 : ≈ 440

Solution 8.2 Le temps necessaire a un etudiant pour terminer une epreuve d’examen est une variablealeatoire X normale, de moyenne 90mn et d’ecart-type 15mn. On pose T = X−90

15 . T suit une loinormale centree reduite N(0,1).

1. Combien d’etudiants N termineront l’epreuve en moins de deux heures : X ≤ 120 ⇔ T ≤ 2 etp(X ≤ 12) = p(T ≤ 2) ≈ 0, 9772. Il y a aura donc N = 240 × 0, 9772 ≈ 235 etudiants a finir endeux heures.

2. Quelle devrait etre la duree D de lepreuve si l’on souhaite que 200 etudiants puissent terminerl’epreuve ?On veut p(X ≤ D) = 200

240 ≈ 0, 8333. D’apres la table, on en deduit que T doit etre 0,97 ce quinous amene a D ≈ 104, 55.

Solution 8.3 1. On a

P (99, 45 ≤ X ≤ 100, 55) = P (99, 45− 100

0, 25≤ T ≤ 100, 55− 100

0, 25) = P (−2, 2 ≤ T ≤ 2, 2)

= P (T ≤ 2, 2)− P (T ≤ −2, 2) = P (T ≤ 2, 2)− (1− P (T ≤ 2, 2))= 0, 9861− (1− 0, 9861) = 0, 9722

28 A. Fredet & J.-M. Gourdon

Page 29: Probabilité   échantillonage

Probabilites 9 SOLUTIONS DES EXERCICES

2. On cherche h tel que

P (100− h ≤ X ≤ 100 + h) = P (−h

0, 25≤ T ≤ h

0, 25) = 0, 95

= P (T ≤ h

0, 25)− P (T ≤ −h

0, 25) = P (T ≤ h

0, 25)− (1− P (T ≤ h

0, 25))

= 2P (T ≤ h

0, 25)− 1

P (T ≤ h

0, 25) =

0, 95 + 12

= 0, 975

h

0, 25≈ 1, 9⇒ h ≈ 0, 475

29 A. Fredet & J.-M. Gourdon

Page 30: Probabilité   échantillonage

Echantillonnage et estimation 2 ESTIMATION

Deuxieme partie

EchantillonnageGeneralement, nous obtenons les resultats statistiques par experience. Trois problemes se posent

alors :

1. Quelle confiance pouvons-nous avoir dans les valeurs statistiques considerees ?

2. Quelle est la loi de probabilite regissant ces resultats ?

3. Pouvons-nous determiner si deux ensembles de mesures differents sont regis par la meme loi ?

Nous allons nous interesser a ces problemes. Nous ne nous interesserons qu’a des echantillons de taillesignificative (ayant un effectif superieur a 30).

1 Echantillons

Proposition 1.1 Considerons une population ayant une certaine propriete avec une moyenne m et unecart-type σ. Soit X la variable aleatoire qui a tout echantillon aleatoire preleve avec remise et d’effectifn fixe, associe la moyenne de cet echantillon. Pour n suffisamment grand, X suit approximativementla loi normale N (m, σ√

n).

Exercice 1.1 Une machine fabrique des disques pleins en grande quantite. La variable aleatoire qui,a chaque disque tire au hasard, associe son diametre suit la loi normale N (12, 8; 2, 1) (la moyenne vaut12,8mm et l’ecart-type vaut 2,1mm).

1. Quelle loi suit la variable aleatoire X qui, a tout echantillon aleatoire non es=xhaustif de taillen = 49, associe la moyenne des diametres des disques de cet echantillon ?

2. Determinez un intervalle centre en 12,8 tel que la variable aleatoire prenne ses valeurs dans cetintervalle avec la probabilite 0,95

3. Determinez la taille que doit avoir un echantillon pour que la moyenne des diametres des disquespreleves ne s’ecarte pas de 12,8 de plus de 0,2mm avec une probabilite de 0,95.

2 Estimation

C’est le probleme inverse de l’echantillonnage : connaissant des renseignements sur un ou plusieursechantillons, on cherche a en deduire des informations sur la population totale.Par exemple, a chaque election, on nous assene que tel candidat fera 23,4% des voix. Puis, le lendemain,seulement 19,6%. Pourquoi cet ecart ? En fait, les nombres 23,4 et 19,6 n’ont aucun sens s’ils sont donnesseuls. Evidemment, lorsqu’on interroge une partie de la population francaise, il est impossible de savoirce que pense exactement toute la population. On n’en obtient qu’une estimation. Et la precision del’estimation varie en fonction du nombre de personnes interrogees.Lorsque qu’un sondage realise aupres de n personnes donne comme resultat p% d’intention de vote,on peut trouver un intervalle [a, b], contenant p, tel que, avec un risque d’erreur inferieur a 5% parexemple, le pourcentage reel d’intention de vote est compris entre a et b.

Exemple 2.1 Pour le second tour d’une election presidentielle, un sondage credite le candidat A de53%. Est-on sur pour autant qu’il va gagner ?Les intervalles de confiance, avec un risque d’erreur de 5%, dependent bien entendu du nombre n depersonnes interrogees.Prenons l’exemple d’un institut de sondage qui, avant le second tour d’une election presidentielle,

30 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 31: Probabilité   échantillonage

Echantillonnage et estimation 2 ESTIMATION

interroge n electeurs. Parmi eux, 53% declarent qu’ils vont voter pour le candidat A. Peut-il garantirpour autant la victoire du candidat A avec un risque d’erreur inferieur ou egal a 5%. Il faut pour celaque [50, 100] soit un intervalle de confiance pour l’estimation du parametre Pourcentage de personnesqui vont voter A. Ceci depend bien sur de la taille de l’echantillon interroge. Plus n est grand, meilleureest l’estimation.

Intervalle de confiance

L’intervalle de confiance est une forme de mesure de la confiance que l’on peut accorder a unehypothese concernant une valeur numerique mesuree, au vu de resultats de mesures de cette valeur.Par definition, l’intervalle de confiance I(α) (au niveau de confiance α) relatif a une mesure Mconstatee, est l’intervalle dans lequel, pour toute valeur p ∈ I(α), P (M = p) > α.Plus le seuil de confiance est eleve, plus l’intervalle sera grand.

α = 0, 99

99 chances sur 100 que la valeur du parametre re-cherche se trouve dans l’intervalle de confiance maisla precision autour de la valeur predite est faible.

α = 0, 95

95 chances sur 100 que la valeur du parametre re-cherche se trouve dans l’intervalle de confiance et laprecision autour de la valeur predite est correcte.

α = 0, 90

90 chances sur 100 que la valeur du parametre re-cherche se trouve dans l’intervalle de confiance maisla precision autour de la valeur predite est elevee.

Si on considere un niveau de confiance α, on commence par trouver tα tel que P (X ≤ tα) = 1+α2 . Soient

m et σ la moyenne et l’ecart-type de la population globale, et soient me la moyenne de l’echantillon, σeson ecart-type et n l’effectif de l’echantillon. Le chapitre precedent nous dit que me suit la loi normaleN (m, σ√

n).

Cela signifie que P (me − tα × σ√n< m < me + tα × σ√

n) = α. Cela implique donc que la moyenne m

appartient a l’intervalle [me − tα × σ√n

;me + tα × σ√n

] avec une probabilite de α.

Definition 2.1 L’intervalle [me + tα × σe√n,me + tα × σe√

n] est appelle intervalle de confiance pour la

moyenne m au niveau de confiance α. C’est a dire qu’il contient la vraie moyenne m avec une probabilitede α.

Exemple 2.2 Supposons que le poids moyen trouve dans un echantillon de taille n = 100 prelevealeatoirement soit me = 10, 6.Nous supposerons que σ est connu et vaut σ = 3. Sinon, comme on suppose que l’echantillon estsuffisamment grand, il est acceptable de remplacer σ par l’ecart-type σe de l’echantillon L’intervalle de

31 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 32: Probabilité   échantillonage

Echantillonnage et estimation 2 ESTIMATION

confiance est [me + 1, 96 σe√100

,me + 1, 96 σe√100

] = [10, 012; 11, 188]. On peut donc dire que l’estimationde m est 10, 6± 0, 588 avec un niveau de confiance de 95%.

Pour reduire l’amplitude de l’intervalle, il faut augmenter l’effectif de l’echantillon.

Remarque 2.1 Si α = 95% alors tα = 1, 96, si α = 99% alors tα = 2, 58.

Le calcul de l’intervalle de confiance depend de la loi observee.

Proposition 2.1 Supposons que l’on considere un echantillon de n personnes, et que l’on cherche adeterminer les parametres n et p d’une loi binomiale. Supposons que ne et pe soient les parametres del’echantillon. L’intervalle est donne par

[pe − tα ×√pe(1− pe)

n, pe + tα ×

√pe(1− pe)

n]

Exercice 2.1 Un test de fonctionnement d’un lot de 1000 ampoules donne 490 ampoules hors-service.On souhaite determiner la probabilite p qu’une ampoule a d’etre en panne, ainsi qu’un intervalle deconfiance 95%.

Dans le cas d’une loi binomiale, pe est souvent inconnu. On le remplace alors par une valeur approxi-mative (on verra au chapitre suivant comment trouver une telle valeur), ou par 1

2 qui nous donne unintervalle d’amplitude fixee.

Exercice 2.2 On desire estimer la proportion p de personnes qui se declarent favorables un certainprojet dans une population de taille importante.

1. Si lon a aucune idee idee a priori sur cette proportion, determinez le nombre de personnes ainterroger avec un niveau de confiance de 99%, si l’erreur d’estimation est fixee 2% (cela signifieque l’intervalle a une amplitude maximim de 0,02).

2. Finalement, on n’a interroge finalement que 1000 personnes et on a trouve une proportion de53% des personnes pour le projet dans l’echantillon. Proposez un intervalle de confiance pour pau niveau de confiance de 99%

Proposition 2.2 Si on considere un echantillon de n personnes, et que c’est une loi normale demoyenne m, et si l’on cherche un niveau de confiance de α alors on commence par trouver tα tel queP (X ≤ tα) = 1+α

2 . L’intervalle est donne par

[p− tα.m√n, p+

tα.m√n

]

Exemple 2.3 Reprenons l’exemple des elections presidentielles. La moyenne d’un echantillon etantinconnu, on va supposer que m = 50% (50% des personnes vont voter pour ce candidat).Soit α = 0, 95 dans ]0, 1[ le niveau de confiance que l’on souhaite. On cherche tα tel que P (X ≤ tα)) =1+0,95

2 = 0, 975. On trouve tα = 1, 96. Un intervalle de confiance est donne par

I = [53− 1, 96× 50√n

, 53 +1, 96× 50

2√n

]

Cela nous donne des intervzalles en fonction de n :

n = 100 [43, 2; 62, 8]n = 1000 [49, 9; 56, 1]n = 10000 [52; 54]

La premiere ligne signifie qu’au terme d’un sondage de 100 personnes, on peut affirmer avec un risqued’erreur inferieur ou egal a 5% que le candidat A fera entre 43,2% et 63,8% des voix.

32 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 33: Probabilité   échantillonage

Echantillonnage et estimation 3 TEST D’AJUSTEMENT

Estimation de la moyenne

Soient m et σ la moyenne et l’ecart-type de la population globale. Soient me la moyenne del’echantillon, σe son ecart-type et n l’effectif de l’echantillon. Deux cas peuvent se presenter :

1. m est inconnue, σ, me et n sont connus :Dans ce cas, l’intervalle de confiance de la moyenne m de la population avec le coefficent deconfiance α est

[me −tα.σ√n,me +

tα.σ√n

]

2. m et σ sont inconnus, me, σe et n sont connus :Dans ce cas, l’intervalle de confiance de la moyenne m de la population avec le coefficient deconfiance α est

[me −tα.σe√n− 1

,me +tα.σe√n− 1

]

Exemple 2.4 Dans une population P de grand effectif, on preleve de maniere non exhaustive, unechantillon de 100 personnes dont on note la masse en kg :

masse 62 64 68 10 74effectif 5 18 42 27 8

La moyenne et l’ecart-type de cet echantillon sont me = 68kg et σe = 3kg.L’intervalle de confiance de la moyenne m des masses des personnes de P au coefficient de confiance95% est

m ∈ [68− 1, 96× 3√100− 1

; 68 + 1, 96× 3√100− 1

] = [67, 4; 68, 6]

Exercice 2.3 Dans une station service, on suppose que le montant des cheques essence suit une loinormale de parametres m et s. On considere un echantillon de taille n = 50 et on obtient une moyennede 130 =Cet un ecart-type de 28 =C. Donner une estimation de m par un intervalle de confiance auniveau de confiance 95%.

3 Test d’ajustement

Nous cherchons maintenant a determiner si des valeurs statistiques suivent une loi de probabilite.

Choix d’un modele

Soit une distribution statistique d’effectifs ni. On cherche a savoir quelle loi regit cette serie.

Exemple 3.1 On cherche a determiner si un de a 6 faces est non truque. Pour cela, on effectue 600lancers. On obtient les resultats suivants :

face 1 2 3 4 5 6nombre d’apparitions ni 96 95 109 98 106 96

Le de est-il truque ?

Pour cela, on definit un modele (equirepartition, binomial, Poisson, normal,...) dont les probabilitespour les evenements xi sont pi, avec des effectifs theoriques Ni = N × pi ou N =

∑i ni. On emet donc

une hypothese sur la loi regissant cette serie.

33 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 34: Probabilité   échantillonage

Echantillonnage et estimation 3 TEST D’AJUSTEMENT

Exemple 3.2 Si on reprend l’exemple precedent du de a 6 faces. En 600 lancers, on devrait avoir lesresultats suivants :

face 1 2 3 4 5 6nombre d’apparitions theoriques Ni 100 100 100 100 100 100

Comparaison entre la theorie et la pratique

On s’interesse a l’ecart entre la theorie et la pratique : Ni−ni. Un grand ecart etant plus importantqu’un petit,on prend le carre de ces ecarts :(Ni − ni)2. Et enfin, obtenir 95 alors qu’on attend 100,ce n’est pas la meme chose qu’obtenir 5 lorsqu’on attend 10. Il faut donc regarder l’ecart relatif. Oncalcule

χ2cal =

∑i

(ni −Ni)2

Ni

Exemple 3.3 Si on reprend l’exemple precedent du de a 6 faces. En 600 lancers, on devrait avoir lesresultats suivants :

face 1 2 3 4 5 6nombre d’apparitions ni 96 95 109 98 106 96

nombre d’apparitions theoriques Ni 100 100 100 100 100 100(Ni−ni)2

Ni0, 16 0, 25 0, 81 0, 04 0, 36 0, 16

Donc χ2cal = 1, 78.

Seuil de confiance

On remarque que si χ2cal = 0 alors pour chaque classe ni = Ni et donc la variable suivrait exactement

la loi retenue comme modele.Plus la valeur numerique obtenue pour le χ2

cal sera elevee, plus l’ajustement effectue sera discutable.Il faut donc se fixer une mesure χ2

T a ne pas depasser. Cette mesure ne peut pas etre trop basse, sinontoutes les hypotheses seraient rejetees (si on reprend l’exemple, meme un de parfait non truque netombera pas exactement 100 fois sur chaque face).La valeur limite depend de la marge d’erreur que l’on accepte. Si l’on se fixe comme valeur limite 0, onpeut raisonnablement penser que 100% des hypotheses exactes seront rejetees. Si l’on se fixe commevaleur limite 2, on peut penser que 80% des hypothses exactes seront rejetees, et ainsi de suite... Plusla valeur limite sera grande, plus le pourcentage d’hypotheses exactes et rejetees sera faible (mais plusle nombre d’hypotheses fausses et acceptees sera grand). Cette valeur limite χ2

T depend donc de laprobabilite que l’on accepte de voir la mesure de χ2

cal la depasser alors que l’hypothese est exacte.Cette probabilite s’appelle le seuil de confiance. Il est generalement fixe a 5 %.

Degre de liberte

La valeur limite χ2T depend egalement du nombre de classes considerees. Si on reprend l’exemple

du de, le χ2cal obtenu avec un de a 12 faces sera surement plus grand que le χ2

cal obtenu avec un de

a 6 faces. En effet, on ajoutera 12 valeurs positives (Ni−ni)2

Niau lieu de 6... Cela s’appelle le degre de

liberte.

Exemple 3.4 Dans notre cas, le degre de liberte est 5 (on peut choisir 5 valeurs de lancers, la sixiemeest determinee automatiquement car la somme doit faire 600).

34 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 35: Probabilité   échantillonage

Echantillonnage et estimation 3 TEST D’AJUSTEMENT

Plus generalement, le degre de liberte est egal a la difference entre :– le nombre de valeurs que l’on considere– le nombre de relations qui unissent ces nombres

Soit r le nombre de classes (toutes possedant au moins 5 unites). Le degre de liberte ν est

ν = r −

1 si la loi est binomiale2 si la loi est de Poisson3 si la loi est normale

Decision finale

Cette valeur de χ2cal est donc comparee a un χ2, dit χ2 theorique (note χ2

T ), fonction du modele etdu nombre de donnees, lu dans la table suivante :

/p (seuil de confiance)ν (degre de liberte) 0, 90 0, 50 0, 10 0, 05 0, 02 0, 01 0, 001

1 0, 016 0, 455 2, 706 3, 841 5, 412 6, 635 10, 8272 0, 211 1, 386 4, 605 5, 991 7, 824 9, 210 13, 8153 0, 584 2, 366 6, 251 7, 815 9, 837 11, 345 16, 2664 1, 064 3, 357 7, 779 9, 488 11, 668 13, 277 18, 4675 1, 610 4, 351 9, 236 11, 070 13, 388 15, 086 20, 5156 2, 204 5, 348 10, 645 12, 592 15, 033 16, 812 22, 4577 2, 833 6, 346 12, 017 14, 067 16, 622 18, 475 24, 3228 3, 490 7, 344 13, 362 15, 507 18, 168 20, 090 26, 1259 4, 168 8, 343 14, 684 16, 919 19, 679 21, 666 27, 877

En consequence, si χ2cal < χ2

T on adopte le modele et sinon on rejette le modele.

Exemple 3.5 Dans notre cas, avec un degre de liberte de 5 et un seuil de confiance de 5%, le χ2T vaut

11, 07. Notre χ2cal est inferieure a χ2

T donc le de n’est pas truque.

Exercice 3.1 Un correcteur rend ses 100 copies au secretariat d’un concours de recrutement de pro-fesseurs. Par souci d’equite, la consigne est de noter les copies de maniere telle que la distribution desnotes soit normale avec une moyenne de 10 et un ecart-type de 4. Le secretariat etablit la distributionsuivante :

Intervalles Moins de 4 De 4 a 8 De 8 a 12 De 12 a 16 De 16 a 20Effectifs 8 25 45 10 12

La moyenne est 9,7 et l’ecart-type est 4,3. Au vu de ces resultats le responsable du concours convoquele correcteur pour qu’il modifie ses notes qui seraient trop nombreuses entre 4 et 8. Le correcteur faitvaloir que la moyenne et l’ecart-type sont approximativement ceux demandes et que les variations lieesa la repartition des copies en paquets de 100 expliquent sans doute la legere difference entre son paquetet la distribution demandee. Le correcteur a-t-il raison de refuser de revoir ses notes ?

Conditions d’utilisation du χ2

Certaines conditions sont necessaires pour appliquer cette methode : il faut notamment que chaqueclasse ait un effectif d’au moins 5 (sinon les effectifs sont trop petites pour etre significatifs). Si ce n’estpas le cas, on regroupera certaines classes :

35 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 36: Probabilité   échantillonage

Echantillonnage et estimation 3 TEST D’AJUSTEMENT

Exemple 3.6 Un vendeur de voiture a note le nombre de vehicules vendus durant une annee (200jours de travcail)

xi nombre de vehicules 0 1 2 3 4ni nombre de jours 76 72 34 12 6

On calcule la moyenne : x = 1 et la variance V (X) = 1, 06 qui est proche de 1. On peut donc penserqu’une loi de Poisson de parametre 1 peut approcher cette variable. On va utiliser le test du χ2 pourverifier cette hypothese. Dans ce cas,

p(X = i) = e−λλ

i!= e−1 1

i!

xi 0 1 2 3 4 5 et plusni 76 72 34 12 6 0 200

p(X = i) 0, 368 0, 368 0, 184 0, 061 0, 015 0, 004 1Ni = N × p(X = i) 73, 6 73, 6 36, 8 12, 2 3 0, 8 200

La classe 5 et plus est envisagee pour que∑p(X = i) = 1. On ne veut considerer que des classes

d’effectifs plus grand que 5, il faut donc regrouper les 3 dernieres :

xi 0 1 2 3 et plus totalni 76 72 34 18 200

Ni = N × p(X = i) 73, 6 73, 6 36, 8 16 200

On a χ2 =∑4i=1

(ni−Ni)2

Ni≈ 0, 576. Dans la table, avec un degre de liberte de 2 et un seuil de 0,05, on

lit que χ2T = 5, 991. On a donc χ2

cal < χ2T et donc on accepte le modele.

Exemple 3.7 Une entreprise d’exploitation miniere utilise une grande quantite de moteur qu’elle sou-met a des conditions de travail difficile. Pour un type de moteur et un mode d’utilisation determines,la duree de vie d’un moteur peut etre consideree comme une variable aleatoire. Pour determiner la loide probabilite, on dispose d’un echantillon de 50 duree de vie de moteurs :

duree de vie(en semestres) nombres d’observations

0 a 8 08 a 9 29 a 10 5

10 a 10, 5 710, 5 a 11 1111 a 11, 5 1111, 5 a 12 612 a 13 713 a 14 1

50

36 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 37: Probabilité   échantillonage

Echantillonnage et estimation 4 COMPARAISON D’ECHANTILLONS

On considere donc le tableau suivant :

duree(en semestres) effectifs reels ni effectifs theoriques Ni

(ni−Ni)2

Ni

8 a 99 a 10

8 a 10

25

7

1, 37, 15

8, 45 0, 2488

10 a 10, 5 7 7, 405 0, 022110, 5 a 11 11 9, 14 0, 378511 a 11, 5 11 9, 12 0, 387511, 5 a 12 6 7, 355 0, 2496

12 a 1313 a 14

12 a 14

71

9

7, 0551, 27

8, 325 0, 0127

χ2cal = 1, 2992

Il y a 6 classes, et on va chercher a savoir si cette variable suit une loi normale donc le degre de liberteν = 6− 3 = 3. Si on s’interesse a une probabilite de 5%, on lit que χ2

T = 7, 815, nombre limite cherche.On a χ2

cal < χ2T donc on adopte ce modele.

Exercice 3.2 On considere le nombre de pieces defectueuses sur un lot de 100 pieces. En definissantX comme etant le nombre de pieces defectueuses par lot de 100 pieces, on obtient le tableau suivant :

X 0 1 2 3 4 5 6 7 8 9ni 2 7 14 21 19 17 11 5 4 0 100 lots

Verifier si cette production obeit a une loi binomiale B(100; 0, 04) ? a une loi B(100; 0, 03) ? a une loiB(100; 0, 0392) ? une loi de Poisson de parametre 4 ?

Exercice 3.3 On veut verifier une machine ambaleuse de sacs de ciment ayant au moins un poids de50kgs. On pese 500 sacs et on obtient

poids nombre de sacs< 45 35

45− 47 5347− 49 7649− 51 10051− 53 8853− 55 7855− 57 42> 57 28

500

Verifier que l’emballage des sacs suit une loi normale dont on precisera la moyenne et l’ecart-type (onprendra 44 comme poids moyen des sacs de moins de 45 kg et 58 comme poids moyen des sacs de plusde 57 kilos).

4 Comparaison d’echantillons

Supposons que l’on souhaite comparer un echantillon A a un echantillon B afin de savoir s’ils suiventla meme loi. Le probleme dans ce cas, c’est que l’on manque de reference : il ne serait pas logique deprendre l’echantillon A comme reference, pas plus qu’il ne serait logique de prendre l’echantillon B.Il faut donc adopter une estimation, la meilleure possible des proportions qui nous interessent. Si l’on

37 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 38: Probabilité   échantillonage

Echantillonnage et estimation 4 COMPARAISON D’ECHANTILLONS

suppose que les deux echantillons proviennent de la meme population et suivent la meme loi, il paraitjudicieux d’utiliser toutes les informations dont nous disposons et de reunir ces populations. Cela nousfournira une reference. On construit ainsi l’hypothese nulle qui, dans ce cas, ne depend ni d’une loide probabilite, ni d’une distribution de reference, les proportions des differentes cat’egories etant doncconservees d’une ligne a l’autre. On calculera ainsi les effectifs theoriques correspondant aux criterespour les populations A et B, et l’on pourra alors utiliser le test du χ2.

Exemple 4.1

A B total25 35 6095 65 160

total 120 100 220

On calcule le tableau des effectifs theoriques :

A B total60220 × 120 = 32, 7 60− 32, 7 = 27, 3 60

120− 32, 7 = 87, 3 100− 27, 3 = 72, 7 160total 120 100 220

On a donc

χ2cal =

(25− 32, 7)2

32, 7+

(35− 27, 3)2

27, 3+

(95− 87, 3)2

87, 3+

(65− 72, 7)2

72, 7= 5, 48

On a calcule une seule frequence de reference, il n’y a donc qu’un seul degre de liberte. La valeur duχ2cal est de 5,48. Dans la table, avec un seuil e confiance de 5 %, le χ2

T vaut 3,841 et avec un seuilde confiance de 1 % le χ2

T vaut 6,635. Les deux groupes se ressemblent donc significativement si onconsidere un seuil de confiance de 5 % mais pas si on considere un seuil de confiance de 1 %.

Exercice 4.1 On a etudie sur deux echantillons la repartition des quatre groupes sanguins : O, A, B,AB. Les resultats obtenus sont reportes dans un tableau suivant, a deux lignes et quatre colonnes :

Groupe O A B AB Total1 er echantillon 121 120 79 33 353

2 eme echantillon 118 95 121 30 364Total 239 215 200 63 717

Ces deux echantillons proviennent-ils de la meme population ?

Exercice 4.2 Pour l’election presidentielle, deux candidats sont en presence, S. R. et N. S. (pour nepas les nommer). Dans un village du Nord de la France, il y a 500 electeurs, dont 100 sont retraites,50 sont chomeurs, et 350 sont actifs. Les resultats des elections sont (apres decompte manuel) :

S.R. N.S. BlancsRentiers 35 10 5Actifs 90 210 50

Retraites 70 23 7

Dans ce village, l’opinion depend-elle de l’appartenance a un groupe social ?

38 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 39: Probabilité   échantillonage

Echantillonnage et estimation 4 COMPARAISON D’ECHANTILLONS

Exercice 4.3 Une etude a ete menee sur les facteurs pouvant influer sur le port de la ceinture desecurite par les conducteurs et les passagers de voitures de tourisme et de vehicules utilitaires. Ons’interesse tout d’abord a l’effet du type d’occupation du vehicule (conducteur seul, conducteur +passagers avant, conducteur + passagers arriere, conducteur + passagers avant et arriere) sur le portde la ceinture par le conducteur. On dispose de 8374 observations concernant cette partie de l’etude.Les donnees sont les suivantes :

Port ceinture non port de ceintureSeul 2825 3468

Cond. + pass. avant 729 815Cond. + pass. arriere 80 113

Cond. + pass. av. et arr. 168 176

Y-a-t-il un lien entre les deux variables Type d’occupation et Port de la ceinture ?

39 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 40: Probabilité   échantillonage

Echantillonnage et estimation 5 SOLUTIONS DES EXERCICES

5 Solutions des exercices

Solution 1.1 1. X suit une loi normale N (12, 8; 2,1√49

) = N (12, 8; 0, 3).

2. On cherche tα tel que P (X ≤ tα)) = 1+0,952 = 0, 975. On trouve tα = 1, 96. L’intervalle est donc

[12, 8− 1, 96× 2, 1; 12, 8 + 1, 96× 2, 1] = [8, 684; 16, 916].

3. On cherche n tel que 1, 96× 2,1√n≤ 0, 2. Il faut que n ≥ (1, 96× 2,1

0,2 )2 donc que n ≥ 424.

Solution 2.1 On a pe = 4901000 et tα = 1, 96. On considere l’intervalle [0, 49− 1, 96×

√0,49×0,51)

1000 , 0, 49 +

1, 96×√

0,49×0,51)1000 ] = [0, 46; 0, 52]

Solution 2.2 L’amplitude de l’intervalle est tα × 12√n

= 2, 58 × 12√n

. On veut 2, 58 × 12√n≤ 0, 04, ce

qui implique que n ≥ ( 2,582×0,02 )2, c’est a dire n ≥ 4161. Il faudrait donc interroger 4160 personnes.

p ∈ [0, 53− 2, 58×√

0,53×0,471000 ; 0, 53 + 2, 58×

√0,53×0,47

1000 ] = [0, 49; 0, 57]

Solution 2.3 m ∈ [130− 1, 96× 28√50−1

; 130 + 1, 96× 28√50−1

] = [122, 16; 137, 84]

Solution 3.1 On calcule les effectifs de la distribution theorique obtenue en appliquant la loi normalede moyenne donnee m et d’ecart-type σ (dans l’exemple m = 10 et σ = 4). Par exemple, pour trouverl’effectif de la classe De 8 a 12, on calcule la probabilite qu’une note soit comprise entre 8 et 12 :

P (8 ≤ X ≤ 12) = P (X ≤ 12)− P (X ≤ 8)

= P (T ≤ 12− 104

)− P (T ≤ 8− 104

) = P (T ≤ 0, 5)− P (T ≤ −0, 5)

= P (T ≤ 0, 5)− (1− P (T ≤ 0, 5))= 0, 6915− (1− 0, 6915) = 0, 383

Il y a 100 copies, donc il devrait y avoir 100× = 38, 3. En procedant ainsi, on complete donc le tableausuivant :

Intervalles Moins de 4 De 4 a 8 De 8 a 12 De 12 a 16 De 16 a 20Effectifs theoriquesNi 7, 3 24, 17 38, 29 24, 17 6, 06

Effectifs reels ni 8 25 45 10 12(Ni−ni)2

Ni0, 07 0, 03 1, 17 8, 31 5, 82 15, 4

Le degre de liberte est ν = 5−3 = 2 donc χ2T = 5, 991. On a χ2

calc > χ2T donc on rejette le modele et on

considere que les notes ne suivent pas une loi normale de moyenne 10 et d’ecart-type 4. Le professeurdevrait revoir ses notes.A titre anecdotique, on peut remarquer que l’ecart entre la theorie et la pratique est plus grand surl’intervalle entre 16 et 20 que sur l’intervalle moins de 4.

40 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 41: Probabilité   échantillonage

Echantillonnage et estimation 5 SOLUTIONS DES EXERCICES

Solution 3.2

X ni B(100; 0, 04)Ni = 100C100

x px(1− p)100−x (ni−Ni)2

Ni

01

0 a 1

27

9

1, 697, 03

8, 72 0, 01

2 14 14, 5 0, 023 21 19, 73 0, 084 19 19, 94 0, 045 17 15, 95 0, 076 11 10, 52 0, 02

789

7 a 9540

95, 892, 851, 90

10, 64 0, 25

100 lots 100 χ2cal = 0, 49

Le tableau comporte maintenant 7 lignes, et on teste une loi binomiale donc ν = 7 − 1 = 6 doncχ2T = 12, 592. On a χ2

calc < χ2T donc ce modele est bon.

X ni B(100; 0, 03)Ni = 100C100

x px(1− p)100−x (ni−Ni)2

Ni

01

0 a 1

27

9

4, 7614, 7

19, 46 5, 62

2 14 22, 52 3, 223 21 22, 75 0, 134 19 17, 06 0, 225 17 10, 13 4, 666 11 4, 96 7, 35

789

7 a 9540

92, 060, 740, 32

3, 12 11, 08

100 lots 100 χ2cal = 32, 28

On a χ2cal > χ2

T = 12, 592 donc on rejette le modele.

X ni B(100; 0, 0392)Ni = 100C100

x px(1− p)100−x (ni−Ni)2

Ni

01

0 a 1

27

9

1, 837, 48

9, 31 0, 01

3 21 20, 14 0, 044 19 19, 92 0, 045 17 15, 6 0, 126 11 10, 08 0, 08

789

7 a 9540

95, 522, 621, 7

9, 84 0, 07

100 lots 100 χ2cal = 0, 36

41 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 42: Probabilité   échantillonage

Echantillonnage et estimation 5 SOLUTIONS DES EXERCICES

Ce modele est tres bon.

X ni P (4)Ni = 100× e−4 4x

x!(ni−Ni)2

Ni

01

0 a 1

27

9

1, 837, 33

9, 16 0

2 14 14, 65 0, 033 21 19, 54 0, 114 19 19, 54 0, 015 17 15, 63 0, 126 11 10, 42 0, 03

789

7 a 9540

95, 952, 982, 13

11, 06 0, 39

100 lots 100 χ2cal = 0, 69

Le tableau comporte maintenant 7 lignes, et on teste une loi de Poisson donc ν = 7 − 2 = 5 doncχ2T = 11, 07. La encore, le modele est bon.

Solution 3.3

poids ni = nombre de sacs xi = centre de classe nixini(xi−m)2

500

< 45 35 44 1540 3, 217845− 47 53 46 2438 2, 421947− 49 76 48 3648 1, 124749− 51 100 50 5000 0, 121751− 53 88 52 4576 0, 26253− 55 78 54 4212 1, 617555− 57 42 56 2352 2, 2889> 57 28 58 1624 2, 9191total 500 25390 13, 9736

la moyenne est de 25390500 = 50, 78 kilos et l’ecart-type est

√13, 9736 ≈ 3, 74. On peut donc penser que

les poids suivent une loi normale N(50, 78; 3, 74).

poids nombre de sacsxi−mσ

(t1 < ∗ < t2)Π(t1) Π(t2) Ni = 500(Π(t2) − Π(t1))

< 45 35 < −1, 54 0 0, 06178 30, 8945 < ∗ < 47 53 −1, 54 < ∗ < −1, 01 0, 06178 0, 15625 47, 23547 < ∗ < 49 76 −1, 01 < ∗ − 0, 48 0, 15625 0, 31561 79, 6849 < ∗ < 51 100 −0, 48 < ∗ < 0, 06 0, 31561 0, 52392 104, 15551 < ∗ < 53 88 0, 06 < ∗ < 0, 6 0, 52392 0, 72575 100, 91553 < ∗ < 55 78 0, 6 < ∗ < 1, 13 0, 72575 0, 87076 72, 50555 < ∗ < 57 42 1, 13 < ∗ < 1, 66 0, 87076 0, 95154 40, 39

> 57 28 > 1, 66 0, 95154 1 24, 23

500 500

donc

χ2cal =

(35− 30, 89)2

30, 89+

(53− 47, 235)2

47, 235+

(76− 79, 68)2

79, 68+

(100− 104, 155)2

104, 55

+(88− 100, 915)2

100, 915+

(78− 72, 505)2

72, 505+

(42− 40, 39)2

40, 39+

(28− 24, 23)2

24, 23≈ 4, 306

42 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 43: Probabilité   échantillonage

Echantillonnage et estimation 5 SOLUTIONS DES EXERCICES

On regarde le tableau du χ2T avec ν = 8− 3 = 5. On a χT = 11, 07 et donc χ2

cal < χ2T et on accepte le

modele.

Solution 4.1 On utilise le tableau des effectifs theoriques suivants :

Groupe O A B AB Totalpopulation globale 239

717215717

200717

63717

1 er echantillon 353717 × 239 ≈ 117, 7 353

717 × 215 ≈ 105, 9 353717 × 63 ≈ 98, 5 353 − (117, 7 + 105, 9 + 98, 5) = 31, 1 353

2 eme echantillon 239 − 117, 7 ≈ 121, 3 215 − 105, 9 ≈ 109, 1 200 − 98, 5 ≈ 101, 5 364 − (121, 3 + 109, 1 + 101, 5) = 32, 1 364Total 239 215 200 63 717

on peut alors calculer

χ2cal =

(121− 117, 7)2

117, 7+

(120− 105, 9)2

105, 9+

(79− 98, 5)2

98, 5+

(33− 31, 1)2

31, 1

+118− 121, 3)2

121, 3+

(95− 109, 1)2

109, 1+

(121− 101, 5)2

101, 5+

(30− 32, 1)2

32, 1≈ 11, 74

On a calcule trois frequences theoriques, le degre de liberte est donc 3. Avec un seuil de confiance de 5%, le χ2

T est de 7,815 donc χ2cal > χ2

T et on rejette l’hypothese. Cela signifie que les deux echantillonsne proviennent pas de la meme population.

Solution 4.2 On complete le tableau precedent :

S.R. N.S. BlancsRentiers 35 10 5 50Actifs 90 210 50 350

Retraites 70 23 7 100195 243 62 500

On en deduit la repartition theorique dans le cas ou les votes sont independants :

S.R. N.S. BlancsRentiers 195×50

500 = 19, 5 243×50500 = 24, 3 50− (19, 5 + 24, 3) = 6, 2

Actifs 195×350500 = 136, 5 243×350

500 = 170, 1 350− (136, 5 + 170, 1) = 43, 4Retraites 195×100

500 = 39 243×100500 = 48, 6 100− (39 + 48, 6) = 12, 4

On a donc

χ2calc =

(19, 5− 35)2

19, 5+

(24, 3− 10)2

24, 3+ · · ·+ (12, 4− 7)2

12, 4= 87, 649

On a (3 − 1) × (3 − 1) = 4 degres de liberte. Pour un test au niveau 5%, on lit par consequent dansla table une borne de rejet egale a χ2

T = 9, 488. La valeur observee etant superieure a χ2T , on rejette

l’hypothese donc on conclut que le groupe social influe sur l’opinion.

Solution 4.3 On complete le tableau precedent :

Port ceinture non port de ceintureSeul 2825 3468 6293

Cond. + pass. avant 729 815 1544Cond. + pass. arriere 80 113 193

Cond. + pass. av. et arr. 168 176 3443802 4572 8374

43 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 44: Probabilité   échantillonage

Echantillonnage et estimation 5 SOLUTIONS DES EXERCICES

On en deduit la repartition theorique dans le cas ou il n’y aurait pas de lien :

Port ceinture non port de ceintureSeul 2 6293×3802

8374 ≈ 2857, 18 6293− 2857, 18 ≈ 3435, 82 6293Cond. + pass. avant 1544×3802

8374 ≈ 701, 01 1544− 701, 01 ≈ 842, 99 1544Cond. + pass. arriere 193×3802

8374 ≈ 87, 63 193− 87, 63 ≈ 105, 37 193Cond. + pass. av. et arr. 3802− (2857, 18 + 701, 01 + 87, 63) ≈ 156, 18 344− 156, 18 ≈ 187, 82 344

3802 4572 8374

On a donc

χ2calc =

(2857, 18− 2825)2

2857, 18+

(3435, 82− 3468)2

3435, 82+ · · ·+ (187, 82− 176)2

187, 82≈ 5, 56

On a (4 − 1) × (2 − 1) = 3 degres de liberte. Pour un test au niveau 5%, on lit par consequent dansla table une borne de rejet egale a χ2

T = 7, 815. La valeur observee etant superieure a χ2T , on accepte

l’hypothese donc on conclut que le type de remplissage de la voiture n’influe pas sur le port de laceinture.

44 A. Fredet & J.-M. Gourdon - 2008 - 2009

Page 45: Probabilité   échantillonage

Echantillonnage et estimation

Troisieme partie

TableurUn tableur peut etre d’une grande aide dans le calcul de statistiques et de probabilites, notamment

avec les fonctions suivantes :

Statistiques a une variable

MODE()MAX()MIN()

MEDIANE()QUARTILE()CENTILE()

MOYENNE()MOYENNE.GEOMETRIQUE()MOYENNE.HARMONIQUE()

VARIANCE()ECARTYPE()

Graphiques

GraphiquesCourbe de tendance

Regression lineaire

COEFFICIENT.CORRELATION DROITEREGINDEX(DROITEREG())ORDONNEE.ORIGINE

Combinatoire

COMBIN()PERMUTATION()

Probabilites

LOI.BINOMIALE() LOI.POISSON() LOI.NORMALE()

Intervalle de confiance

INTERVALLE.CONFIANCE()

Test d’ajustement

TEST.KHIDEUX() LOI.KHIDEUX() KHIDEUX.INVERSE()

45 A. Fredet & J.-M. Gourdon - 2008 - 2009