statistics for business and economics, 6/e › lauracasula › files › 2018 › 06 ›...
TRANSCRIPT
![Page 1: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/1.jpg)
Cap. 16-1
Capitolo 13
Test sulla Bontà di Adattamento e Tabelle di Contingenza
Statistica
![Page 2: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/2.jpg)
Cap. 16-2
Obiettivi del Capitolo
Dopo aver completato il capitolo, sarete in grado di:
Usare il test sulla bontà di adattamento per determinarese i dati sono generati da una specifica distribuzione
Effettuare test di normalità Costruire una tabella per l’analisi della contingenza ed
effettuare un test chi-quadrato di associazione
![Page 3: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/3.jpg)
Cap. 16-3
I dati campionari si adattano ad una distribuzioneipotizzata? Esempi: I risultati campionari si adattano a specifiche
probabilità attese? Il numero di chiamate al supporto tecnico è lo
stesso per tutti i giorni della settimana? (i.e., lechiamate hanno una distribuzione uniforme?) Le misurazioni relative ad un processo di
produzione seguono una distribuzione normale?
Test sulla Bontà di Adattamento
![Page 4: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/4.jpg)
Cap. 16-4
Il numero di chiamate al supporto tecnico è lo stesso per tutti igiorni della settimana? (i.e., le chiamate hanno una distribuzioneuniforme?) Per ciascun giorno della settimana, raccogliamo i dati
campionari relativi a 10 giorni:
Somma delle chiamateper giorno della settimanai:
Lunedi 290Martedi 250Mercoledi 238Giovedi 257Venerdi 265Sabato 230Domenica 192
Test sulla Bontà di Adattamento(continuazione)
Σ = 1722
![Page 5: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/5.jpg)
Cap. 16-5
Logica del Test sulla Bontà di Adattamento
Se le chiamate sono distribuite uniformemente,le 1722 chiamate dovrebbero essereequamente divise fra i 7 giorni:
Test chi-quadrato sulla bontà di adattamento:test per vedere se i risultati campionari sonoconsistenti con i risultati attesi
nteuniformeme edistribuit se giornoper attese chiamate 2467
1722=
![Page 6: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/6.jpg)
Cap. 16-6
FrequenzeOsservate vs. Attese
OsservateOi
AtteseEi
LunediMartediMercolediGiovediVenerdiSabatoDomenica
290250238257265230192
246246246246246246246
TOTALE 1722 1722
![Page 7: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/7.jpg)
Cap. 16-7
Statistica Test Chi-Quadrato
La statistica test è
1)Kg.d.l. (dove E
)E(OK
1i i
2ii2 −=
−=∑
=
χ
dove:K = numero di categorieOi = frequenza osservata per la categoria iEi = frequenza attesa per la categoria i
H0: La distribuzione delle chiamate è uniformerispetto ai giorni della settimana
H1: La distribuzione delle chiamate non è uniforme
![Page 8: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/8.jpg)
Cap. 16-8
Regione di Rifiuto
Rifiutare H0 se
∑=
−=
K
1i i
2ii2
E)E(Oχ
2α
2 χ>χ
0
α
χ2α
Rifiutare H0Non rifiutare H0
(con K – 1 gradi di libertà)χ2
H0: La distribuzione delle chiamate è uniformerispetto ai giorni della settimana
H1: La distribuzione delle chiamate non è uniforme
![Page 9: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/9.jpg)
Cap. 16-9
23.05246
246)(192...246
246)(250246
246)(290 2222 =
−++
−+
−=χ
Statistica Test Chi-Quadrato
0
α = .05
Rifiutare H0Non rifiutare H0
χ2
K– 1 = 6 (7 giorni della settimana quindi usiamo 6 gradi di libertà):
χ2.05 = 12.59
χ2.05 = 12.59
Conclusione: χ2 = 23.05 > χ2
α = 12.59 quindi rifiutiamo H0 e concludiamo chela distribuzione non è uniforme
H0: La distribuzione delle chiamate è uniformerispetto ai giorni della settimana
H1: La distribuzione delle chiamate non è uniforme
![Page 10: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/10.jpg)
Cap. 16-10
Test sulla Bontà di Adattamento, Parametri della Popolazione non Noti
Idea: Verificare se i dati hanno una specifica
distribuzione (per esempio binomiale, Poisson, o normale) . . .
. . . senza assumere che i parametri della popolazione siano noti
Usiamo i dati campionari per stimare i parametri della popolazione che non sono noti
![Page 11: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/11.jpg)
Cap. 16-11
Supponiamo che l’ipotesi nulla specifichi la probabilitàper le categorie che dipendono dalla stima (dai dati) dim parametri non noti della popolazione
Il test sulla bontà di adattamento appropriato coincide con quello fornito precendentemente . . .
. . . tranne che nel numero di gradi di libertà per la variabile Chi-quadrato che è
Dove K è il numero di categorie
∑=
−=
K
1i i
2ii2
E)E(Oχ
1)m(KLibertà di Gradi −−=
Test sulla Bontà di Adattamento, Parametri della Popolazione non Noti
(continuazione)
![Page 12: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/12.jpg)
Cap. 16-12
Test di Normalità
In statistica è comune l’assunzione che i datiabbiano una distribuzione normale
La normalità è stata verificata precedentemente Normal probability plot (Capitolo 6)
Qui sviluppiamo un test chi-quadrato
![Page 13: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/13.jpg)
Cap. 16-13
Test di Normalità
Con i dati campionari si possono stimare due parametridella popolazione:
Per una distribuzione normale, Indice di Asimmetria = 0Indice di Curtosi = 3
(continuazione)
3
n
1i
3i
ns
)x(xAsimmetria di Indice
∑−
−=
4
n
1i
4i
ns
)x(xCurtosi di Indice
∑−
−=
![Page 14: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/14.jpg)
Cap. 16-14
Test di Normalitàdi Jarque-Bera
Consideriamo l’ipotesi nulla che la distribuzione dellapopolazione sia normale
Il Test di Normalità di Jarque-Bera è basato sulla vicinanzadell’asimmetria campionaria a 0 e della curtosi campionaria a 3
La statistica test è
Quando il numero di osservazioni campionarie cresce, questastatistica assume una distribuzione Chi-quadrato con 2 gradi dilibertà
L’ipotesi nulla viene rifiutata per valori grandi della statistica test
−+=
243)(Curtosi
6a)(AsimmetrinB
22
![Page 15: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/15.jpg)
Cap. 16-15
Test di Normalitàdi Jarque-Bera
L’approssimazione alla Chi-quadrato è molto buona solo per campioni veramente grandi
Se il campione non è grande, la statistica test di Jarque-Bera èconfrontata con i valori significativi della tabella 13.7 del libro
(continuazione)
Ampiezzacampionaria
n
Livello di significatività
10%
Livello di significatività
5%
Ampiezzacampionaria
n
Livello di significativit
à10%
Livello di significatività
5%2030405075
100125150
2.132.492.702.903.093.143.313.43
3.263.713.994.264.274.294.344.39
200250300400500800∞
3.483.543.683.763.914.324.61
4.434.614.604.744.825.465.99
![Page 16: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/16.jpg)
Cap. 16-16
È stata registrata, per 200 giorni selezionati a caso, latemperatura media giornaliera. L’asimmetriacampionaria è risultata 0.232 e la curtosi campionaria3.319
Verificare l’ipotesi nulla che la vera distribuzione sianormale
Dalla tabella 13.7 il valore critico al 10% per n = 200 è3.48, quindi non ci sono sufficienti evidenze per rifiutarel’ipotesi che la popolazione sia normale
2.64224
3)(3.3196
(0.232)20024
3)(Curtosi6
a)(AsimmetrinB2222
=
−+=
−+=
Esempio: Test di Normalitàdi Jarque-Bera
![Page 17: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/17.jpg)
Cap. 16-17
Tabelle di Contingenza
Tabelle di Contingenza
Usate per classificare le osservazionicampionarie secondo due caratteristiche
Anche chiamate tabelle cross-classification ocross-tabulation
Assumiamo ci siano r categorie per lacaratteristica A e c categorie per lacaratteristica B Allora ci sono (r x c) possibili classificazioni
![Page 18: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/18.jpg)
Cap. 16-18
Tabella di Contingenza r x c
Caratteristica B
Caratteristica A 1 2 . . . C Totali
12...r
Totali
O11
O21
.
.
.Or1
C1
O12
O22
.
.
.Or2
C2
…………………
O1c
O2c
.
.
.Orc
Cc
R1
R2
.
.
.Rr
n
![Page 19: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/19.jpg)
Cap. 16-19
Test di Associazione
Considera n osservazioni tabulate in unatabella di contingenza r x c
Denotiamo con Oij il numero di osservazioninella cella che corrisponde alla ima riga e jma
colonna L’ipotesi nulla è
L’appropriato test è un test chi-quadrato con (r-1)(c-1) gradi di libertà
epopolazion nella tichecaratterisdue le fra neassociazio di Assenza :H0
![Page 20: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/20.jpg)
Cap. 16-20
Test di Associazione
Siano Ri e Cj i totali per riga e per colonna Il numero atteso di osservazioni nella cella che
corrisponde alla riga i e alla colonna j, se H0 è vera, è
Un test di associazione a livello di significatività α èbasato sulla distribuzione Chi-quadrato e sulla seguenteregola di decisione
21),1)c(r
r
1i
c
1j ij
2ijij2
0 E)E(O
se H Rifiutare αχχ −−= =
>−
=∑∑
nCR
E jiij =
(continuazione)
![Page 21: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/21.jpg)
Cap. 16-21
Esempio: Tabella di Contingenza
H0: Assenza di associazione tra mano dominantee sesso
H1: La mano dominante non è independente dalsesso
Essere mancini vs. Sesso
Mano Dominante: Sinistra vs. Destra
Sesso: Maschio vs. Femmina
![Page 22: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/22.jpg)
Cap. 16-22
Esempio: Tabella di Contingenza
Risultati campionari organizzati in una tabella di contingenza:
Sesso
Mano dominante
Sinistra Destra
Femmina 12 108 120
Maschio 24 156 180
36 264 300
120 Femmine, 12 erano mancine
180 Maschi, 24 erano mancini
Dimensione campionen = 300:
(continuazione)
![Page 23: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/23.jpg)
Cap. 16-23
Logica del Test
Se H0 è vera, allora la proporzione di donne mancine dovrebbe coincidere con la proporzione di uomini mancini
Le due proporzioni precedenti dovrebbero coincidere con la proporzione generale di persone mancine
H0: Assenza di associazione tra mano dominantee sesso
H1: La mano dominante non è independente dal sesso
![Page 24: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/24.jpg)
Cap. 16-24
Calcolo delle Frequenze Attese
In generale:
P(mancino)= 36/300 = .12
120 Femmine, 12 erano mancine
180 Maschi, 24 erano mancine
Se non c’è associazione, allora
P(Mancino | Femmina) = P(Mancino | Maschio) = .12
Quindi ci aspetteremmo che il 12% delle 120 femmine e il 12% dei 180 maschi siano mancini…
i.e., ci aspetteremmo (120)(.12) = 14.4 femmine mancine(180)(.12) = 21.6 maschi mancini
![Page 25: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/25.jpg)
Cap. 16-25
Calcolo delle Frequenze Attese
Frequenza attesa delle celle:
campione del Totale DimensioneColonna) j )(totale Riga i (totale
nCR
Emama
jiij ==
14.4300
(120)(36)E11 ==
Esempio:
(continuazione)
![Page 26: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/26.jpg)
Cap. 16-26
Frequenze Osservate vs. Attese
Frequenze osservate vs. frequenze attese:
SessoMano dominante
Sinistra Destra
FemminaOsservate = 12Attese = 14.4
Osservate = 108Attese = 105.6
120
MaschioOsservate = 24Attese = 21.6
Osservate = 156Attese = 158.4
180
36 264 300
![Page 27: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/27.jpg)
Cap. 16-27
Statistica Test Chi-Quadrato
dove:Oij = frequenza osservata nella cella (i, j)Eij = frequenza attesa nella cella (i, j)r = numero di righec = numero di colonne
∑∑= =
−=
r
1i
c
1j ij
2ijij2
E)E(O
χ
La statistica test chi-quadrato è:
)1)(1(... con −−= crldg
![Page 28: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/28.jpg)
Cap. 16-28
Frequenze Osservate vs. Attese
SessoMano dominante
Sinistra Destra
FemminaOsservate = 12Attese = 14.4
Osservate = 108Attese = 105.6
120
MaschioOsservate = 24Attese = 21.6
Osservate = 156Attese = 158.4
180
36 264 300
7576.04.158
)4.158156(6.21
)6.2124(6.105
)6.105108(4.14
)4.1412( 22222 =
−+
−+
−+
−=χ
![Page 29: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/29.jpg)
Cap. 16-29
Test di Associazione
χ2χ2.05 = 3.84
Rifiutare H0
α = 0.05
Regola di Decisione:
Rifiutare H0 se χ2 > 3.84
1(1)(1)1)-1)(-( g.d.l.con 7576.02 ==== crχ
Non rifiutare H0
Poichéχ2 = 0.7576 < 3.84 non rifiutiamo H0 e concludiamo chesesso e manodominante non sono associati
![Page 30: Statistics for Business and Economics, 6/e › lauracasula › files › 2018 › 06 › ...Statistics for Business and Economics, 6/e Author Dirk Yandell Subject Chapter 16 Created](https://reader033.vdocument.in/reader033/viewer/2022060506/5f1f6966c8a61e5e4d61b1cb/html5/thumbnails/30.jpg)
Cap. 16-30
Riepilogo del Capitolo
Usato il test chi-quadrato sulla bontà di adattamento perdeterminare se i dati campionari si adattano a specifichedistribuzioni di probabilità
Effettuati test sulla bontà di adattamento quando iparametri della popolazione non sono noti
Verificata la normalità usando il test di Jarque-Bera Usate tabelle di contingenza per effettuare un test chi-
quadrato di associazione Per ogni cella confrontate le frequenze osservate con le
frequenze attese