Download - Seminar 2 - Prezentacija
-
7/22/2019 Seminar 2 - Prezentacija
1/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 1/71
LLLSeminari u okviruTEMPUS projekta
Naziv projekta: 511140 TEMPUS JPCRMaster programe in Applied Statistics - MAS
Broj projekta: 511140
Nosilac projekta: Departman za matematiku i informatiku,PMF Novi Sad
Rukovodilac: Prof. dr Andreja Tepavevi
Vreme trajanja: 15.10.2010. 14.10.2013.
Finansiranje: Projekat finansira EU
-
7/22/2019 Seminar 2 - Prezentacija
2/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 2/71
STATISTIKA ANALIZA PODATAKA,
IZBOR I OBRADA UZORKA
I
T U M A E N J E R E Z U L T A T A
I S T R A I V A N J A
-
7/22/2019 Seminar 2 - Prezentacija
3/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 3/71
etvrta etapa- STATISTIKA ANALIZA PODATAKA
U procesu statistikog istraivanja na nekoj populaciji, polazi se odpojedinanih vrednosti obeleja, to znai da operiemo velikim brojempodataka. esto se u praksi trai brza informacija, pa je potrebno definisatineku karakteristiku obeleja koja e u veoj ili manjoj meri dobropredstavljati to obeleje. Drugim reima, treba seriju podataka zamenitimalim brojem nekih novih veliina.
Ti brojevi koji na neki nain prezentuju posmatrano obeleje nazivaju separametri obeleja. Oni su pokazatelji (mere) rasporeda vrednostiposmatranog obeleja na uzorku i populaciji. U tu svrhu, tj. za dobijanje vieinformacija o statistikim serijama, koriste se:
(1)srednje vrednosti(mere centriranosti, mere centralne tendencije),
(2) mere odstupanja, i
(3) mere oblika.
-
7/22/2019 Seminar 2 - Prezentacija
4/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 4/71
(1) SREDNJE VREDNOSTI
Srednje vrednosti nose zajednike karakteristike svih vrednosti obeleja naposmatranom statistikom skupu. Pojam srednje vrednosti posmatranog
obeleja moe se uvesti po dva osnova, pa razlikujemo:
- raunske srednje vrednosti(izraunate iz podataka uzorka ili populacije, ato su: aritmetika sredina, geometrijska sredina, harmonijska sredina,
sredina kvadrata, i dr.) i
-pozicione srednje vrednosti(one su odreene pozicijom koju zauzimaju useriji podataka, a to su: medijanai modus (mod)).
-
7/22/2019 Seminar 2 - Prezentacija
5/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 5/71
ARITMETIKA SREDINA
Neka su 1 2, , ..., nx x x vrednosti numerikog obeleja X uzete u uzorak.Aritmetika sredinavredosti obeleja X na ovom uzorku je vrednost:
=
= 1
1.
n
n ii
x xn
U sluaju intervalno prikazanih podataka odreuju se sredine intervala (klasa)++= 12 ,
i i
i
a asx =( 1,..., ),i k pa je aritmetika sredina
nx data sa:
= == = 1 1
1, za .i
k k
n i s ii i
x f x f nn
Aritmetika sredina se smatra najvanijom merom obeleja i ima veliki znaaju ozbiljnim statistikim analizama. Aritmetika sredina je osetljiva na
ekstremne vrednosti, ali je zato saglasna sa pojavom koja se ponaa linearno.Zbir odstupanja svake pojedinane vrednosti obeleja od aritmetikesredine jednak je nuli, tj.
( )= =
1
0.n
n
ii
x x
-
7/22/2019 Seminar 2 - Prezentacija
6/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 6/71
Zbir kvadrata odstupanja svake pojedinane vrednosti obeleja odaritmetike sredine je minimalan, tj.
( ) ( )= =
2 2
1 1,
n n
ni ii i
x x x a
gde je a proizvoljan broj.
PRIMER 9.Za uzorak obraen u Primeru 7 aritmetika sredina je = 7.4425nx ,
dok za te iste podatke grupisane i prikazane u Tabeli 5 je = 7.44nx . Jasno jeda vrednost
n
x preciznije izraunata, jer se grupisanjem podataka izgubilona preciznosti, u ovom sluaju zanemarljivo malo.
-
7/22/2019 Seminar 2 - Prezentacija
7/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 7/71
GEOMETRIJSKA SREDINA
Geometrijska sredina G od brojeva 1 2, , ..., nx x x data je sa:
= 1 2 ... .n
nG x x x
PRIMER 10.Plata radnika posle prve godine staa bila je 16 000 dinara, posledruge 20 000 dinara i posle tree godine 24 000 dinara. Koliko iznosi
proseno poveanje ove plate.
Reenje.Ovaj problem se reava preko geometrijske sredine, pa je
= = =1 2
20000 24000 3.
16000 20000 2G x x
Zaista, =3 32 216000 24000, tj. plata se proseno poveavala32 puta,
tj. u odnosu na prvu godinu plata se poveala 1.5 puta.
-
7/22/2019 Seminar 2 - Prezentacija
8/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 8/71
HARMONIJSKA SREDINA
Harmonijska sredina se koristi kod obrnuto proporcionalnih veliina iizraunava se za vrednosti razliite od nule.
Harmonijska sredinapredstavlja recipronu vredost aritmetike sredinerecipronih vrednosti obeleja ,X pa za uzorak ( )1 2, , ..., nx x x harmonijskasredina je:
( )=
= =+ + + 1 2
1 1 1 11
1
1....
ni
n
n x x x x
i
nH
Odnos prethodnih triju sredina je sledei:
__
.nH G x
-
7/22/2019 Seminar 2 - Prezentacija
9/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 9/71
PRIMER 11.Dva radnika rade na dve iste maine. Za 1h prvi radnik proizvede6 proizvoda, a drugi radnik 4 proizvoda. Nai:
)a prosean broj proizvoda po radniku na toj maini;)b proseno vreme za jedan proizvod na toj maini.
Reenje.
)a Prosean broj proizvoda po radniku na toj maini je aritmetika sredina+ += = =1 2 6 42 2 2 5.
x xx
)b Za jedan proizvod prvom radniku treba 10 minuta, a drugom 15minuta. Zato proseno vreme za jedan proizvod na toj maini jeharmonijska sredina te dve vrednosti:
+= = = =
+1 110 15
2 60 10 1512, a ne 12.5 minuta.
5 2H
-
7/22/2019 Seminar 2 - Prezentacija
10/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 10/71
MEDIJANA
Medijana jepozicionasrednja vrednost koja je odreena pozicijom kojuzauzima u rastuem nizu vredosti obeleja X. Kako je aritmetika sredina
n
x osetljiva na ekstremne vredosti obeleja, uticaj tih ekstremnih vrednostise iskljuuje upotrebom medijane ili moda (modusa).Medijana je ona vrednost obeleja koja varijacioni niz vrednosti deli na dvajednaka dela. Zato definicija pojma medijane zavisi od toga da li je broj nparan ili neparan.
Neka je 1 2, , ..., nx x x varijacioni niz uzorakih vrednosti obeleja X.
Medijanase definie kao vrednostmed
x data sa:
+
+
= +
( 1)/2
/2 /2 1
, ako je neparan broj;
, ako je paran broj.2
n
med n n
x n
x x xn
-
7/22/2019 Seminar 2 - Prezentacija
11/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 11/71
U sluaju kada je n paran broj, moe se dogoditi da ta vrednost ne pripadavarijacionom nizu 1 2, , ..., nx x x .
Geometrijski gledano, medijana je taka na x-osikoja deli histogram na dvadela jednakih povrina.
PRIMER 12.Medijana za uzorak iz Primera 6 odreuje se uvidom u Tabelu 3 ikolonu kumulativ ispod iz te tabele.
Tabela 3
potr. ( )ix br. dom.
( )if rel. fr.[%]
kum.ispod
kum.iznad
kum.fr.[%]
7 8 20% 8 40 20%
9 4 10% 12 32 30%12 10 25% 22 28 55%15 6 15% 28 18 70%16 7 17,5% 35 12 87.5%
20 512,5%
40 5 100% 40 100%
-
7/22/2019 Seminar 2 - Prezentacija
12/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 12/71
Trei lan u toj koloni je broj 22, to znai da se u tom kumulativu prvi putsadri 20, tj. / 2n vrednosti obeleja iz rastueg varijacionog niza. To znai davrednost obeleja = =3 12kg medx x predstavlja medijalnu vrednost mesenepotronje voa u zimskom periodu za jednu porodicu. U ovom primeru,
=40 12.85kgx to znai da su u ovom sluaju vrednosti aritmetike sredine i
medijane pribline.
PRIMER 13.Medijana za uzorak iz Primera 7 dobija se kao aritmetika sredina20. i 21. vrednosti obeleja (prosena ocena), jer je obim uzorka 40. Zato od
uzorakih vrednosti moramo prvo napraviti varijacioni niz, a on je sledei nizvrednosti:
6.53 6.58 6.60 6.71 6.77 6.80 6.80 6.86 6.87 6.89
6.90 6.94 7.06 7.10 7.11 7.12 7.20 7.31 7.33 7.34
7.34 7.48 7.50 7.53 7.53 7.54 7.57 7.57 7.87 7.90
7.95 7.97 8.00 8.11 8.20 8.48 8.50 8.57 8.60 8.67
-
7/22/2019 Seminar 2 - Prezentacija
13/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 13/71
+ += = = =20 21 40
7.34 7.347.34 7.44 .2 2med
x xx x
Kod intervalnih serijadistribucije frekvencija, izrauna se kumulativ ispod iodredi se medijalni interval [ )
+1
, ,m m
a a ( )= 1,..., 1 .m k To je prvi u nizurastuih intervala koji sadri / 2n vrednosti posmatranog obeleja. Ako je mf frekventnost toga intervala, onda je
= + 1/ 2
,mmed mm
n Fx a d
f
gde je
=
= 1
11
m
m jj
F f kumulativna frekvencija predmedijalnog intervala i
d duina medijalnog intervala.
-
7/22/2019 Seminar 2 - Prezentacija
14/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 14/71
Za Primer 7, prikazan Tabelom 5, medijalni interval je[ )7.2,7.6 i
= + = = 4020 16
7.2 0.4 7.33 7.44 .12med
x x
Vrednosti medx i
,medx su priblino jednake i obe se bitno razlikuju odaritmetike sredine. Da li je ta razlika zaista bitna, moe se proveriti metodomtestiranja parametarske hipoteze o uzorakoj srednjoj vrednosti. Kada seneke izraunate vrednosti iz obinog rasporeda uzorka i iz intervalno
sreenih podataka tog istog uzorka bitno razlikuju, koriste se takozvaneepardove korekcijeza popravku ovih vredosti.
U svakom sluaju, ta razlika ukazuje na injenicu da u svakom konkretnom
uzorku treba dobro razmisliti koju meru centriranosti treba koristiti.Prava = 7.33x deli histogram na Slici 2 na dva dela jednakih povrina.
-
7/22/2019 Seminar 2 - Prezentacija
15/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 15/71
MODUS (MOD)
Modusili modje onapozicionavrednost obeleja koja se najee pojavljujeu realizovanom uzorku. Takvih vrednosti moe biti jedna ili vie. Kodneprekidnih numerikih obeleja merenih intervalnom skalom ili skalomodnosa, nema velike potrebe za ovom vrednou. U tom sluaju, aritmetikasredina je najbolja mera centriranosti.
PRIMER 14.U Primeru 6, modus je =mod 12kgx , to znai da je najee sluajda domainstva troe 12kg voa meseno u zimskom periodu. U ovomprimeru je = =mod 12kgmedx x .
-
7/22/2019 Seminar 2 - Prezentacija
16/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 16/71
PRIMER 15.U Primeru 7, postoje etiri modalne vrednosti: =mod(1)
6.80,x
=mod(2) 7.34,x =mod(3) 7.53,x =mod(4) 7.57.x
U sluaju intervalno prikazanih podataka, prvo se odredi modalni interval, tj.
interval koji ima najveu frekventnost. Modus je vrednost iz toga intervala,npr. [ )+1, ,m ma a koja se izraunava po formuli:
( ) ( )
+
= +
+ 1
mod
1 1
,m mmm m m m
f fx a d
f f f f
gde su 1,m mf f i +1mf frekvencije modalnog, predmodalnog i postmodalnogintervala i d - duina intervalnih klasa.
PRIMER 16.Za Primer 7, iji su grupisani podaci prikazani u Tabeli 5, modalni
interval je [ )7.2,7.6 , pa je: = + = < =
+ mod
12 117.2 0.4 7.24 7.33 .
(12 11) (12 4) medx x
Geometrijski, modus je vrednost na x osiza koju poligon frekvencija
dostie maksimum (taka 3T na Slici 2).
-
7/22/2019 Seminar 2 - Prezentacija
17/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 17/71
Slika 2.Histogram i poligon apsolutne irelativne frekvencije prosene ocene studenata.
-
7/22/2019 Seminar 2 - Prezentacija
18/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 18/71
Priblina vrednost modusa moe se odrediti i na histogramu: dijagonalno sespoje krajnja i poetna vrednost histograma na modalnom intervalu sakrajnjom takom histograma predmodalnog i poetnom takom histogramapostmodalnog intervala. Apscisa take preseka ovih dui je modalna taka(Slika 49).
Slika 49.Modus odreen iz histograma frekvencija.
-
7/22/2019 Seminar 2 - Prezentacija
19/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 19/71
(2) MERE ODSTUPANJA
Mere centriranosti, kao to su aritmetika sredina i druge, ne daju dovoljnoinformacija o obeleju.
PRIMER 17.Posmatrajmo ocene dva studenta.
Prvi: 7,8,8,9,7,8,9,8,8,9 = =10 8.1, 8medx x i =mod 8.x
Drugi: 7,6,8,6,10,8,10,6,10,10 =10 8.1,y = 8medy i =mod 10.y
Primeujemo da se njihove prosene ocene i medijane poklapaju, ali kod
prvog studenta duina intervala varijacije [ ]( )7,9 je 2, dok je kod drugogtaj interval [ ]( )6,10 duine 4, to ukazuje na vee varijacije u kvalitetupripreme ispita. Te uoene razlike mogu se oceniti merama rasturanja ilimerama odstupanja (varijacije).
-
7/22/2019 Seminar 2 - Prezentacija
20/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 20/71
RASPON VARIJACIJE
Raspon varijacijeje odreen duinom intervala varijacije obeleja ipredstavlja razliku izmeu najvee i najmanje vrednosti obeleja:
= max min.R x x
Ova mera nije uvek dobar pokazatelj rasturanja vrednosti obeleja jer zavisiod ekstremnih vrednosti, koje su esto izuzetci i kao takve ih obinoiskljuujemo iz uzorka.
-
7/22/2019 Seminar 2 - Prezentacija
21/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 21/71
SREDNJE APSOLUTNO ODSTUPANJE
Ova mera odstupanja pokazuje proseno odstupanje svake vrednostiobeleja od aritmetike sredine uzorka, tj.
== 1
1.
n
nii
sao x x n
Ako se radi o intervalnoj distribuciji frekvencija, onda je:
== 1
1, gde je sredina klse.i i
k
ni s si
sao f x x x n
U Primeru 17, sao =prvi 0.54 i sao =drugi 1.52 to ukazuje na znaajno veerasturanje oko srednje vrednosti uzorka.
-
7/22/2019 Seminar 2 - Prezentacija
22/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 22/71
SREDNJE KVADRATNO ODSTUPANJE
Rad sa apsolutnim vrednostima valjalo bi, kad god je to mogue, izbei. To se
jednostavno postie kvadriranjem prethodno posmatranih razlika nix x .
Na taj nain dolo se do jedne nove mere odstupanja, koja je istovremeno
najvanija i najvie se koristi.
Uzoraka disperzija(ili disperzija uzorkaili srednje kvadratno odstupanje)definie se sa:
( )= =
= = 22 22
1 1
1 1 .n n
n nn i ii i
s x x x x n n
U praksi i u raunarskim paketima dosta se koristi tzv. korigovanailipopravljena vrednost uzorake disperzije:
( )=
= =
22 2
1
1 .1 1
n
nn n ii
ns s x x n n
Kada je obim uzorka n veliki, svejedno je koju od ove dve mere emokoristiti.
Lif L L i i li d i i (LLL i i)
-
7/22/2019 Seminar 2 - Prezentacija
23/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 23/71
Kako bi se ova mera odstupanja izraavala u istim jedinicama kao i vrednostiobeleja, posmatra se kvadratni koren iz uzorake disperzije. Ta vrednost
=2
n ns s se naziva standardna devijacija.
Navedene formule vae i za intervalno prikazane podatke, stim to se za
popravku vrednosti2
ns koristi epardova korekcija za uzoraku disperziju(objavljena prvi put u jednom asopisu iz 1898.) koja je data formulom:
=
22 2
, pri emu su svi intervali iste duine .12
n nd
s s d
Uopte, prosek odstupanja vrednosti obeleja od aritmetike sredine uzet nanekom stepenu ,k naziva se centralni momenat reda k:
( )== =
2
21
1, gde je .
n k
n nk ii
c x x c sn
Za njihovo izraunavanje koriste se obini momentik-tog reda:
== =1
1
1
, gde je .
nk
nk iim x m x n
Lif L L i i li d t ti ti (LLL i i)
-
7/22/2019 Seminar 2 - Prezentacija
24/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 24/71
Te veze za neke centralne momente su sledee:
( )
( ) ( )= =
= =
= = =
= = =
= = +
= +
= + =
1
11 1
2 222
1 1
22
1 1 1
2 22 1 1 1 2 1
1 1 10
1 12
1 12
12 ,
n n
n ni ii i
n n
n n ni i ii i
n n nnni i
i i i
c x x x nx n n n
c x x x x x x n n
xx x xn n n
m m m nm m m
n
( ) ( )= =
= = + = + 3 2 33 2 2
3 3 2 1 11 1
1 13 3 3 2
n n
n n n ni i i i i i
c x x x x x x x x m m m mn n
,
( ) ( )= == = + +
= + + = +
4 2 3 44 3 2
41 1
2 2 4 4 2 2 44 3 1 2 1 1 1 4 3 1 2 1 1
1 14 6 4
4 6 4 4 6 3 ,
n n
n n n n ni i i i i i i
c x x x x x x x x x x n nm m m m m m m m m m m m m
= + 55 5 4 1 15 4c m m m m .
Life Long Learning programs in applied statistics (LLL seminari)
-
7/22/2019 Seminar 2 - Prezentacija
25/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 25/71
KOEFICIJENAT VARIJACIJE
Koeficijenat varijacijese koristi za uporeivanje varijabilnostidvaju statistikihskupova i rauna se na sledei nain:
= .n
V
n
sc
x
Ponekad se izraava u % i ima smisla samo ako je 0.nx
PRIMER18.Za uzorak iz Primera 17, pregled nekih mera dat je u Tabeli 7.
Tabela 7.
ocene stud. ( ix ) 6 7 8 9 10 10x medx modx 10s sao 100%Vc
prvi stud. 0 2 5 3 0 8.1 8 8 0.7 0.54 9%
drugi stud. 3 1 2 0 4 8.1 8 10 1.7 1.52 21%
Sve ove izraunate mere pokazuju da je uspeh prvog studenta bolji.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
26/71
Life Long Learning programs in applied statistics (LLL-seminari)
dr Vera Lazarevi, vanr. prof. 26/71
(3) MERE OBLIKA
Sve do sada navedene mere odstupanja mogu se primenitisamo naobeleja za koja je mogue izraunati aritmetiku sredinu. To su obelejaija je merna skala intervalna, skala odnosa i ponekad ordinalna skala. Usluaju nominalne skale, aritmetika sredina ili medijana se ne moeizraunati, ali i za ovu vrstu obeleja treba definisati neku meru odstupanja. Utu svrhu se koriste pokazatelji razliitosti i time se bavi klaster analiza.
Podaci o vrednostima numerikog obeleja na jedinicama statistikog skupa
obino nisu pravilno i simetrino rasporeeni oko svojih srednjih vrednosti.Mere odstupanja ukazuju na veliinu odstupanja od srednje vrednosti, ali ne ina smer odstupanja. Zato se koriste mere asimetrijei spljotenosti.
Neka je ( )1 2, , ..., nx x x realizovani prost sluajan uzorak. Znaajnu informacijuo uzorku daju nam uzoraki momenti:
- obian uzoraki momenat k-tog reda:=
= 11
,n
kk in
im x i
- centralni uzoraki momenat k-tog reda: ( )== 1 1 .n k
nk inic x x
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
27/71
Life Long Learning programs in applied statistics (LLL seminari)
dr Vera Lazarevi, vanr. prof. 27/71
Uzoraka srednja vrednost = 1nx m , a uzoraka disperzija =2
2ns c .
Dodatnu, vrlo vanu informaciju o uzorku dobijamo izraunavajui nekeodnose izmeu obinih i centralnih momenata odgovarajueg reda.
Uzoraki koeficijenat asimetrijeje:( )
= =3 33 32
3n
c c
s c
Uzoraki koeficijenat spljotenosti (ekscesa)je: = 444 3.ncs
Ako je =3 0, onda je = = modn medx x x i raspodela je simetrina u odnosu naaritmetiku sredinu uzorka.
Ako je >3 0, onda je > > modn medx x x i imamo asimetriju udesno.
Ako je
-
7/22/2019 Seminar 2 - Prezentacija
28/71
f g g p g pp ( )
dr Vera Lazarevi, vanr. prof. 28/71
to je 3 po apsolutnoj vrednosti vee, asimetrija je vea. Smatra se da je
asimetrija umerena kada je
-
7/22/2019 Seminar 2 - Prezentacija
29/71
f g g p g pp ( )
dr Vera Lazarevi, vanr. prof. 29/71
Slika 51.Mera spljotenosti
PRIMER 19.Za uzorke iz Primera 17, vai:Za prvog studenta : = = = 33 3
10
0.0483 0.7
0.14cs
i = = 444 3 0.96.n
c
s
Slino izraunavamo i za drugog studenta: = 3 0.03 i = 4 1.35.
U oba sluaja raspodela frekvencija je simetrina u odnosu na srednju ocenustudenta i u oba sluaja spljotenost krive je vea od spljotenosti normalne
krive, ali je kod drugog studenta to vie izraeno.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
30/71
dr Vera Lazarevi, vanr. prof. 30/71
Sada emo u paketu Statistica 8pokazati postupak dobijanja srednjih
vrednosti. Iz menija Statisticsbiramo Basic Statistics/Tables, pa ondaodaberemo Descriptive statistics.Na dugmetu Variablesodaberemo obelejaza koja raunamo srednje vrednosti. U naem sluaju to su obeleja: Srednjaocena, Ocena na diplomskom i druga. Onda prelazimo u karticuAdvancedi
biramo sve srednje vrednosti koje nam trebaju (Slika 52).
Slika 52.Izgled prozora za izbor vrednosti koje raunamo.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
31/71
dr Vera Lazarevi, vanr. prof. 31/71
Nakon tikliranja odreenih opcija prelazimo na odabir varijabli (eng.
Variables)i dobijamo sledei prozor (Slika 53) i potvrdom na Ok, vraamo se uprethodni prozor gde nam preostaje samo da izaberemo opciju Summary:Statistics.
Slika 53.Prozor za izbor varijable
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
32/71
dr Vera Lazarevi, vanr. prof. 32/71
Prethodno opisanim koracima dobijamo rezultate prikazane u sledeimtabelama.
Slika 54.Prikaz tabele sa raunskim i pozicionimvrednostima za studente koji su diplomirali 1995. god.
Slika 55.Prikaz tabele sa raunskim i pozicionim vrednostimaza studente koji su diplomirali u periodu 1995-1999. god.
Slika 56.Prikaz tabele sa raunskim i pozicionim vrednostimaza studente iz sluajnog uzorka cele populacije 1995-1999. god.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
33/71
dr Vera Lazarevi, vanr. prof. 33/71
Nakon klika na Summary: Statistics iz populacije studenata diplomiranih od2000-2004. godine dobijamo sledee tabele sa srednjim vrednostima.
Slika 57.Tabela sa srednjim vrednostimaza uzorak diplomiranih 2001. god.
Slika 58.Tabela sa srednjim vrednostimaza celu populaciju (diplomirali 2000-2004).
Slika 59.Tabela sa srednjim vrednostimaza sluajan uzorak studenata iz populacije 2000-2004.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
34/71
dr Vera Lazarevi, vanr. prof. 34/71
TABLICE KONTIGENCIJE
Programski paket Statistica 8ima mogunost kreiranja tzv. tablicakontigencijekoje su veoma pogodne za praenje nekih statistikih podataka.Na primer, moemo pratiti brojno stanje studenata u odnosu na dvaobeleja godine upisa i godine zavretka studija.
Postupak je sledei:
Najpre iz menija Statisticsbiramo Basic Statistics/Tables, i nakon toga biramoMultiple response tables. Dobiemo novi prozor i u njemu biramo Specify Tablekao na Slici 60.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
35/71
dr Vera Lazarevi, vanr. prof. 35/71
Slika 60.Kreiranje tablice kontigencije za sluajni uzorak iz 2000-2004. god.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
36/71
dr Vera Lazarevi, vanr. prof. 36/71
Sledee to treba da uradimo je da odaberemo obeleja koja elimo da
pratimo. To su u naem sluaju God. upisa i Diplomirao/la, to selektujemoi potvrdimo sa OK. Tada nam se otvara novi prozor u kome treba da kliknemona Summary: Review summary tables(Slika 61).
Slika 61.Poslednji korak pri kreiranju tabele kontigencije.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
37/71
dr Vera Lazarevi, vanr. prof. 37/71
Na taj nain dobijamo eljene rezultate na Slici 62.
Slika 62.Tabela kontigencije za sluajni uzorak iz populacije 2000-2004.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
38/71
dr Vera Lazarevi, vanr. prof. 38/71
Primenom navedenog postupka obraujemo studente koji su diplomirali1991, 1992, 1993 i 1994 (Slika 63).
Slika 63.Tabela kontigencije izmeu godine upisa i godinediplomiranja za studenate koji su diplomirali od 1991-1994. god.
Sa slike jasno moemo videti da je najvie studenata diplomiralo 1991.godine i to njih 73.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
39/71
dr Vera Lazarevi, vanr. prof. 39/71
Obrada jo jedne populacije (20082011.) prikazana je na Slici 64.
Slika 64.Prikaz broja studenata u odnosu nadva obeleja godina upisa i godina diplomiranja.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
40/71
dr Vera Lazarevi, vanr. prof. 40/71
STATISTIKO ZAKLJUIVANJE METODOM UZORAKA
UVODProuavanje osnovnog statistikog skupa retko se vri na celom tom skupu(jer je neekonomino, neracionalno, nemogue i slino). Uzorak je deo tepopulacije koji treba da obezbedi to tanije informacije o osnovnom skupu.Taj zahtev se realizuje kroz reprezentativnostuzorka. Sam izbor elemenata izpopulacije u reprezentativan uzorak moe se izvriti na vie naina (tablicasluajnih brojeva, uz pomo raunara i drugo). U statistikoj teoriji u svakojkonkretnoj situaciji, zavisno od eljene tanosti i stanja u osnovnomstatistikom skupu, moe se odrediti i obim uzorka za zadate oceneparametara.
Na taj nain, uzorak je umanjena slika osnovnog skupa i njegova aritmetikasredina, uzoraka disperzija, mera asimetrije ili mera ekscesa su procene, tj.ocene ovih parametara osnovnog skupa. Pored toga, raspodela frekvencijaposmatranog statistikog obeleja na uzorku predstavlja aproksimativnu
raspodelu sluajne promenljive u osnovnom skupu.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
41/71
dr Vera Lazarevi, vanr. prof. 41/71
Neka je ( )1,..., nX X prost sluajan uzorak od n sluajnih promenljivih1, ..., .nX X Za svaki takav uzorak moemo formirati neku novu sluajnu
promenljivu ( )= 1,..., nY f X X koju nazivamo statistika.
Formule po kojima se raunaju realizovane vrednosti navedenih numerikihkarakteristika obeleja (aritmetika sredina, uzoraka disperzija, mod,medijana, koeficijenat varijacije, mera asimetrije, mera ekscesa, uzorakikoeficijenat korelacije i drugo) mogu posluiti da se za svaku od navedenihkarakteristika napie odgovarajua statistika, po analogiji sa tim formulama, inazivi tih statistika poklapaju se sa nazivima tih numerikih karakteristika.
Life Long Learning programs in applied statistics (LLL-seminari)
b l k d
-
7/22/2019 Seminar 2 - Prezentacija
42/71
dr Vera Lazarevi, vanr. prof. 42/71
Pri prouavanju obeleja na osnovu uzorka sreemo se sa dva osnovnazadatka.
Prvi zadatakima za cilj da na osnovu uzorka ustanovi kakva je raspodelaobeleja u populaciji, kao i da oceni parametre te raspodele izraunavajuirealizovane vrednosti pogodno odabranih statistika. To suproblemi ocene
parametara raspodele.
Drugi zadataksastoji se u tome da na osnovu procenjenih karakteristikaosnovnog skupa iz uzorka, formuliemo i proverimo neku pretpostavku(hipotezu) u vezi sa nekom karakteristikom osnovnog skupa. To suproblemitestiranja (verifikacije) hipoteza. Te pretpostavke mogu se odnositi naparametre raspodele (parametarske hipoteze) ili na same raspodele obeleja(neparametarske hipoteze).
Inae, u statistikoj teoriji se smatra da su uzorci iji obim prelazi 30 jedinicaosnovnog statistikog skupa veliki uzorci i na njih se primenjuje teorijazasnovana na normalnoj raspodeli. Za uzorak do 30 jedinica osnovnogstatistikog skupa kaemo da su mali uzorci i njih razmatramo u okviru teorije
studentove t raspodele.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
43/71
dr Vera Lazarevi, vanr. prof. 43/71
OCENE PARAMETARA RASPODELE
Koriste se dve vrste ocena.
Takasta ocenaje ocena nekog parametra realnim brojem koji se izraunavana osnovu uzorka i predstavlja realizovanu vrednost odabrane statistike. Tajbroj je taka na realnoj osi (otuda i naziv) i on slui kao aproksimacijanepoznate vrednosti parametra raspodele.
Intervalne ocenese daju preko intervala, koji se nazivaju intervalimapoverenja, jer sa unapred zadatom pouzdanou prekrivaju nepoznatiparametar. Ta pouzdanost se zove nivo poverenjai obeleava sa .
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
44/71
dr Vera Lazarevi, vanr. prof. 44/71
TAKASTE OCENE PARAMETARA RASPODELE
Neka je ( )1,..., nX X prost sluajan uzorak i nepoznati parametar obelejaX u populaciji. Za ocenu ovog parametra biramo statistiku:
( ) =
1, ..., .nf X X
Za realizovani uzorak ( )1,..., nx x izraunamo broj
( )=
1,..., nv f x x
koji predstavlja jednu ocenu parametra . Obino se zahteva da ta ocenabude nepristrasna, tj.
( ) ( )( ) = =
1, ..., .nE E f X X
U sluaju pristrasnosti, mera pristrasnosti je razlika ( )
.E
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
45/71
dr Vera Lazarevi, vanr. prof. 45/71
TAKASTA OCENA SREDNJE VREDNOSTI I DISPERZIJE IZ UZORKA
Neka obeleje X u osnovnom skupu ima srednju vrednost m i disperziju2 . Elementi uzorka ( )1,..., nX X u sluaju izbora elemenata sa vraanjem izkonanog osnovnog skupa (ili bez vraanja iz beskonanog skupa) imaju ista
oekivanja =( )iE X m i disperzije = 2( )iD X , ( )=1,..., .i n
Statistika
=
= 1
1 nn i
i
X X
n
je nepristrasna ocena za m , bez obzira na raspodelu obeleja X.
Standardna greka pri oceni sredine populacije je
= .x n
Life Long Learning programs in applied statistics (LLL-seminari)
U sluaju da uzorak formiramo iz konane populacije ali bez vraanja
-
7/22/2019 Seminar 2 - Prezentacija
46/71
dr Vera Lazarevi, vanr. prof. 46/71
U sluaju da uzorak formiramo iz konane populacije ali bez vraanja,standardna greka je
=
1xN nNn
,
gde je N broj elemenata osnovnog statistikog skupa.Zakljuujemo, da se srednja vrednost m populacije aproksimira
aritmetikom sredinom uzorka=
= 11
,n
n ini
x x tj.
= ,nm x a to je obian momenat prvog reda.
Slino, disperzija 2 osnovnog skupa aproksimira se centralnim uzorakim
momentom drugog reda ( )=
= 22
1
1,
n
nn ini
s x x tj.
=
2 2
.ns Ova metoda za odreivanje takastih ocena parametara statistikog skupa,naziva se metoda momenata.
Pored ove, za odreivanje takastih ocena, esto se koristi
metod najmanjih kvadratai metod maksimalne verodostojnosti.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
47/71
dr Vera Lazarevi, vanr. prof. 47/71
INTERVALNE OCENE PARAMETARA RASPODELE
Pored takastih, u praksi moda i ee, koriste se tzv. intervalne oceneparametra . Sutina ovih ocena svodi se na odreivanje intervala 1 2 [ , ]
koji sadri nepoznati parametar sa verovatnoom 100 %.
Dakle, problem se svodi na to da se odrede dve statistike = 1 1 1 ( , , )nf X X i
= 2 2 1
( , , )n
f X X takve da je
= = 1 2 1 2 { } 1 i { } ,P P
gde je zadata verovatnoa koja se zove nivo poverenjaza .
Interval 1 2 [ , ] je sluajan interval interval poverenjaza .
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
48/71
dr Vera Lazarevi, vanr. prof. 48/71
PRIMER 20.Odrediti takastu ocenu prosene ocene m prvog i drugog
studenta, kao i intervalnu ocenu za parametar m kod oba studenta sanivoom poverenja = 0.90 i = 0.95 (Primer 17).
Reenje.Za takastu ocenu prosene ocene prvog i drugog studenta
koristimo aritmetiku sredinu uzorka i ona je u oba sluaja ista: = = =10 10 10 8.1m x y
Prvi student: 90% interval poverenja za prosenu ocenu je: [ ]7.67,8.53 ;
95% interval poverenja za prosenu ocenu je: [ ]7.57,8.63 .Drugi student:
90% interval poverenja za prosenu ocenu je: [ ]7.06,9.14 ; 95% interval poverenja za prosenu ocenu je:
[ ]6.82,9.38 .
Oigledno je da poveanje nivoa poverenja poveava irinu intervala ,mI tj. poveanje garancija za ocenjeni parametar smanjuje preciznost ocene.Dalje, duina intervala poverenja za prvog studenta je manja za bilo koji
nivoa poverenja .
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
49/71
dr Vera Lazarevi, vanr. prof. 49/71
PRIMER 21.Nai intervalnu ocenu standardne devijacije prosene ocene
studenata iz Primera 17, za = 0.90 i = 0.950 , kao i takastu ocenu togaparametra.
Reenje. Takasta ocena,90% i 95% intervalna ocena, redom, standardne
devijacije prosene ocene je : za prvog studenta:
= = 0.7ns , [ ]= 0,0.57I i [ ]= 0,0.54 ;I
za drugog studenta:
= =1.7ns , [ ]= 0,1.40I i [ ]= 0,1.37 .I
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
50/71
dr Vera Lazarevi, vanr. prof. 50/71
Interval poverenja za oekivanu vrednost primenom paketa Statistica
Postupak dobijanja intervala poverenja za neku oekivanu vrednost je istikao i prilikom dobijanja raunskih i pozicionih vrednosti u paketu Statistica,samo to umesto tada selektovanih vrednosti u ovom sluaju aktiviramo
Confirm limits for means. Idemo na padajui meni Statistics izabiramoBasic Statistics/Tabeles.
Zatim odabiramo Descriptive Statistics i potvrdimo na Ok. Nadobijenom prozoru odaberemo karticu Advaced i aktivnost Confirm limitsfor means. Na kraju se odabere koeficijent pouzdanosti (najee 95%) idobija se sledea tabela potvrdom na Summary: Descriptive statistics.
Slika 65.Intervali poverenja nekih obeleja za sluajni uzorak iz populacije
1995-1999 pri koeficijentu pouzdanosti od 95% (1995-1999).
-
7/22/2019 Seminar 2 - Prezentacija
51/71
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
52/71
dr Vera Lazarevi, vanr. prof. 52/71
Slika 68.Interval poverenja za prosenu ocenu studenatadiplomiranih 2001. pri koef. pouzdanosti 95%.
Slika 69.Interval poverenja za prosenu ocenu studenata na osnovusluajnog uzoraka iz populacije 2000-2004 pri koef. pouzdanosti 95%.
Slika 70.Interval poverenja dobijen iz celepopulacije pri koef. pouzdanosti 95%.
Life Long Learning programs in applied statistics (LLL-seminari)
Slede rezultati vezani za populaciju 2008-2011.
-
7/22/2019 Seminar 2 - Prezentacija
53/71
dr Vera Lazarevi, vanr. prof. 53/71
p p j
Slika 71.Intervali poverenja za obelejapopulacije2008.-2011. sa nivoom poverenja 95%.
Slika 72.Intervali poverenja za obeleja sluajno odabranoguzorka iz populacije20082011. sa nivoom poverenja 95%.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
54/71
dr Vera Lazarevi, vanr. prof. 54/71
TESTIRANJE STATISTIKIH HIPOTEZA
Postupak testiranja hipoteze se izvodi se kroz nekoliko koraka:
1)Definiu se nulta i alternativna hipoteza;2)Izbor modela teorijske raspodele;3)Odreuje se nivo znaajnosti testa , odnosno verovatnoa (1);4)Definisanje uzorka;5)Izraunavanje statistike testa na osnovu uzorka;6)Iz tablice teorijske raspodele oitava se tablina vrednost (kriterijum);7)Uporeivanje statistike testa sa tablinom vrednou;8)Odluka o prihvatanju ili odbacivanju formulisane hipoteze.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
55/71
dr Vera Lazarevi, vanr. prof. 55/71
Definisanje hipoteza
Metode ili testovi provere hipoteze omoguavaju da se donese sud otanosti hipoteze sa verovatnoom dovoljno bliskoj jedinici. Provera
statistikih hipoteza naziva se verifikacija statistikih hipoteza. Osnovnizadatak u teoriji provere statistikih hipoteza je odreivanje pravila po komese na osnovu uzoraka moe reiti pitanje da li se postavljena hipotezaprihvata ili odbacuje.
Postupak testiranja hipoteze u paketu Statistica je sledei: Na menijuStatistics izaberemo Basic Statistics/Tables, zatim izaberemo t-test, singlesample. Potvrdom na OKotvara nam se prozor kao na Slici 73.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
56/71
dr Vera Lazarevi, vanr. prof. 56/71
Slika 73.Prozor za unos vrednosti 0m .
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
57/71
dr Vera Lazarevi, vanr. prof. 57/71
Klikom na polje Variblesodabira se obeleje, a zatim na jeziku Optionsu
polje pored teksta Test all means againstunosimo vrednost za m0. Vrednostmo je vrednost koja je priblina aritmetikoj sredini obeleja.
Pri korienju statistikog paketa kao rezultat dobija se izraunatat-vrednost i odgovarajua p vrednost za izraunato t. Na osnovu dobijenep vrednosti zakljuci se donose na sledei nalin.
Ako jep
> 0.05 tada sa pouzdanou 95% prihvatamo hipotezuH
0.
Ako je p 0.05 tada sa pouzdanou od 95% odbacujemo hipotezu H0.
Nivo poverenja se moe menjati u zavisnosti od potrebe.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
58/71
dr Vera Lazarevi, vanr. prof. 58/71
NEJEE TESTIRANE HIPOTEZE
Testiranje hipoteze ( )=0 0H m m protiv ( )1 0 ,H m m kada je 2 poznato
Moemo vriti sledea testiranja:
(1) Uzeti da je =0 nm x , gde je nx prosena ocena diplomiranihstudenata iz uzorka u koji su uzeti studenti upisani na prvu godinu
studija pri upisu Fakulteta, a =22Ns iz populacije iste kategorije
studenata. Za prag znaajnosti uzeti = 0.01, = 0.05 ili = 0.10.
(2) Uzeti da je =0 nm x , gde je nx prosena ocena diplomiranihstudenata iz uzorka u koji su uzeti studenti upisani na 3. godinu pri
upisu na Fakultet, a =22Ns iz populacije toga uzorka. Za prag
znaajnosti uzeti = 0.01, = 0.05 ili = 0.10.
Life Long Learning programs in applied statistics (LLL-seminari)
Testiranje hipoteze ( )=0 0H m m protiv ( )1 0H m m ,
-
7/22/2019 Seminar 2 - Prezentacija
59/71
dr Vera Lazarevi, vanr. prof. 59/71
kada 2 nije poznato
Ovde je =0 nm x , gde je nx prosena ocena svih diplomiranih studenata iz
uzorka, a =22ns iz uzorka.
Testiranje hipoteze o jednakosti dve aritmetike sredine,
tj. ( )=0 M ZH m m protiv ( )1 M ZH m m Uzeemo da je = nMm x , gde je nx prosena ocena studenata iz sluajnog
uzorka, a =Z nm y , gde je ny prosena ocena studentkinja iz tog istoguzorka, za neki prag znaajnosti uzeti .
Testiranje hipoteze o razlici dve populacije,tj. =0 1 2( )H p p protiv 1 1 2( )H p p
Ovde se posmatraju dve populacije studenata: prvu ine studenti upisani naprvu godinu Fakulteta, a drugu populaciju ine studenti upisani na neku
stariju godinu-prelaznici sa visokih kola ili nekih drugih fakulteta. Parametar1p odnosi se na procenat studenata koji studiraju 5 i vie godina, a upisani su
u 1. godinu Fakulteta, a parametar 2p odnosi se na procenat studenata kojistudiraju 3 i vie godina, a upisani su u 3. godinu Fakulteta. Za pragznaajnosti uzeti = 0.01, = 0.05 ili = 0.10.
Life Long Learning programs in applied statistics (LLL-seminari)
N l d i lik id l i j hi i
-
7/22/2019 Seminar 2 - Prezentacija
60/71
dr Vera Lazarevi, vanr. prof. 60/71
Na sledeim slikama videemo rezultate testiranja hipoteze u vezi sa
obelejem Srednja ocena za razliite uzorke. Nulta hipoteza tvrdi da jevrednost srednje ocene cele populacije studenata diplomiranih od 1995. do1999. god., m0= 7.17746 sa pragom znaajnosti = 0.05. Alternativnahipoteza je 1 0( ).H m m
Pri korienju statistikog paketa kao rezultat dobija se izraunatat-vrednost i odgovarajua p vrednost za izraunato t. Na osnovu dobijenep vrednosti zakljuci se donose na sledei nain:
- Ako jep> 0.05 tada sa pouzdanou 95% prihvatamo hipotezu H0.- Ako jep 0.05 tada sa pouzdanou od 95% odbacujemo hipotezu H0.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
61/71
dr Vera Lazarevi, vanr. prof. 61/71
Slika 74.Rezultati testiranja hipoteze o srednjoj oceni cele populacije
Na osnovu dobijene vrednostipkoja je manja od 0,05 zakljuujemo da senultna hipoteza odbacuje za prag znaajnosti = 0,05.
Slika 75.Rezultati testiranja hipotezeo srednjoj oceni studenata diplomiranih 1995. god.
Vrednost p = 0,200934 > 0,05 pa nemamo razloga da odbacimo nultuhipotezu, odnosno prihvatamo nultu hipotezu da je prosena ocenadiplomiranih studenata 1995. godine upravo 7,195893 sa pragom
znaajnosti = 0,05.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
62/71
dr Vera Lazarevi, vanr. prof. 62/71
Slika 76.Dobijeni rezultati prilikom testiranja hipotezeo srednjoj oceni studenata na osnovu sluajnog uzorka.
Kao to vidimo iz tabele dobijena vrednost p = 0,198678 > 0,05 i prihvatamonultu hipotezu, to znai da je prosena ocena studenata diplomiranih u
periodu od 19951999., priblino 7.277273 sa nivoom poverenja 95%.
Primetimo da program Statisticau sluaju odbacivanja nulte hipoteze u
prozoru sa rezultatima koristi crvenu boju za izraunate vrednosti, to jesluaj i na prethodnim slikama. Na taj nain smo i vizuelno opomenuti danultu hipotezu treba odbaciti.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
63/71
dr Vera Lazarevi, vanr. prof. 63/71
2TEST NEZAVISNOSTI
Koristei 2-test mogu se odrediti verovatnoe povezanosti izmeu dva
obeleja ali ne i jaina te povezanosti. Jaina povezanosti moe se odreditiprimenom koeficijenata kontigencije. 2 se primenjuje kada je potrebnoutvrditi da li se neke realizovane frekvencije razlikuju od frekvencije kojebismo oekivali pod odreenom hipotezom.
U paketu Statistica, 2-test se moe realizovati tako to iz menijaStatistics, izaberemo Basic Statistics/Tables, a zatim Tables and Banners.
Dobijamo prozor kao na Slici 77.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
64/71
dr Vera Lazarevi, vanr. prof. 64/71
Slika 77.Izgled prozora Crosstabulation Tables.
Izbor obeleja vrimo preko dugmeta Specify tables i nakon toga potvrdimodvaput OK. Sada dobijamo novi prozor prikazan na Slici 78.
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
65/71
dr Vera Lazarevi, vanr. prof. 65/71
Slika 78.Prozor za izbor vrste analize.
Po izboru analize koju elimo da vrimo, vraamo se na karticu Advanced ikliknemo na opciju Detailed two-way tables.
Life Long Learning programs in applied statistics (LLL-seminari)
Neke mogua testiranja:
-
7/22/2019 Seminar 2 - Prezentacija
66/71
dr Vera Lazarevi, vanr. prof. 66/71
Neke mogua testiranja:
Ispitati preko uzorka da li su POL i DUINA STUDIRANJA zavisnaobeleja.
Ispitati preko uzorka da li su PROSENA OCENA i DUINA STUDIRANJA
zavisna obeleja.
U sledeem primeru ispitivali smo zavisnost izmeu dva obeleja iz
populacije studenata diplomiranih u periodu 1995-1999. godine naTehnikom fakultetu u aku.
Ispituje se da li postoji zavisnost izmeu pola studenata i ocene dobijene
na diplomskom radu (Tabele 79 i 80).
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
67/71
dr Vera Lazarevi, vanr. prof. 67/71
Slika 79.Tabela kontigencije cele populacije 19951999. god.
Slika 80.Rezultat 2-testa cele populacije
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
68/71
dr Vera Lazarevi, vanr. prof. 68/71
Na osnovu dobijenih rezultata u programu Statistica prikazanih naSlikama 79 i 80 moemo zakljuiti sledee:
H0 hipoteza koja tvrdi da su pol i ocena studenata na diplomskom ispitu
nezavisna obeleja na celoj populaciji diplomjranih studenata u periodu19951999.
Kako je p = 0,00306 < 0,05 to znai da sa pouzadnou od 95%odbacujemo nultu hipotezu i zakljuujemo da postoji zavisnost izmeu polastudenata i ocena na diplomskom za posmatranu populaciju.
Meutim prema odraenom sluajnom uzorku te populacije dobijamosledee rezultate (Slika 81).
Life Long Learning programs in applied statistics (LLL-seminari)
-
7/22/2019 Seminar 2 - Prezentacija
69/71
dr Vera Lazarevi, vanr. prof. 69/71
Slika 81.Tabela 2-testa za sluajni uzorak.
Kako je p = 0,06265 > 0,05 to znai da na osnovu uzorka, sa pouzdanou od95%, prihvatamo nultu hipotezu i zakljuujemo da su pol i ocena nadiplomskom ispitu nezavisna obeleja.
Life Long Learning programs in applied statistics (LLL-seminari)
Za subjektivno odabrani uzorak iz populacije 19951999., tj. za studente
-
7/22/2019 Seminar 2 - Prezentacija
70/71
dr Vera Lazarevi, vanr. prof. 70/71
diplomirane 1995. dobijamo sledee rezultate (Slika 82).
Slika 82. Tabela 2-testa za studente koji su diplomirali 1995. god.
Sada je p = 0,03671 < 0,05 to znai da sa pouzadnou od 95%odbacujemo nultu hipotezu i zakljucujemo da postoji zavisnost izmeu polastudenata i ocene na diplomskom ispitu.
Life Long Learning programs in applied statistics (LLL-seminari)
Za generaciju studenata diplomiranih 2001. godine ispitaemo zavisnost
izmeu pola studenta i smera koji je student upisao, za = 0,05.
-
7/22/2019 Seminar 2 - Prezentacija
71/71
dr Vera Lazarevi, vanr. prof. 71/71
izmeu pola studenta i smera koji je student upisao, za 0,05.
Slika 83.Tabela kontigencije za uzorak studenata diplomiralih 2001.
Slika 84.Tabela 2-testa za uzorak studenata diplomiralih 2001.
Kako jep= 0,00481 < 0,05 to znai da odbacujemo nultu hipotezu,pa sa pouzdanou od 95% moemo rei da smerna koji se student upisaozavisi od polaza generaciju studenata Tehnikog fakulteta u aku
koji su diplomirali 2001. godine.