ANALISIS DATA KUALITATIF(INTRODUCTION TO CATEGORICAL DATA
ANALYSIS)
GANGGA ANURAGA S.Si, M.Si
STATISTIKA UNIPA SURABAYA
Materi :
Pendahuluan : Distribusi dalam dalam data diskret Tabel Kontingensi
Tabel dua dimensi Tabel dimensi > 2 Pratikum
Model log linier (Model dan Interpretasi) Pratikum
Model logistik Biner (Estimasi Parameter, pengujian parameter, interpretasi, kesesuaian model)
Pratikum Multinomial (Estimasi Parameter, pengujian parameter, interpretasi, kesesuaian model)
Pratikum Ordinal (Estimasi Parameter, pengujian parameter, interpretasi, kesesuaian model)
Pratikum
Model poisson (Estimasi Parameter, pengujian parameter, interpretasi, kesesuaianmodel) Pratikum
STATISTIKA UNIPA SURABAYA
Kontrak kuliah
No Komponen Bobot Nilai (10%)
1 Partisipasi kuliah 10
2 Tugas-tugas 20
3 Kuis 15
4 Ujian Tengah Semester 25
5 Ujian Akhir Semester 30
Jumlah 100
STATISTIKA UNIPA SURABAYA
referensi
Agresti, Alan. 1996. An Introduction to CategoricalData Analysis. Wiley Series : New York
STATISTIKA UNIPA SURABAYA
Pendahuluan
Hubungan antara variabel X dan Y, dimana Y adalahvariabel diskret (Nominal, Ordinal) dan X merupakanvariabel kontinyu atau diskret (Nominal, Ordinal,Interval dan rasio)
Tujuan ADK : Digunakan pada data berbentuk kategori, terutama pada
variabel respon yang berbentuk diskret/kategori.Contoh :Y : partai politik (Demokrat, Gerindra, Golkar)X : pendidikan, pendapatan, dan jenis kelamin
STATISTIKA UNIPA SURABAYA
Terdapat 2 jenis variabel kategori
Nominal Contoh : jenis kelamin, jenis musik (rock, pop, jazz) dll
Ordinal Contoh : tingkat pendidikan (SD, SMP, SMU, PT)
Selanjutnya yang akan menjadi perhatian penting adalahvariabel biner (sukses – gagal). Dan perbedaan pentingnominal-ordinal.
STATISTIKA UNIPA SURABAYA
Distribusi Probabilitas dalam AnalisisData Kualitatif (CDA) Distribusi Binomial distribusi untuk proses bernoulli Karakteristik proses bernoulli Percobaan berlangsung n kali, dalam cara dan kondisi
sama Setiap percobaan hanya ada 2 kejadian yang mungkin
terjadi, yang mana saling asing dan independen. Peluang / probabilitas dari satu percobaan ke percobaan
yang lain adalah konstan. 2 kejiadian tersebut umumnya dinotasikan sebagai kejadian
sukses dan kejadian gagalSTATISTIKA UNIPA SURABAYA
Lanjutan distribusi binomial( ),1 ( ) untuk setiap percobaan
munculnya atau jumlah sukses yang akan dihitung
Setiap percobaan saling asing dan independen
n = jumlah percobaan
berdistribusi binomial
P Sukses P gagal
Y
Y
STATISTIKA UNIPA SURABAYA
Contoh :
Suatu pemilihan umum / pemilu yang diikuti olehpartai demokrat dan golkar, yang manadilaksanakan dalam 3 putaran. Misalkan peluangpartai demokrat memenangkan pemilu adalah 0,5
.Berapa probabilitas partaidemokrat memenangkan pemilu sebanyak 3 kali.
Jawab : n = 3, Y = munculnya atau jumlah suksesyang memilih partai demokrat.
( ( ) = 0,5)P Demokrat
STATISTIKA UNIPA SURABAYA
Lanjutan Contoh :
STATISTIKA UNIPA SURABAYA
Catatan :
^
( )
(menunjukkan rata-rata kesuksesan dari sebuah percobaan)
( ) (1 ), (1
(menunjukkan variansi/standar deviasi dari sebuah percobaan)
juga dilambangkan ,
(menunjukkan persentas
E Y n
Var Y n n
Yp
n
e kesuksesan dari sebuah percobaan)
( )
(1 )
YE p E
n
Y
n n
STATISTIKA UNIPA SURABAYA
Soal : Probabilitas kiriman paket dari suatu biro perjalanan
akan sampai tepat waktu adalah 0,8. jika kitamengirim lewat biro tersebut 10 kali, Berapa probabilitas bahwa 6 diantaranya akan sampai
tepat waktu ? 0,0881 Berapa rata-rata dan varians bahwa 6 diantaranya akan
sampai tepat waktu ? 8 dan 1,6
STATISTIKA UNIPA SURABAYA
Pengujian Proporsi untuk Distr. Binomial
Untuk distribusi binomial, menggunakan estimator ML dalam inferensi statistik
untuk parameter
Estimator ML adalah proporsi sampel ( )
Sampling distribusi dari proporsi sampel ( ),memiliki
p
p mea
0
0 0
0 0 1 0
0,025
dan tan sbb :
(1 )( ) , ( )
statistik uji yang digunakan :(1 )
Hipotesis yang digunakan, : : (satu arah)
Daerah kritis : dengan =0,05 ( =1.96)
Dan CI 95% ada
n s dar error
E p pn
pz
nH vs H
Z
(1 )lah 1,96
p pp
n
STATISTIKA UNIPA SURABAYA
Distribusi Multinomial
Jika dalam setiap percobaan / eksperimen didapatkanpeluang munculnya kesuksesan (possible outcomes) > 2,dengan beberapa kategori. Maka dinamakan sebagaidistribusi multinomial (multinomial distribution).
Contoh : Beberapa percobaan yang memiliki lebih daridua hasil yang mungkin.Misalnya, hasil untuk driver dalam kecelakaan mobildapat terekam menggunakan kategori "tidak terluka,""cedera yang tidak memerlukan rawat inap," "cederayang memerlukan rawat inap," "kematian."
STATISTIKA UNIPA SURABAYA
Lanjutan Distribusi Multinomial
1 2 c
jj
jj
menunjukkan jumlah kategori hasil
, ,..., peluang sukses (probability)
1
c
n n
STATISTIKA UNIPA SURABAYA
Contoh : Distribusi Multinomial
Dalam pemilihan umum sebuah negara besar,kandidat A mendapat 20% suara, calon Bmenerima 30% suara, dan kandidat C menerima50% suara. Jika enam pemilih yang dipilih secaraacak, berapakah probabilitas bahwa akan adatepat satu pendukung calon A, dua pendukungcalon B dan tiga pendukung kandidat C dalamsampel?STATISTIKA UNIPA SURABAYA
STATISTIKA UNIPA SURABAYA
CONTINGENCY TABLES(TABEL KONTINGENSI)
GANGGA ANURAGA S.Si, M.Si
STATISTIKA UNIPA SURABAYA
Tabel Kontingensi
Berkaitan dengan hubungan antar variabelkategori / diskret.
Menguji apakah kedua variabel tersebut (diskret)independent.
STATISTIKA UNIPA SURABAYA
Syarat pada Tabel Kontingensi
Homogen : setiap level atau kategori dalam suatuvariabel merupakan objek yang sama.
Independent (saling bebas)
Skala nominal : skala yang digunakan untukmembedakan benda atau peristiwa yang satu denganlainnya, misal : jenis kelamin (laki-laki, perempuan
Skala ordinal : skala yang digunakan untukmembedakan dan mengurutkan data, misal tingkatpendidikan (SD, SMP, SMA, PT)
( ) ( ) ( )P A B P A P B
STATISTIKA UNIPA SURABAYA
Tabel Kontingensi r x c
BarisLajur / Kolom
1 2 . . . c1 n11 n12 . . . n1c
2 n21 n22 . . . n2c
. . . . . . .
. . . . . . .
. . . . . . .r nr1 nr2 . . . nrc
ijTabel kontingensi berisi hitungan hasil n ,
yang mana banyaknya individu yang termasuk
dalam sel ke ij, i = 1,2...r dan j = 1,2...c
STATISTIKA UNIPA SURABAYA
Tabel Kontingensi 2 x 2
Misal hubungan antar jenis kelamin dengankepercayaan bahwa ada kehidupan setelam mati. Tabel 1 :
STATISTIKA UNIPA SURABAYA
Probabilitas Joint dan Marginal
Probabilitas join (Joint Probability)
,
,
menyatakan peluang ( , ) pada baris ke-i dan kolom ke-j
dinyatakan sebagai nt dari
1
ijij ij
ij
iji j
np P X i Y j
nX Y
joi distribution X dan Y
STATISTIKA UNIPA SURABAYA
Tabel probabilitas untuk kontingensi 2 x 2
GenderBelief in Afterlife
TotalYes No or Undecided
females π11 π12 π1+
Males π21 π22 π2+
Total π+1 π+2 π++
STATISTIKA UNIPA SURABAYA
Tabel Probabilitas
Tabel 2 :
GenderBelief in Afterlife
TotalYes No or Undecided
females π11= 509/1127 = 0,452 π12 = 116/1127 = 0,103 π1+ = 0,555
Males π21= 398/1127 = 0,353 π22 = 104/1127 = 0,092 π2+ = 0,445
Total π+1 = 0,805 π+2 = 0,195 π++ = 1
1111 11misal : 0, 452,
menyatakan peluang (joint probability) dari jenis kelamin perempuan
yang mengatakan ya/percaya ada kehidupan setelah mati
np
n STATISTIKA UNIPA SURABAYA
Probabilitas Marjinal (Marginal Probability)Merupakan total dari baris dan atau total kolom dari
probabilitas join (joint probabiliy).
merupakan total dari probabilitas join (joint probability) dari baris ke-i
merupakan total dari probabilitas join (joint probability) dari kolom ke-j
= 1, merupakan total dari probabilitas m
i
j
ij
arginal
STATISTIKA UNIPA SURABAYA
GenderBelief in Afterlife
TotalYes No or Undecided
females π11= 509/1127 = 0,452 π12 = 116/1127 = 0,103 π1+ = 0,555
Males π21= 398/1127 = 0,353 π22 = 104/1127 = 0,092 π2+ = 0,445
Total π+1 = 0,805 π+2 = 0,195 π++ = 1
JointProbability
MarginalProbability
STATISTIKA UNIPA SURABAYA
Independensi
Untuk selanjutnya pandang Y sebagai variabelrespon (belief in afterlife) dan X (Gender) sebagaivariabel penjelas (explanatory variable). Dan, jika X dan Y bebas (independen) maka :
ij ijp
1 1 1 . .1
1 2 1 . .2
2 1 2 . .1
2 2 2 . .2
( b a c a h a m p ir s a m a )
p p x p
p p x p
p p x p
p p x p
STATISTIKA UNIPA SURABAYA
Uji Independensi (Chi-Squared danLikelihood Ratio Test)
0
1
H ip o te s is y a n g d ig u n a k a n a d a la h s e b a g a i b e r ik u t :
: t id a k a d a h u b u n g a n a n ta ra d a n ( b e b a s ) a ta u ( )
: a d a h u b u n g a n a n ta ra d a n ( t id a k b e b a s ) a ta u ( )
id e n t i f ik a s i :
i j i j
i j i j
i j i j i
H X Y
H X Y
n n
2
m e ru p a k a n n i la i h a ra p a n d a r i d e n g a n a s u m s i in d e p e n d e n
ˆ
ˆ e s t im a s i n i la i h a ra p a n
S ta t is t ik U ji :
u n tu k ta b e l k o n t in g e n s i , d e n g a n p e a rs o n
j
i j i j
j i jii j i j
i j
n
n n nnn p p n
n n n
I x J
2
2
2 2
d a n L ik e lih o o d ra t io te s t s e b a g a i b e r ik u t :
ˆ, 2 lo g
ˆ ˆ
1 1
i j i j i jh i tu n g i j
i j i j
G
n nG n
d f I J
STATISTIKA UNIPA SURABAYA
Uji Chi-Squared
Uji Chi-Sqaured menuntut frekuensi-frekuensi yangdiharapkan tidak boleh terlalu kecil.
Untuk uji Chi-Squared dengan derajat bebas (db)yang lebih besar 1, lebih dari 20% selnya harusmempunyai frekuensi yang diharapkan lebih dari5 dan tidak satu sel pun boleh memilikifrekuensi yang diharapkan kurang dari satu.
STATISTIKA UNIPA SURABAYA
Contoh uji independensi
2 2Gunakan pearson dan Likelihood ratio
sebagai statistik uji
G
STATISTIKA UNIPA SURABAYA
Yates (1934)
Melakukan koreksi terhadap pearson Chi-Squared. Frank Yates, ahli statistik Inggris, menyarankan
koreksi untuk kontinuitas yang menyesuaikan rumusuntuk uji chi-squared Pearson dengan mengurangi0,5 dari perbedaan antara masing-masing nilaiyang diamati dan nilai yang diharapkan dari tabel2 × 2 kontingensi.
22ˆ 0,5
ˆij ij
Yatesij
n
STATISTIKA UNIPA SURABAYA
Fisher
Digunakan pada sampel kecil, untuk nilai harapan< 5.
Nilai p_value langsung dapat dihitung,dibandingkan dengan signifikansi alpha (0,05).
Langkah-langkah dalam uji fisher :Mencari konfigurasi-konfigurasi tabel yang lebih
ekstrim dari tabel yang diamatiMenghitung nilai p, katakanlah Nilai p dari tabel yang diamati adalah penjumlahan
1 2, ,..., kp p p
1 2 ... kp p p
STATISTIKA UNIPA SURABAYA
Fisher (Lanjutan 1)
STATISTIKA UNIPA SURABAYA
Fisher (Lanjutan 2)
STATISTIKA UNIPA SURABAYA
Fisher (Lanjutan 3)
STATISTIKA UNIPA SURABAYA
Fisher (Lanjutan 4)
Dengan alpha = 0,05, maka dapat disimpulkanbahwa tidak ada hubungan (independen) antaragejala psychotics dan neurotics dengan gejalaperasaan bunuh diri.STATISTIKA UNIPA SURABAYA
Risiko Nisbi (Relative Risk)
Merupakan perbandingan antara dua peluang yang sukses Menyatakan peluang terjadinya suatu kejadian (resiko) Nilai relative risk akan berkisar dari nol sampa tidak hingga
Nilai relative risk yang sama dengan 1 atau mendekati 1mengindikasikan tidak ada hubungan antara kedua variabeltersebut
11
1 1
212
2
nn
RRn
n
STATISTIKA UNIPA SURABAYA
Risiko Nisbi (Relative Risk)
P(perempuan percaya ada kehidupan setelah mati)=509/625 =0,81
P(laki-laki percaya ada kehidupan setelah mati) =398/502=0,79
Didapatkan relative risk yang mendekati 1 mengindikasikantidak ada hubungan antara kedua variabel tersebut
0,811,02
0,79RR
STATISTIKA UNIPA SURABAYA
Odds Ratio
Odds adalah peluang terjadinya suatu kejadiandibandingkan peluang tidak terjadinya kejadiantersebut.
Odds ratio adalah adalah perbandingan dari duaodds.
STATISTIKA UNIPA SURABAYA
TABEL DIMENSI GANDA
Gangga AnuragaSTATISTIKA UNIPA SURABAYA
Uji kebebasan bersama-sama / mutualindependence dalam tabel kontingensi 3 x 3 Hipotesis :
0 .. . . ..
0 .. . . ..
2
2
1 1 1
.. . . ..
2
:
:
( )Statistik Uji :
dengan :
ˆ
2
1, 2,...,
1, 2,...,
1, 2,...,
ijk i j k
ijk i j k
r c lijk ijk
i j k
ijk
i j k
ijk ijk
H p p p p
H p p p p
n E
E
n n nE
Ndf rcl r c l
i r
j c
k l
STATISTIKA UNIPA SURABAYA
Contoh : Data perilaku kelas pada pada sekolah anak-anak Uji apakah terdapat hubungan antara perilaku kelas anak-anak
(deviant, non deviant), kondisi sekolah (low, medium, high) danindeks resiko yang terkait dengan kondisi tempat tinggal (not atrisk, at risk)
STATISTIKA UNIPA SURABAYA
.. . . ..
1..
2..
.1.
.2.
1.Tentukan terlebih dahulu , , dan
non deviant dan deviant
(16 7) (15 34) (5 3) 80
(1 1) (3 8) (1 3) 17
not at risk dan risk
(16 1) (15 3) (5 1) 41
(7 1) (34 8) (3 3) 56
i j kn n n
n
n
n
n
..1
..2
..3
condition school
(16 7) (1 1) 25
(15 34) (3 8) 60
(5 3) (1 3) 12
n
n
n
STATISTIKA UNIPA SURABAYA
.. . . ..
2
111
121
2. Tentukan nilai harapan masing-masing sel
80 x 41 x258,72
97 x 9780 x 56 x25
11,9097 x 97
lanjutkan...
i j k
ijk
n n nE
N
E
E
STATISTIKA UNIPA SURABAYA
STATISTIKA UNIPA SURABAYA
2
2
1 1 1
2
7 ,0.05
0
Statistik Uji :
( )17,30
2
7
14,07
Kesimpulan : Karena tolak H maka
perilaku kelas anak-anak (deviant, non deviant),
kondisi sekolah (low, medium,
r c lijk ijk
i j k
ijk
n E
E
df rcl r c l
df
high) dan
indeks resiko (not at risk, at risk) tidak bebas bersama-sama
STATISTIKA UNIPA SURABAYA
Jika ditanyakan apakah kondisi sekolah dan indeks resikoindependet berdasarkan perilaku kelas, maka :
2 10,78 dengan df = 2 STATISTIKA UNIPA SURABAYA
TUGAS
Kombinasikan data untuk jenis kelamin sehingga menjadi 4 x 4 kemudian ujiindependensi dengan menggunakan pearson dan likelihood ratio test,interpretaasikan.
Bandingkan 2 level pendapatan pertama terhadap kepuasan kerja denganmenggunakan likelihood ratio test, interpretaasikan.
Bandingkan 2 level pendapatan terakhir terhadap kepuasan kerja denganmenggunakan likelihood ratio test, interpretaasikan.
STATISTIKA UNIPA SURABAYA
TERIMA KASIH
STATISTIKA UNIPA SURABAYA
MODEL LOG LINIER
Gangga AnuragaSTATISTIKA UNIPA SURABAYA
MODEL LOG LINIER Menyatakan hubungan antar variabel, dengan data yang
bersifat kualitatif (skala nominal atau ordinal). Dengan menggunakan pendekatan log linier bisa
diketahui model matematikanya secara pasti serta levelatau kelas mana yang cenderung menimbulkan adanyahubungan atau dependensi.
Dalam tabel kontingensi I x J, dikatakan independenapabila
Formula dalam model log linier menggunakan nilaiharapandan independen jika
ij i j
ij ijn
ij i jn
STATISTIKA UNIPA SURABAYA
MODEL LOG LINIER UNTUK TABEL 2 X 2M isalkan X sebagai variabel baris dan
Y sebagai variabel kolom , m aka m odel log linier
dapat dituliskan sebagai berikut :
log ...(1)
dim ana :
m enunjukkan efek utam a kategori
X Y
ij i j
X
i
ke-i variabel X .
m enunjukkan efek utam a kategori ke-j
variabel Y .
dan m odel jenuh dapat dituliskan sebagai berikut :
log ... (2)
= efek interaksi antara kategori
Y
j
X Y XY
ij i j ij
XY
ij
ke-i peubah X
dan kategori ke-j peubah Y
untuk i=1,2,3,...,I dan j=1,2,3,...,J
STATISTIKA UNIPA SURABAYA
1
1
1 1
log (terdapat hubungan antara log
dengan , sehingga dapat digunakan
untuk menduga log )
ij ij ij
ij ij
ij
ijJ
ji
ijI
ij
I J ij
i j
n n
J
I
IJ
STATISTIKA UNIPA SURABAYA
X
i i
Y
j j
XY
ij ij i j
STATISTIKA UNIPA SURABAYA
CONTOH KASUS Hubungan partai dengan jenis kelamin
Ln nij hubungan partai dengan jenis kelamineta(ij)
jenis kelamin Partai eta(i+)buruh konservatifLaki-laki 5.40 4.74 5.07
Perempuan 5.48 5.22 5.35eta(+j) 5.44 4.98 5.21
jenis kelaminPartai
Totalburuh konservatif
Laki-laki 222 115 337Perempuan 240 185 425
Total 462 300 762
STATISTIKA UNIPA SURABAYA
1
2
1
2
11 12
21 22
Sehingga :
5, 21
0,14
0,14
0, 23
0, 23
0,10 0,10
0,10 0,10
X
X
Y
Y
XY XY
XY XY
STATISTIKA UNIPA SURABAYA
MODEL JENUH / SATURATED MODEL(MODEL 0)
11 1 1 11
21 2 1 21
2
Didapat model penuh (saturated model)
log
5,4 5,21 0,14 0,23 0,10 (mod )
5,21 0,14 0,23 0,10 (mod )
0 G 0,000
ij ij
X Y XY
ij i j ij
X Y XY
X Y XY
misal v
v
v
el jenuh
v
el jenuh
df
STATISTIKA UNIPA SURABAYA
MODEL TANPA INTERAKSI (MODEL 1)XY
ij
0
Model 1 adalah interaksi antar 2 variabel dihilangkan
log
Untuk mengevaluasi interaksi
dapat dilakukan dengan membandingkan model
Berikut hipotesis yang dibangun :
m
ij ij
X Y
ij i j
XY
ij
misal v
v
H
1
odel 1 adalah model terbaik
model 0 (saturated model) adalah model terbaikH STATISTIKA UNIPA SURABAYA
2 2
2
2 2
21:0,05
Statistik Uji :
Dengan pearson dan Likelihood ratio test sebagai berikut :
ˆ, 2 log
ˆ ˆ
1 1
0,05
3,841
ij ij ijhitung ij
ij ij
G
n nG n
df I J
STATISTIKA UNIPA SURABAYA
Tabel Frekuensi Harapan dan ln darifrekuensi harapan
jenis kelaminPartai
buruh konservatif Total
Laki-laki 204.32 132.68 337.00
Perempuan 257.68 167.32 425.00
Total 462.00 300.00 762.00
jenis kelaminPartai
Totalburuh konservatif
Laki-laki 5.32 4.89 10.21Perempuan 5.55 5.12 10.67
Total 10.87 10.01 20.88STATISTIKA UNIPA SURABAYA
ANALISIS DAN PEMBAHASAN
2
2
0
:
2 logˆ
7,003138
Keputusan : Tolak H
Sehingga dapat ditarik kesimpulan bahwa Model 0 (model
lengkap) sebagai model terbaik. Jadi model log linier
untuk hubungan
ijij
ij
Perhitungan
nG n
G
antara kedua variabel tersebut adalah :X Y XY
ij i j ijv STATISTIKA UNIPA SURABAYA
INTERPRETASI : Interpretasi dari model adalah adanya hubungan
antara variabel jenis partai dengan variabel Jenis kelamin,dimana pengaruh efek utama variabel jenis partai danvariabel jenis kelamin juga masuk ke dalam model.
Gunakan SPSS
STATISTIKA UNIPA SURABAYA
UJI K-WAYUji K-Way
1. Pengujian interaksi pada derajat K atau lebih tinggi sama
dengan nol ( - )
Uji ini didasarkan pada hipotesis bahwa efek order ke-K
Test that K Way and higher order effect are zero
0
1
0
dan
yang lebih tinggi sama dengan nol.
Pada model log linear hipotesisnya sebagai berikut.
- Untuk K = 2
H : Efek order ke-2 = 0
H : Efek order ke-2 0
- Untuk K = 1
H : Efek or
1
der ke-1 dan yang lebih tinggi = 0
H : Efek order ke-1 dan yang lebih tinggi 0
STATISTIKA UNIPA SURABAYA
U ji K -w ay
2. Pengujian interaksi pada derajat K sam a dengan nol
( - )
U ji in i d idasarkan pada hipotesis efek order ke-K
sam a dengan nol. Pada m odel log li
Test that K W ay effect are zero
0
1
0
1
near hipotesisnya
sebagai berikut.
- U ntuk K = 1
H : E fek order ke-1 = 0
H : E fek order ke-1 0
- U ntuk K = 2
H : E fek order ke-2 = 0
H : E fek order ke-2 0
S tatistik uji yang digunak
2 2
0
an adalah Likelihood R atio T est
(G ) K riteria penolakan G 2> (db; ) m aka tolah H
STATISTIKA UNIPA SURABAYA
Output SPSS Uji K-Way
0
1
Pada pengujian efek order ke-K atau lebih sama dengan nol dijabarkan sebagai berikut.
Untuk K = 2
Hipotesis :
H : Efek order ke-2 = 0
H : Efek order ke-2 0
P_value yang kurang dari nilai
1
= 5% yaitu 0,008.
Sehingga Hdidukung oleh data, artinya efek interaksi order kedua terdapat dalammodel.
STATISTIKA UNIPA SURABAYA
0
1
1
Untuk K = 1
Hipotesis :
H : Efek order ke-1 dan yang lebih tinggi = 0
H : Efek order ke-1 dan yang lebih tinggi 0
P_value = 0,000 yang kurang dari nilai = 5% .
Sehingga H didukung oleh data,
artinya efek interaksi order kesatu dan yang lebih tinggi
terdapat dalam model.
0
1
Pada pengujian efek order ke-K sama dengan nol
dijabarkan sebagai berikut.
Untuk K = 1
Hipotesis :
H : Efek order ke-1 = 0
H : Efek order ke-1 0
Nilai P_value = 0,000 yang kurang dari nilai
1
= 5%.
Sehingga H didukung oleh data, artinya efek interaksi order ke-1 terdapat dalam model.
STATISTIKA UNIPA SURABAYA
0
1
1
U ntuk K = 2
H ipotesis :
H : E fek order ke-2 = 0
H : E fek order ke-2 0
N ilai P _value = 0 ,008 yang kurang dari n ilai = 5% .
S ehingga H d idukung o leh data, artinya
efek in teraksi o rder ke-2 terda
pat dalam m odel.
STATISTIKA UNIPA SURABAYA
Uji Asosiasi ParsialP en g u jian in i m em p u n ya i tu ju an u n tu k m en g u ji
sem u a p a ram ete r yan g m u n g k in d a ri su a tu m o d e l len g k ap
b a ik u n tu k sa tu va riab e l yan g b eb as m au p u n u n tu k
h u b u n g an k e te rg an tu n g an b eb erap a va ria
0
1 0
0
1 0
b e l yan g
m eru p ak an p a rs ia l d a ri su a tu m o d e l len g k ap .
H ip o tes isn ya ad a lah seb ag a i b e rik u t.
- H : E fek in te rak s i an ta ra va riab e l 1 d an va riab e l 2 = 0
H : H
- H : E fek va riab e l 1 = 0
H : H
0
1 0
- H : E fek va riab e l 2 = 0
H : H
STATISTIKA UNIPA SURABAYA
OUTPUT SPSS UJI PARSIAL
2
0
0
Statistik uji yang digunakan adalah partial chi-squared
dengan derajat bebas (db; ).
tolak H yang berarti terdapat efek variabel jenis kelamin
dalam model.
tolak H yang berarti terdapat efek
variabel jenis partai
dalam model.STATISTIKA UNIPA SURABAYA
SELEKSI MODEL Eliminasi Backward
Seleksi model log linier dilakukan dengan metode Backward Elimination.
Metode Backward Elimination pada dasarnya menyeleksi model
dengan menggunakan prinsip hierarki, yaitu dengan melihat
model
0
1
terlengkap sampai dengan
model yang sederhana.
Untuk memilih model terbaik menggunakan hipotesis sebagai berikut.
H : Model 1 adalah model terbaik
H : Model 0 (model jenuh) adalah model terbaik
STATISTIKA UNIPA SURABAYA
TERIMA KASIH
STATISTIKA UNIPA SURABAYA
MODEL LOG LINIER (Lanjutan)
Gangga AnuragaSTATISTIKA UNIPA SURABAYA
CONTOH KASUS Hubungan partai dengan jenis kelamin
Ln nij hubungan partai dengan jenis kelamineta(ij)
jenis kelamin Partai eta(i+)buruh konservatifLaki-laki 5.40 4.74 5.07
Perempuan 5.48 5.22 5.35eta(+j) 5.44 4.98 5.21
jenis kelaminPartai
Totalburuh konservatif
Laki-laki 222 115 337Perempuan 240 185 425
Total 462 300 762
STATISTIKA UNIPA SURABAYA
1
2
1
2
11 12
21 22
Sehingga :
5, 21
0,14
0,14
0, 23
0, 23
0,10 0,10
0,10 0,10
X
X
Y
Y
XY XY
XY XY
STATISTIKA UNIPA SURABAYA
MODEL JENUH / SATURATED MODEL(MODEL 0)
11 1 1 11
21 2 1 21
2
Didapat model penuh (saturated model)
log
5,4 5,21 0,14 0,23 0,10 (mod )
5,21 0,14 0,23 0,10 (mod )
0 G 0,000
ij ij
X Y XY
ij i j ij
X Y XY
X Y XY
misal v
v
v
el jenuh
v
el jenuh
df
STATISTIKA UNIPA SURABAYA
MODEL TANPA INTERAKSI (MODEL 1)XY
ij
0
Model 1 adalah interaksi antar 2 variabel dihilangkan
log
Untuk mengevaluasi interaksi
dapat dilakukan dengan membandingkan model
Berikut hipotesis yang dibangun :
m
ij ij
X Y
ij i j
XY
ij
misal v
v
H
0
odel 1 adalah model terbaik
model 0 (saturated model) adalah model terbaikH STATISTIKA UNIPA SURABAYA
2 2
2
2 2
21:0,05
Statistik Uji :
Dengan pearson dan Likelihood ratio test sebagai berikut :
ˆ, 2 log
ˆ ˆ
1 1
0,05
3,841
ij ij ijhitung ij
ij ij
G
n nG n
df I J
STATISTIKA UNIPA SURABAYA
Tabel Frekuensi Harapan dan ln darifrekuensi harapan
jenis kelaminPartai
buruh konservatif Total
Laki-laki 204.32 132.68 337.00
Perempuan 257.68 167.32 425.00
Total 462.00 300.00 762.00
jenis kelaminPartai
Totalburuh konservatif
Laki-laki 5.32 4.89 10.21Perempuan 5.55 5.12 10.67
Total 10.87 10.01 20.88STATISTIKA UNIPA SURABAYA
ANALISIS DAN PEMBAHASAN
2
2
0
:
2 logˆ
7,003138
Keputusan : Tolak H
Sehingga dapat ditarik kesimpulan bahwa Model 0 (model
lengkap) sebagai model terbaik. Jadi model log linier
untuk hubungan
ijij
ij
Perhitungan
nG n
G
antara kedua variabel tersebut adalah :X Y XY
ij i j ijv STATISTIKA UNIPA SURABAYA
PELUANG JIKA KATEGORI Y (JENISPARTAI) SAMA
0 ij
1 ij
2
H Peluang kategori B (jenis partai ) sama (model v )
H Peluang kategori B (jenis partai ) tidak sama (model v )
dengan statistik uji sbb :
2 logˆ
A
i
A B
i j
ij
ij
ij
nG n
STATISTIKA UNIPA SURABAYA
Tabel Frekuensi Harapan dan ln darifrekuensi harapan Peluang jika kategoriY sama, Tabel frekuensi harapan
Tabel ln (frekuensi harapan) = etaij
ijmodel v X
i
jenis kelaminPartai
Totalburuh konservatif
Laki-laki 168.5 168.5 337Perempuan 212.5 212.5 425
Total 381 381 762
jenis kelaminPartai
Eta(i+)buruh konservatif
Laki-laki 5.127 5.127 5.127Perempuan 5.359 5.359 5.359
Eta(+j) 5.243 5.243 5.243
STATISTIKA UNIPA SURABAYA
1 1 2
1 1
11 12 21 22
1
2
, 5,127 5,359
1( )
41
(5,127 5,127 5,359 5,359) 5, 2434
5,127 5, 243 0,116 0,12
5,359 5, 243 0,116 0,12
ijJ
ji
I J ij
i j
X
i
X
i
danJ
IJ
STATISTIKA UNIPA SURABAYA
Didapatkan model :
ij
ij
2
v
v 5,243 0,116
dan statistik uji G 41,71
X
i
STATISTIKA UNIPA SURABAYA
PELUANG JIKA KATEGORI X (GENDER)SAMA Peluang jika kategori X sama,
ijmodel v Y
j
0 ij
1 ij
2
H Peluang kategori X (gender) sama (model v )
H Peluang kategori X (gender ) tidak sama (model v )
dengan statistik uji sbb :
2 logˆ
Y
j
X Y
i j
ij
ij
ij
nG n
STATISTIKA UNIPA SURABAYA
Tabel Frekuensi Harapan dan ln darifrekuensi harapan Peluang jika kategori X sama, Tabel frekuensi harapan
Tabel ln (frekuensi harapan) = etaij
ijmodel v Y
j
jeniskelamin
Partai Totalburuh konservatifLaki-laki 231 150 381
Perempuan 231 150 381Total 462 300 762
jeniskelamin
Partai eta(i+)buruh konservatif
Laki-laki 5.442 5.011 5.227Perempuan 5.442 5.011 5.227
eta(+j) 5.442 5.011 5.227
STATISTIKA UNIPA SURABAYA
1 1 2
1 1
1
log (terdapat hubungan antara log denga
sehingga dapat digunakan untuk menduga log )
, 5,442 dan 5,011
5,227
ij ij ij ij
ij ij
ijI
ij
I J ij
i j
Y
j j
Y
n
n
I
IJ
1
1 1
5,442 5,227 0,215 0,22
5,011 5,227 0,216 0,22Y
STATISTIKA UNIPA SURABAYA
ij
ij
2 2
1:0 ,05
v
v 5,227 0,22
dan statistik uji G 17,19 3,841
Y
j
STATISTIKA UNIPA SURABAYA
PELUANG KATEGORI (i,j) SAMA
0 ij
2
H Peluang kategori i,j sama (model v )
dengan statistik uji sbb :
2 logˆ
ij
ij
ij
nG n
STATISTIKA UNIPA SURABAYA
Tabel frekuensi harapan
Tabel ln (frekuensi harapan) = etaij
jenis kelaminPartai
Totalburuh konservatif
Laki-laki 190.5 190.5 381Perempuan 190.5 190.5 381
Total 381 381 762
jenis kelaminPartai
eta(i+)buruh konservatif
Laki-laki 5.250 5.250 5.250Perempuan 5.250 5.250 5.250
eta(+j) 5.250 5.250 5.250
ij
ij
2
v
v 5,25
G 51,89
STATISTIKA UNIPA SURABAYA
REKAPITULASI MODEL LOG LINIER
Interpretasi : terjadi penurunan G2, dimana sesuai denganhipotesis yang dibangun dalam perbandingan model didapatkanmodel jenuh (saturated model) adalah model terbaik
2Model G
51,89
41,71
17,19
7,003
ij
X
ij i
Y
ij j
X Y
ij i j
X
ij i
v
v
v
v
v
0,00Y XY
j ij
STATISTIKA UNIPA SURABAYA
Latihan Soal Dalam suatu penelitian perusahaan, sejumlah data
dikumpulkan untuk menentukan apakah proporsi barangyang cacat (X) yang dihasilkan oleh karyawan sama untukgiliran shift pagi, sore atau malam (Y). Data berikutmenggambarkan barang yang diproduksi yang cacat untukshift pagi, sore, dan malam.Tentukan estimasi parameterlog linier dan berikan kesimpulan?
KondisiProduk
ShiftTotal
Pagi Siang Malam
Cacat 45 55 70 170Tidak cacat 905 890 870 2665
Total 950 945 940 2835
STATISTIKA UNIPA SURABAYA
TUGAS
UraianTingkat Pemanfaatan TIK
Jarang Kadang-Kadang Sering Sangat
Sering
KetersedianFasilitasAkse TIK
Sedikit 63 57 45 19
Banyak 13 35 49 46
Tentukan estimasi parameter log linier dan berikan kesimpulan?Gunakan perhitungan manual.
Lakukan analisis dan pembahasan sesuai dengan prosedur dalam LogLinier? Gunakan SPSS.
STATISTIKA UNIPA SURABAYA
TERIMA KASIH
STATISTIKA UNIPA SURABAYA
REGRESI LOGISTIK BINER
Oleh : Gangga Anuraga, S.Si M.SiSTATISTIKA UNIPA SURABAYA
REGRESI LOGISTIK BINER Menggambarkan hubungan antara variabel respon (berskala
kategori biner yaitu mempunyai dua kategori nilai 0 dan 1)danvariabel prediktornya (kualitatif maupun kuantitatif).
Digunakan untuk memperkirakan apakah suatu kejadian akanterjadi atau tidak dengan diketahuinya satu atau beberapavariabel prediktor.
Model regresi logistik dapat pula digunakan untuk mengetahuiseberapa besar pengaruh variabel prediktor terhadap variabelrespon, sehingga dapat dikatakan bahwa, tujuan menggunakanmodel ini adalah mencari model terbaik yang menggambarkanhubungan antara variabel respon dengan variabel prediktornya.
STATISTIKA UNIPA SURABAYA
DISTRIBUSI BERNOULLI VariabelY mengikuti distribusi Bernoulli dengan fungsi
probabilitas sebagai berikut :1( ) (1- ) dimana y = 0,1
jika y = 0, ( 0 | ) 1 ( ),
yang mana merupakan peluang untuk mendapatkan
hasil "gagal".
jika y = 1, ( 1| ) ( ),
yang mana merupakan peluang untuk mend
y yf y
P y x x
P y x x
apatkan
hasil "sukses".
merupakan variabel prediktor yang dapat berupa kuantitatif
maupun kualitatif.
xSTATISTIKA UNIPA SURABAYA
MODEL REGRESI LOGISTIK BINER
0 1
|
merepresentasikan kondisional rata-rata (mean)
dengan prediktor x diketahui.
Menurut Hosmer dan Lameshow (2013),
model regresi logistik dapat dituliskan sbb :
x E y x
ex
0 1
0 1
1 dan transformasi dari atau logit transformation
didefinisikan sbb :
ln1
x
xex
xg x x
x
STATISTIKA UNIPA SURABAYA
MODEL REGRESI LINIER Vs LOGISTIK Perbedaan lain antara regresi linear dengan regresi logistik
adalah distribusi dari variabel respon.
2
Pada model regresi linear, variabel respon diasumsikan
sebagai ( ) dan ( ) |
dengan dinamakan error, ~ N(0,I )
Pada regresi logistik biner, nilai error hanya terdiri dari dua kemungkinan,
ya
y x x E y x
itu jika y = 1 maka 1 ( ) dengan peluang ( )
atau jika y = 0 maka ( ) dengan peluang 1 ( )
Jadi error mempunyai distribusi dengan mean sama dengan nol dan varians
( ) 1 ( )
x x
x x
x x
STATISTIKA UNIPA SURABAYA
PEMODELAN REGRESI LOGISTIK BINER Data berpasanngan (xi , yi), i = 1,2,3…n, dan n merupakan
banyaknya sampel data.
i
i
i
jika y = 1 dengan peluang ( )
atau jika y = 0 dengan peluang 1 ( )
karena data berpasangan x , , maka
y = 1 dengan peluang ( ) dan
y = 0 dengan peluang 1 ( )
Karena variabel respon dalam model reg
i
i
i
x
x
y
x
x
1
resi logistik
mengikuti distribusi Bernoulli, maka fungsi kepadatan peluang
adalah sbb (Hosmer dan Lemeshow, 2013):
( ) 1 ( ) ii
yy
i ix x
STATISTIKA UNIPA SURABAYA
FUNGSI LIKELIHOOD
1
1
0 1
Variabel respon diasumsikan bebas maka fungsi likelihood
dapat dituliskan sbb (Hosmer dan Lameshow, 2013) :
( ) 1 ( ) ...(1)
ˆ ˆ ˆestimasi / taksiran dan dapat dicari dengan
memaks
ii
n yy
i ii
l x x
0 1
1
0
imumkan terhadap dan . Dimana dengan me-ln kan
terlebih dahulu fungsi likelihood . Berikut fungsi log-likelihood
ln ln ( ) 1 ln 1 ( ) ...(2)
turunkan persamaan (2) terhadap dan
n
i i i ii
l
L l y x y x
1 .STATISTIKA UNIPA SURABAYA
CONTOH KASUS Sumber data : buku Hosmer dan Lameshow (2013)
tentang coronary heart disease dengan sampel sebanyak100
Hubungan antara umur (x) dengan penyakit jantungkoroner (y), y = 1 (terkena penyakit jantung koroner) dany = 0 (tidak terkena penyakit jantung koroner).
STATISTIKA UNIPA SURABAYA
Hasil Estimasi SPSS
5 ,3 0 9 0 ,1 1 1*
5 ,3 0 9 0 ,1 1 1*ˆ
15 , 3 0 9 0 ,1 1 1 *ˆ
u m u r
u m u r
ex
eg x u m u r
STATISTIKA UNIPA SURABAYA
UJI SIGNIFIKANSI PARAMETER
1 0
0 1
1 1
1 0
1
1
1
1 1 0 0
2
v,
H ipo tesis (U ji S eren tak ):
H : 0
H : 0
2 ln1ˆ ˆ
atau
ln 1 ln 1ˆ ˆ2
ln ln ln
29, 31 d iband ingkan dengan
ii
n n
n yy
i ii
n
i i i ii
n nn nG
y yG
n n n n n n
G
STATISTIKA UNIPA SURABAYA
Uji parsial :
1
1
2
2 2
1,
Uji Wald
ˆ 0,1114,61ˆ 0,024
dibandingkan dengan Z
atau W dengan
Wse
STATISTIKA UNIPA SURABAYA
UJI KESESUAIAN MODEL Uji kesesuaian parameter model regresi logistik adalah
Goodness of fit. Digunakan untuk mengetahui keefektifanmodel dalam menjelaskan variabel respon. Hipotesisnyaadalah : Ho : model sesuai (tidak ada perbedaan antara observasi
dengan hasil kemungkinan prediksi hasil) H1 : model tidak sesuai (ada perbedaan antara observasi
dengan hasil kemungkinan prediksi hasil)
Statistik uji (Hosmer dan Lameshow Test):
STATISTIKA UNIPA SURABAYA
KETEPATAN KLASIFIKASI MODEL
STATISTIKA UNIPA SURABAYA
TERIMA KASIH
STATISTIKA UNIPA SURABAYA
REGRESI LOGISTIK BINER (DICHOTOMOUSINDEPENDENT VARIABLE)
Gangga Anuraga, M.SiSTATISTIKA UNIPA SURABAYA
REGRESI LOGISTIK DENGAN INDIKATORKATEGORI / KUALITATIF Bila suatu variabel prediktor mempunyai p kategori, maka
variabel dummy yang diperlukan adalah p-1. Diketahui model logit dari regresi logistik adalah
Dimana X1 adalah variabel kualitatif gender (male = 1dan female = 0) dan y adalah keputusan untukmelanjutkan riset / penelitian (continue the research = 1dan stop the research = 0)
Data ..\Pratikum\Logistic categorical.sav
0 1 1
ln1
xg x x
x
STATISTIKA UNIPA SURABAYA
MODEL REGRESI LOGISTIK
0 ,847 1,217*
0 ,847 1,217*ˆ
10,847 1, 217 *ˆ
gender
gender
ex
eg x gender
STATISTIKA UNIPA SURABAYA
ANALISIS DAN PEMBAHASANUJI SERENTAK
0
1
2
v,
Hipotesis (Uji Serentak):
H : 0
H : minimal ada satu nilai 0
Statistik Uji dibandingkan dengan
i
i
G
STATISTIKA UNIPA SURABAYA
Uji Parsial
1
1
2 2
1,
2
Uji Wald
ˆ 1, 2174,96ˆ 0, 245
W dibandingkan dengan
atau W dibandingkan dengan Z
Wse
STATISTIKA UNIPA SURABAYA
UJI KESESUAIAN MODEL Uji kesesuaian parameter model regresi logistik adalah
Goodness of fit. Digunakan untuk mengetahui keefektifanmodel dalam menjelaskan variabel respon. Hipotesisnyaadalah : H0 : model sesuai (tidak ada perbedaan antara observasi
dengan hasil kemungkinan prediksi hasil) H1 : model tidak sesuai (ada perbedaan antara observasi
dengan hasil kemungkinan prediksi hasil)
STATISTIKA UNIPA SURABAYA
INTERPRETASI MODEL Setelah didapatkan model yang sesuai maka selanjutnya
model tersebut diintepretasikan. Intepretasi model regresilogistik dapat dilakukan berdasarkan nilai odds ratio yangmenunjukkan seberapa besar variabel-variabel yangsignifikan berpengaruh terhadap keputusan melanjutkanpenelitian / riset.
STATISTIKA UNIPA SURABAYA
0 ,847 1,217*
0 ,847 1,217*
0 ,847 1,217*
0 ,847 1,217*1
ˆ1ˆ
untuk x = 1 (male)
1, 448
1, 448 1, 448maka : 0,59ˆ
1 1, 448 2, 448
sehingga dapat diprediksi bahwa 59% dari
gender
gender
gender
ex
eodds x e
odds e
x
laki-laki
akan memutuskan melanjutkan penelitian / risetSTATISTIKA UNIPA SURABAYA
0 ,847 1 ,217*0
untuk x = 0 (female)
0, 429
0, 429 0, 429maka : 0,30ˆ
1 0, 429 1, 429
sehingga dapat diprediksi bahwa 30% dari perempuan
akan memutuskan melanjutkan penelitian / riset
odds e
x
STATISTIKA UNIPA SURABAYA
Odds ratio adalah perbandingan dari dua odds.
Peluang laki-laki yang memutuskan untuk melanjutkanpenelitian / riset lebih tinggi 3,376 daripada perempuan.
Interpretasi odds dan odds ratio diatas dapat digambarkanseperti tabel berikut :
1, 4483, 375
0, 429odds ra tio
STATISTIKA UNIPA SURABAYA
Tabel Prediksi Model Logistik
decision gendermale (x = 1) female (x = 0)
continue the research (y = 1) 0,59 0,30stop the research (y = 0) 0,41 0,70
Total 1,0 1,0
STATISTIKA UNIPA SURABAYA
KETEPATAN KLASIFIKASI
STATISTIKA UNIPA SURABAYA
TERIMA KASIH
STATISTIKA UNIPA SURABAYA
REGRESI LOGISTIKMULTINOMIALGANGGA ANURAGA, M.SI
1
STATISTIKA UNIPA SURABAYA
PENDAHULUAN Regresi logistik multinomial merupakan regresi logistik yang
digunakan saat variabel dependen mempunyai skala yangbersifat polichotomous atau multinomial. Skala multinomialadalah suatu pengukuran yang dikategorikan menjadi lebih daridua kategori.
Mengacu pada regresi logistik trichotomous (Hosmer danLemeshow, 2000) untuk model regresi dengan variabel dependenberskala nominal tiga kategori digunakan kategori variabel hasil Ydiberi kode 0,1, dan 2.
Variabel Y terparameterisasi menjadi dua fungsi logit.Sebelumnya perlu ditentukan kategori hasil mana yang digunakanuntuk membandingkan (kategori pembandin). Pada umumnyadigunakan Y=0 sebagai pembanding.
2
STATISTIKA UNIPA SURABAYA
MODEL REGRESI LOGISTIK MULTINOMIAL (1) Untuk membentuk fungsi logit, akan dibandingan Y=1 dan Y=2,
terhadap Y=0. Bentuk model regresi logistik dengan p variabelprediktor seperti pada persamaan berikut.
Menurut Hosmer dan Lemeshow (2000), dengan menggunakantransformasi logit akan didapatkan dua fungsi logit sebagai berikut.
3
0 1 1 2 2
0 1 1 2 2
exp( )( )
1 exp( )p p
p p
x x xx
x x x
1 10 11 1 1 1
( 1| )( ) ln '
( 0 | ) p p
P Y xg x x x x
P Y x
2 20 21 1 2
( 2 | )( ) ln '
( 0 | ) p p p
P Y xg x x x x
P Y x
STATISTIKA UNIPA SURABAYA
MODEL REGRESI LOGISTIK MULTINOMIAL (2) Berdasarkan kedua fungsi logit tersebut maka didapatkan model
regresi logistik trichotomous sebagai berikut.
4
01 2
1( )
1 exp ( ) exp ( )x
g x g x
11
1 2
exp ( )( )
1 exp ( ) exp ( )
g xx
g x g x
22
1 2
exp ( )( )
1 exp ( ) exp ( )
g xx
g x g x
dengan ( | ) ( ) untuk j = 0,1,2jP Y j x x STATISTIKA UNIPA SURABAYA
MODEL REGRESI LOGISTIK MULTINOMIAL (3) Sehingga estimasi peluang untuk model regresi logistik multinomial
dapat dituliskan sebagai berikut :
5
1 11 1
1 11 1
j
1 ...1
1 ...dan
log
catatan : 1
j j
J J
J J
j j
x
j xx
J xx
xj
J
j
j j
J
e
e e
e e
e
x
STATISTIKA UNIPA SURABAYA
TERIMA KASIH
6
STATISTIKA UNIPA SURABAYA
REGRESI LOGISTIK ORDINALGangga Anuraga, M.Si
STATISTIKA UNIPA SURABAYA
PENDAHULUAN• Regresi logistik ordinal digunakan ketika variabel respon
(dependen) yang mempunyai skala ordinal yang terdiri atastiga kategori atau lebih. Variabel prediktor (independen) yangdapat disertakan dalam model berupa data kategori ataukontinu yang terdiri atas dua variabel atau lebih.
• Model logit dalam regresi logistik ordinal adalah cumulative logitmodels. Pada model logit ini sifat ordinal dari respon Ydituangkan dalam peluang kumulatif. Sehingga cumulativelogit models merupakan model yang didapatkan denganmembandingkan peluang kumulatif yaitu peluang kurang dariatau sama dengan kategori respon ke-j pada p variabel prediktoryang dinyatakan dalam vektor X, P(Y≤ j | X), dengan peluanglebih besar dari kategori respon ke-j, P(Y > j | X). (Hosmer danLemeshow, 2000)
STATISTIKA UNIPA SURABAYA
CUMULATIVE LOGIT MODELS
1
Peluang kumulatif untuk variabel Y dengan kategori
dapat dituliskan sbb :
, 1,...,
dimana 1 2 1
sehingga model logitnya dapat dituliskan sbb :
logit log lo1
j
j
P Y j j J
P Y P Y P Y J
P Y jP Y j
P Y j
1
1
g ,
dengan 1,..., 1
j
j J
j J
STATISTIKA UNIPA SURABAYA
CUMULATIVE LOGIT MODELS• Model regresi logistik ordinal yang terbentuk jika terdapat J = 3
kategori respon adalah :
1
01 1 1
2 3
1 2
02 1 1
3
01
logit 1 log
logit 2 log
jadi :
|logit | log
1 |
p p
p p
p
j k kk
P Y x x
P Y x x
P Y j XP Y j X x
P Y j X
STATISTIKA UNIPA SURABAYA
NILAI PELUANG PADA KATEGORI RESPONORDINAL
STATISTIKA UNIPA SURABAYA
NILAI PELUANG PADA KATEGORIRESPON ORDINAL
STATISTIKA UNIPA SURABAYA
TERIMA KASIH
STATISTIKA UNIPA SURABAYA
Generalized Linear ModelsGANGGA ANURAGA
STATISTIKA UNIPA SURABAYA
PEMODELAN (MODELING)
• Mengapa dibutuhkan model dari suatu data ?– Model mendeskripsikan hubungan atau asosiasi dalam data.– Inferensi parameter dalam model digunakan sebagai cara untuk
mengevaluasi hubungan antara variabel independen dengan variabeldependen.
– Estimasi paramater dalam model menunjukkan tingkat kekuatan(strength) dan kepentingan (importance) dari suatu hubungan atauasosiasi.
– Model sebagai prediksimenyediakan estimasi yang baik terhadapvariabel respon.
STATISTIKA UNIPA SURABAYA
ReviewOrdinary Linear Regression
• Variabel respon (Y) kontinu dengan prediktor (X)adalah kontinu/diskrit
• Ingat : asumsi residual IIDN
• Estimator
• Aplikasi pemodelan linier : analisis regresi, anova dll.
i iE Y
Y E Y
1' 'ˆ X X X Y
STATISTIKA UNIPA SURABAYA
PENGANTAR GLMs
• OLS bergantung pada distribusi dari Y (normal)• Data kategori, asumsi normal menjadi sulit dipenuhi• GLMs digunakan pada data diskrit dan count.• Tiga komponen dalam GLM
– Variabel respon Y random dan memiliki dist. Naturaleksponensial
– Sistematik komponen (desain perkalian matrik oleh vektorparameter)
– Link function g(.) , ( ( ))Y E Y f E y
STATISTIKA UNIPA SURABAYA
PENGANTAR GLMs
• Normal General Linear Model (Regresi Linier)
– Link function
• Data binomial
0 1 1 2 2i i i iy x x
i iE Y
STATISTIKA UNIPA SURABAYA
PENGANTAR GLMs
• Data Poisson
STATISTIKA UNIPA SURABAYA