ANALISIS ROBUST DARI MODEL LINEAR
CAMPURAN TERGENERALISIR
Wahyuning Widiyastuti
Abstract
We will develops a technique for finding robust maximum
likelihood estimates of the model parameters in generalized
linear mixed models. The asymptotic properties of the robust
estimates lies in the presence of outliers, and these estimates also
compared to the ordinary classical estimates. By starting from a
natural class of robust estimators for generalized linear models
based on the notion of likelihood, we define robust deviances
that can be used for stepwise model selection as in the classical
framework. The binomial models are treated in detail.
Application to real data and a sensitivity analysis show that the
inference obtained by means of the new techniques is more
reliable than that obtained by classical estimation and testing
procedures.
Key words : Generalized linear models, Mixed models, Maximum
likelihood
Abstrak
Akan dibangun teknik untuk mencari estimasi Maksimum
Likelihood Robust dari Model Linear Campuran yang
Tergeneralisir. Sifat asimtotis dari estimator robust diselidiki
dalam kehadiran outlier, estimasi ini juga dibandingkan
dengan estimasi klasik yang biasa. Dengan berawal dari model
asli estimator robust untuk model linear yang tergeneralisir,
kita akan mendefinisikan alat yang robust yang dapat kita
gunakan untuk menyelesaikan model yang klasik. Model
Binomial akan diperlakukan secara detail. Aplikasi untuk data
yang nyata dan analisis sensitifitas menunjukkan bahwa dapat
digeneralisir teknik baru ini lebih reliable daripada model
klasik untuk mendapatkan estimasi klasik dan teknik
prosedur.
ANALISIS ROBUST DARI MODEL LINEAR...
34 Journal of Mathematic Teaching
1. Pendahuluan
Pendekatan analisis regresi merupakan analisis yang
digunakan untuk mempelajari bentuk ketergantungan Antara satu
peubah tak bebas dengan satu atau lebih peubah bebas, yang
didalamnya terdapat asumsi-asumsi pokok yang mendasari. Misal
diberikan model regresi linear Y = Xβ + ε dengan Y dan ε adalah
vector-vektor random berdimensi n x p dan β berdimensi p, yaitu
parameter yang diestimasi. ε diasumsikan berdistribusi Normal
independen dengan mean nol dan variansi berhingga σ2.
Dalam prakteknya terjadi antara lain sebaran data yang
normal, tetapi mengandung pengamatan yang merupakan outlier.
Adanya data yang merupakan outlier dapat memberikan pengaruh
terhadap hasil analisisnya, seperti terjadinya koefisien regresi yang
seharusnya signifikan menjadi tidak signifikan. Dengan kondisi
demikian ini dikatakan bahwa parameter-parameter dalam model
yang diestimasi bersifat tidak tegar terhadap outlier, artinya nilai
estimasinya dapat dipengaruhi secara kuat oleh adanya data yang
merupakan outlier.
Data yang merupakan outlier adalah suatu penyimpangan
atau keganjilan dan menandakan suatu data yang sama sekali tidak
tipikal dibandingkan dengan data yang lain. Penolakan begitu saja
terhadap outlier bukanlah prosedur yang bijaksana, karena
adakalanya suatu outlier memberikan informasi yang tidak dapat
diberikan oleh data yang lain. Prosedur yang bersifat robust
ditujukan untuk mengakomodasi adanya data outlier dan sekaligus
meniadakan pengaruhnya terhadap hasil analisis tanpa terlebih
dahulu mengadakan identifikasi terhadap data yang tidak cocok
dengan model. Prosedur ini lebih bersifat otomatis dalam
menanggulangi data outlier. Karenanya diperlukan metode estimasi
parameter yang bersifat tegar untuk mengatasi outlier, dimana nilai
dugaannya tidak banyak dipengaruhi oleh perubahan kecil dalam
data. Robust dapat diartikan sebagai suatu analisis yang tidak terlalu
tergantung secara kritis pada asumsi distribusi tertentu. Prosedur
analisis statistic yang kita harapkan adalah prosedur yang
menghasilkan keluaran cukup baik, meskipun beberapa asumsinya
tidak terpenuhi secara sempurna.
Wahyuning Widiyastuti
35 Jurnal KONSTANTA _ Vol. 1 No. 1 Juli-Desember 2017
Model Linear Campuran Tergeneralisir (Generalized Linear
Mixed Model) berguna dalam analisis dari data outlier. Model ini
berguna untuk mengakomodasi disperse berlebih yang sering
teramati diantara respon distribusi normal. Biasa diasumsikan
bahwa efek random mempunyai distribusi normal multivarian yang
komponen variansinya diestimasi dari data. Aplikasi untuk model
statistik linear merupakan kejadian yang relative dibutuhkan saat ini,
artinya sebagai alat matematika, model linear campuran
tergeneralisir membantu dalam memahami aspek khususnya
prosedur analisis yang berkaitan dengan model linear terutama
analisis data. Maksimum Likelihood analisis berdasar pada distribusi
bersama likelihood yang dapat berguna untuk mengestimasi
parameter-parameter efek acak maupun efek tetap dalam model
linear campuran tergeneralisi, ini membutuhkan teknik integrasi
numeric untuk menghitung log-likelihood, persamaan skor, dan
elemen informasi matrik. Meskipun demikian, kegunaan model linear
campuran tergeneralisir terbatasi untuk model yan relative
simple,dengan ditemukan bahwa model ini tidak mudah dipecahkan
untuk masalah lebih rumit yang mengandung integral berdimensi
tinggi dengan jumlah yang tidak terbatas. Untuk menghindari
masalah perhitungan seperti ini, beberapa pendekatan Bayesian
disarankan untuk memperumum sampel.
Dalam penulisan ini akan dibangun Maksimum Likelihood
Robust melalui algoritma Newton Raphson untuk mendekati estimasi
maksimum Likelihood Robust akan dibandingkan dengan estimasi
Maksimum Likelihood eksak atau estimasi Maksimum Likelihood
klasik untuk model sederhana. Nantinya ditemukan bahwa estimasi
Maksimum Likelihood Robust menurunkan sifat dari estimasi
Maksimum Likelihood eksak.
Analisis klasik dari model linear campuran tergeneralisir
dapat sangat sensitive terhadap outlier, dengan menganggap analisis
maksimum likelihood robust dari model linear campuran
tergeneralisir dalam bingkai kerja Maksimum Likelihood. Estimasi
Maksimum Likelihood Robust dengan parameter regresi dan
komponen variansinya dalam model linear campuran tergeneralisir
mengandung spesifikasi dari distribusi posterior efek acak. Ini
mungkin untuk mendekati distribusi posterior yang dimaksud
ANALISIS ROBUST DARI MODEL LINEAR...
36 Journal of Mathematic Teaching
dengan menghaslkan gambaran acak dari distribusi dengan tidak
membutuhkan spesifikasi dari distribusi posterior.
Sifat asimtotis estimator Maksimum Likelihood Robust
diselidiki dibawah kondisi regular. Estimator Maksimum Likelihood
Robust terlihat konsisten dan berdistribusi asimtotis dengan mean
vector dan covarian matrik tertentu. Simulasi dilakukan untuk
menggali perilaku sampel dari esimasi maksimum likelihood robust
dengan adanya outlier. Hasil simulasi mengindikasikan bahwa tidak
seperti maksimum likelihood robust berguna untuk menurunkan
bobot titik yang berpengaruh dalam data ketika mengestimasi
parameter pada model linear campuran tergeneralisir. Untuk itu
dalam penulisan ini akan dibahas mengenai analisis robust dari
model linear campuran yang tergeneralisir, dibahas pula mengenai
penduga maksimum likelihood robust, yang merupakan estimasi
parameter yang bersifat robust, sebagai alternative pemecahan
adanya data yang merupakan outlier.
Permasalahan dirumuskan bagaimana bentuk dan
karakteristik estimator maksimum likelihood robust serta
membandingkannya dengan estimasi maksimum likelihood klasik
Tulisan ini bertujuan menjawab permasalahan yang telah
dikemukan sebelumnya, yaitu menaksir estimator maksimum
likelihood robust, serta membandingkan estimasi maksimum
likelihood robust dengan estimasi maksimum likelihood klasik.
Sehingga diharapkan dapat memberikan manfaat dalam memperkuat
pengetahuan tentang teori estimasi. Dapat memberikan informasi
bagi penulis lain, khususnya untuk masalah yang relevan dengan
tulisan ini.
2. Model Linear Tergeneralisir
Menurut Mc Cullagh dan Nelder (1983), model linear
tergeneralisir merupakan perluasan dari proses pemodelan linear
yang mengijinkan penentuan model dari suatu data yang
berdistribusi Normal seperti Poisson, Binomial, Multinomial dan
lainnya. Uji hipotesis yang diterapkan dalam model linear
tergeneralisir tidak memerlukan asumsi kenormalan dari variable
responnya ataupun kehomogenan variansi. Sehingga dengan dmikian
model linear tergeneralisir tak hanya dapat digunakan pada variable
Wahyuning Widiyastuti
37 Jurnal KONSTANTA _ Vol. 1 No. 1 Juli-Desember 2017
respon yang berdistribusi selain Normal dan variansi yang tak
konstan/homogeny. Misalnya data yang berbentuk cacah akan lebih
cocok dianalisa sebagai variable random yang berdistribusi Poisson
pada konteks model linear tergeneralisir.
Komponen-komponen dalam model linear tergeneralisir, yaitu :
1. Variabel dependennya, y1,y2,…,yn dengan mean E(y) = μi
diasumsikan merupakan bagian dari distribusi keluarga
eksponensial.
2. Sekumpulan parameter β(px1) dan variable independen xi(px1)
y dengan penjelas x1,…,xp merupakan suatu Model Linear
Tergeneralisir bila memenuhi kondisi berikut :
(i) Distribusi setiap elemen yi dari Y dengan i = 1,…,n nilai xi1,…,xip
diketahui, menjadi anggota keluarga eksponensial, dengan
bentuk umum
untuk fungsi tertentu a( ), b( ) dan c( )
Jika diketahui, maka fungsi tersebut merupakan anggota
keluarga eksponensial dengan parameter kanonik θ.
(ii) Vektor xi mempengaruhi yi dalam bentuk predictor linear μ,
sehingga untuk setiap I, berlaku
Harga harapan dari setiap observasi dapat diekspresikan
sebagai suatu fungsi yang diketahui dari predictor linearnya
yaitu E(Yi) = μi = g(ηi), Fungsi g( ) dikenal sebagai fungsi link.
Beberapa Teorema penunjang yang akan dikemukakan, yaitu
sebagai berikut :
Teorema 2.1 (Teorema Limit Pusat)
Jika X1, X2, … , Xn sampel random dari suatu distribusi dengan mean µ
dan variansi
,yc
a
byexp i
iii
p
1
ijji x
ANALISIS ROBUST DARI MODEL LINEAR...
38 Journal of Mathematic Teaching
σ2 > 0, maka limit distribusi adalah normal baku
untuk
Definisi 2.2
Barisan {Zn}, untuk dikatakan konvergen hamper pasti
(almost surely = a.s) atau konvergen dengan probabilitas satu ke Z
jika untuk setiap s S dan untuk
Zn(s) konvergen ke Z, kecuali mungkin pada W S dengan P(W) = 0.
Secara singkat
ditulis untuk atau . Jadi Zn
konvergen ke
Z untuk , artinya untuk setiap ε > 0 dan s Wc(komplemen
W) terdapat N(ε,s),
sehingga untuk semua n N(ε,s) berlaku
Teorema 2.3
Misal Qn(ω,β) fungsi terukur pada ruang ukuran Ω dan untuk setiap
ω ϵ Ω Qn(ω,β) adalah sampel log likelihood dikenal juga sebagai
regresi jumlah kuadrat, maka terdapat
fungsi terukur , sedemikian hingga Qn ( ω, ) =
untuk setiap ω ϵ Ω. Jika untuk
n
nX
Z
n
1t
T
n
)1,0(N~ZZd
n n
n
n
ZZs.a
n n
1ZZPnn
n
)s(Z)s(Zn
n̂ n̂ nn
n
ˆ,Qinf
0)ˆ,(Q),(Qs.a
nnn
Wahyuning Widiyastuti
39 Jurnal KONSTANTA _ Vol. 1 No. 1 Juli-Desember 2017
semua β ϵ Θ, Qn ( ω, ) equikontinu, dan mempunyai sifat
teridentifikasi minimal secara tunggal , untuk n = 1, … , maka
untuk
Bukti
Ambil ε > 0 sebarang.
Karena ada dan teridentifikasi secara tunggal, maka
terdapat barisan
)(Q)(Qmin *
nnnN
n cn
dengan adalah
komplemen dari Nn dan ,
sedemikian hingga kompak, Qn ( ω, ) dan tidak
dibutuhkan untuk konvergen kesetiap limit sehingga
untuk semua tetapi berhingga untuk n, yang mana secara tidak
langsung berlaku bahwa terdapat beberapa n0(ε) sedemikian hingga
untuk semua n ≥ n0(ε) berlaku maka
sehingga untuk semua n cukup besar.
3. Robust
Menurut Huber, “Robustness” (ketegaran) berarti
ketidakpekaan terhadap perubahan-perubahan kecil dari asumsi-
asumsi. Dan secara umum arti dari robust menyatakan suatu analisis
yang tidak terlalu tergantung secara kritis pada asumsi distribusi
tertentu.
Pertama kali yang perlu diperhatikan adalah ketegaran
distribusi, yaitu bentuk distribusi yang sebenarnya menjadi dasar
n̂
*n
0s.a*
nn n
)(ˆn n̂
cnN
cnN
)(n
n̂*n
0n
0n
2)ˆ,(Q),(Q nnn
nn Nˆ
ANALISIS ROBUST DARI MODEL LINEAR...
40 Journal of Mathematic Teaching
yang sedikit menyimpang dari model yang diasumsikan, hal ini
penting dan baik untuk dipahami. Beberapa prosedur statistik klasik
memperlihakan sangat kurangnya ketegaran distribusi. Pencilan
(outlier) memberikan sebuah contoh diantaranya. Selain
pengamatan (data) yang ekstrim atau outlier, factor-faktor yang
mempengaruhi ke”robust”an/ketegaran antara lain : tidak atau
kurang terpenuhinya asumsi-asumsi standar stokastik, misalnya :
independensi, distribusi identic, keacakan(random) dan lain-lain.
4. Outlier
Tidak semua pengamatan akan mempunyai pengaruh atau
peran yang sama dalam pencocokan estimasi dan analisis yang
mengikutinya. Adalah diluar kebiasaan dalam regresi linier bahwa
terdapat satu atau lebih kasus di dalam suatu analisis dengan
pengamatan yang menyimpang dari model yang sesuai, saat dimana
sebagian besar dari data yang ada kelihatan cocok dan baik.
Setiap kumpulan data pada umumnya akan memiliki nilai-
nilai yang ekstrim, akan tetapi tidak selalu bahwa suatu nilai yang
ekstrim tersebut adalah suatu outlier. Tetapi suatu pengamatan
dengan nilai ekstrim merupakan kandidat utama untuk outlier.
Outlier didefinisikan sebagai pengamatan yang mempunyai nilai
sisaan mutlak yang cukup besar jika dibandingkan dengan
pengamatan yang lain dalam kumpulan data. Outlier
diidentifikasikasi secara subyekif sebagai sebuah observasi yang
menmbulkan “kejutan” pada nilainya relative terhadap anggota-
anggota sampel yang lain. Outlier bukanlah sebuah nilai ekstrim yang
sederhana tetapi dia mempunyai suatu bentuk pemrosesa. Outlier
sangatlah relative dan perlakuan outlier pada dasarnya bergantung
pada asumsi distribusi yang mendasarinya. Untuk mendeteksi
adanya outlier dapat dilakukan dengan melalui plot residual. Dengan
membuat plot residual terhadap fitted value maka data yang
menrupakan outlier akan dapat diidentifikasi karena terletak jauh
dari pola data umumnya. Cara ini adalah pendekatan kasar dalam
mendeteksi adanya
5. Model Linear Campuran Tergeneralisir
Model linear campuran tergeneralisir merupakan pengembangan
model linear klasik. Pengembangan ini berdasarkan pada suatu
Wahyuning Widiyastuti
41 Jurnal KONSTANTA _ Vol. 1 No. 1 Juli-Desember 2017
penemuan bahwa distribusi Normal termasuk dalam keluarga
distribusi yang lebih luas, yaitu keluarga eksponensial.
Diasumsikan observasi yi mempunyai distribusi yang termasuk
dalam keluarga eksponensial dengan fungsi densitas seperti :
untuk beberapa fungsi a, b, dan c
Bentuk kanonik parameter
dengan
adalah kolom ke-i dari matrik X untuk efek tetap dan
adalah kolom ke-i dari matrik Z untuk efek acak
Kita juga mengasumsikan bahwa vector efek acak u berdistribusi
normal dengan rata-rata 0 dan variansi σ2 atau
u ~ N ( 0 , σ2 )
6. Model Campuran Biner
Anggap model campuran biner dengan 1 efek random dan 1 efek
tetap
~ independen Bernoulli (pij), dengan i = 1,…,n dan j = 1,…,k
uj ~ independen N ( 0 , σ2 )
dengan uj efek random dari model biner campuran
Dalam model ini,
),y(c
)(a
))(by(exp),,uy(f i
iiiiuyi
uzx Ti
Tii
Tix
Tiz
uy ij
ij
ij
ijp1
plog
jij ux
ANALISIS ROBUST DARI MODEL LINEAR...
42 Journal of Mathematic Teaching
Perhitungan persamaan dapat berbentuk
dengan
)u,(uYE ijij
)uxexp(1
)ux(exp
jij
jij
)u,(uYVar 2ijij
])uxexp(1[
)ux(exp
2jij
jij
0y)u,(qx)x()u,()u,(
)u,(yE
n
1i
iii
i
iic
0y)u,(qx)x()u,())u,(r(En
1i
k
1j
iiiijc
)u,(
)u,(y)u,(r
ij
ijij
ij
ij
ij
ij1
)u,(
n
1i
k
1j
ijijijijc x)x()u,(u))u,(r(Enk
1)u,(q
Wahyuning Widiyastuti
43 Jurnal KONSTANTA _ Vol. 1 No. 1 Juli-Desember 2017
Distribusi fu dalam u ~ fu(u ) dipilih N ( 0 , σ2Ik)
Persamaan iterasi Newton Raphson adalah
dengan :
u = ( u1, … , uk )T
W(β,U) = diagonal ( Wij) dengan Wij = )x()u,( ijij
Vektor d(β,U) dengan elemen u)))u,(r(E))u,(r(d ijcijcij
D(β,u) = diagonal ( Dij )
dengan Dij = ij
ij
d
u))u,(r(E))u,(r( ijcijc
ij
Selanjutnya
n
1i*jij
jij*
uxexp(1
)uxexp(1u
1
N
1s
)s()m()s()m(T)m()1m( X)u,(D)u,(WXN
1
N
1s
)s()m()s()m(T )u,(d)u,(WXN
1
ij
ij
ij
ij
ij'cijc
ij
p
p
r)r()r(
ANALISIS ROBUST DARI MODEL LINEAR...
44 Journal of Mathematic Teaching
sehingga
Selanjutnya
)r(rp2
1)r()p1(p ij
'cijijij
'cijij
y
ijuyijc
ij
ijc
ij
)y(f)r(u)r(E
y
ijuy
ij
ijcijuyijc
ij
)y(f)r()y(f)r(
u))u,(r(E)u,)(r( ijcijc
ij
u)r(rE)p1(pu)r(E ijcijijijijc
ij
ij
ij
ij dD
)p1(pp
r)r( ijij
ij
ij
ij'c
ijijijijij
'c rp
2
1)p1(p)r(
u)r(Ep2
1u)r(E)p1(pu)r(E ij
'cijij
'cijijijc
ij
Wahyuning Widiyastuti
45 Jurnal KONSTANTA _ Vol. 1 No. 1 Juli-Desember 2017
u)r(rE)p1(p ij'cijijij
Maka estimasi dari σ2 menjadi
7. Analisis Data Guide
Untuk mengevaluasi hasil dari maksimum likelihood robust,
studi simulasi kecil dilakukan dengan kehadiran dari outlier.
Bagaimanapun, obyek utama dari studi ini adalah untuk menggali
tampilan dari teknik robust dalam kasus dari outlier. Metode robust
diharapkan lebih efisien dari metode klasik ketika data
terkontaminasi dengan outlier. Estimasi klasik sering berpengaruh
besar oleh outlier semacam ini. Disini sangat penting untuk
diperhatikan bahwa dalam kasus model biner campuran, respon y
adalah biner, dan outlier dapat muncul hanya melalui nilai x.
))u,(r(E)u,)(r( ijc
ij
ijc
ij
u)r(rE)p1(pu)r(E))u,(r( ijcijijijijcijc
ij
u)r(E)p1(p)r(rp2
1)r()p1(p ij
'cijijij
'cijijij
'cijij
u)r(rE)p1(pu)r(rEp2
1ij
'cijijijij
'cijij
u)r(rE)r(rp2
1)u)r((E)r()p1(p ij
'cijij
'cijijij
'cij
'cijij
N
1s
)s(T)s()1m(2 uuk
1
N
1
ANALISIS ROBUST DARI MODEL LINEAR...
46 Journal of Mathematic Teaching
Diselidiki juga keberadaan daerah gambaran dari estimasi,
seperti yang diperoleh maksimum likelihood robust, yang memadai
untuk memperbolehkan teori normal prosedur inferensi dalam
sampel dari ukuran yang cukup. Hasil dari teorema memberikan
jawaban asimtotis untuk pertanyaan ini, tetapi dibawah kondisi
campuran yang sulit diverifikasi secara empiris. Jadi untuk
menyelidiki jika kedatangan dari normalitas adalah cukup sederhana
seperti dampak merugikan teori normal inferensi parametrik.
Digunakan interval z untuk menemukan interval konfidensi baik β.
Disini maksimum likelihood robust memberikan alasan cakupan baik
dalam campuran biner maupun poisson. Maksimum likelihood
robust juga menampilkan hasil lebih baik dari metode klasik.
Preisser dan Qaqish (1999) menganalisa himpunan data yang
menarik dari GUIDE ( Guidelines of Urinary Incontenance Discussion
and Evaluation) studi. Tujuan dari studi ini adalah untuk
mengidentifikasi faktor diantara keterbatasan urin laki-laki dan
perempuan dari umur 76 ke atas diperkirakan respon mereka
dengan pertanyaan apakah suatu individu dalam kelompok umur
tersebut menganggap adanya ketergangguan dari masalah urine
dalam aktivitas sehari-hari atau mengganggu mereka dalam hal lain.
Dalam studi ini, 137 pasien dari 38 praktek medis diselidiki. Respon
variable biner yij = 1 jika pasien ke j dari praktek medis i
“terganggu/bothered” oleh pengeluaran urine mereka, dan 0 jika
mereka tidak terganggu. Prediktornya antara lain “gender” yaitu laki-
laki atau perempuan, “umur/age” menunjukkan umur 76 tahun ke
atas, “weekacc” berarti berapa banyak urine yang dikeluarkan pasien
dalam rata-rata minggu, “severe” mempunyai kategori 1 jika hanya
menciptakan kelembaban ketika pasien mengeluarkan urine,
kategori 2 jika ini menyebabkan kebasahan pada pakaian dalam
mereka, kategori 3 jika menetes sampai μpaha, kategori 4 jika ketika
mengeluarkan urine sangat banyak sampai menyebabkan lantai
menjadi basah, dan predictor “toilet/kamar kecil” menunjukkan
berapa sering selama sehari pasien biasa ke kamar kecil untuk
mengeluarkan urine.
Wahyuning Widiyastuti
47 Jurnal KONSTANTA _ Vol. 1 No. 1 Juli-Desember 2017
Maka modelnya μij = E(Yij) dengan predictor umur =
10
)76ahunumurdalamt( , acc per hari =
7
gguminaccper,
“severe/berapa parah keluaran urine pasien”, “toilet/kamar kecil”
dan variable indicator gender.
Dengan menganalisis data GUIDE menggunakan model dengan
independent besyarat dan mean bersyarat untuk pasie ke j dari
praktek medis ke i terspesifikasi oleh logit (μij) = iTij uX , efek acak
εi diasumsikan i.i.d N ( 0 , σ2 )
Dengan hipotesis
Ho : σ2 = 0
H1 : σ2 > 0
Tingkat signifikansi α = 0,05
Kita dapatkan bahwa dari maksimum likelihood robust
diperoleh hasil yang lebih mewakili daripada maksimum likelihood.
Tidak seperti estimasi Maksimum Likelihood Robust, estimasi
Maksimum Likelihood tampak terpengaruh oleh beberapa
pengamatan dasar dalam data. Prediktor berat dan acc per hari
ditemukan signifikan secara tinggi baik oleh Maksimum Likelihood
dan Maksimum Likelihood Robust. Tetapi predictor perempuan dan
kamar kecil signifikan hanya oleh metode Robust Maksimum
Likelihood. Adanya outlier memberikan efek harga parameter β
menjadi lebih kecil, sehingga nilai x tidak begitu berpengaruh
terhadap y.
Berikut ini perbandingan estimasi parameter dengan
menggunakan estimasi Robust Maksimum Likelihood dan Maksimum
Likelihood
ANALISIS ROBUST DARI MODEL LINEAR...
48 Journal of Mathematic Teaching
Tabel 1 : Nilai estimasi parameter
Parameter RML MLE
Intercept -3,0553 -3,2930
Female -0,7753 -0,6723
Age -0,9756 -0,6406
Dayacc 0,4918 0,4154
Severe 0,8128 0,8285
Toilet 0,1078 0,1108
σ2 1,7305 1,2179
Berikut adalah hasil selengkapnya iterasi dari perhitungan estimasi
robust maksimum likelihood
Tabel 2 : Hasil iterasi
Iterasi Intercept Female Age Dayacc Severe Toilet
1 1,0058 -1,6459 76 2,3315 1,8124 1,1078
2 -2,5691 -0,7783 76 1,3901 1,2171 1,0003
3 -3,0568 -0,7556 76 0,7928 0,8129 0,9878
4 -3,0557 -0,7592 77 0,5918 0,8024 0,6062
5 -3,0553 -0,7453 77 0,5116 0,7072 0,4478
8. Penutup
Dari pembahasan dapat diambil kesimpulan mengenai
analisis robust dari model linear campuran tergeneralisir
mengindikasikan tujuan maksimum likelihood robust yaitu berguna
untuk mengestimasi parameter model linear campuran tergeneralisir
dengan menurunkan bobot pengamatan yang berpengaruh dalam
data. Outlier umum dalam data dan analisis robust sering dipinjam
untuk menghadapi outlier ini. Hasil simulasi menguatkan
kemampuan dari maksimum likelihood robust untuk mewakili
pendekatan inferensi yang benar pada koefisien regresi dalam model
linear campuran tergeneralisir. Sanjoy Sinha telah mengembangkan
riset dengan menggunakan maksimum likelihood robust untuk studi
simulasi.
Wahyuning Widiyastuti
49 Jurnal KONSTANTA _ Vol. 1 No. 1 Juli-Desember 2017
Didapatkan bentuk estimasi maksimum likelihood robust
untuk parameter β dan Σ dari model linear campuran tergeneralisir
dengan menggunakan iterasi adalah sebagai berikut :
Adaya outlier memberikan efek harga parameter β menjadi
lebih kecil, sehingga nilai x tidak begitu berpengaruh terhadap y.
Cara diatas tidak mendorong untuk menghilangkan outlier, disini
hanya menyajikan suatu analisis yang robust dalam model linear
campuran tergeneralisir. Jika ditemukan outlier, hendaknya
meninjau kembali pada data yang diperolehnya, untuk dapat
menjelaskan dari mana outlier berasal dan mungkin mengoreksi data
yang menyebabkan sumber outliernya, kemudian meneruskan untuk
mengambil keputusan selanjutnya.
Metode ini dapat dikembangkan lebih lanjut. Baik sebagai
perluasan dari metode robust maksimum likelihood, maupun sebagai
metode pembanding yang lebih baik. Pengembangan model ini
adalah model dengan variabel respon tidak hanya yang termasuk
dalam keluarga eksponensial, tetapi variable respon yang tidak
diketahui distribusinya.
1)m()m(T)m()1m( yXU,DU,WXE
yU,d)U,(WXE )m()m(T
N
1s
)s(u
)1m( )u(flnN
1
ANALISIS ROBUST DARI MODEL LINEAR...
50 Journal of Mathematic Teaching
Daftar Pustaka
Bain, L.J. and Englehardt, M. 1992. Introduction To Probability and
Mathematical Statistics. Duxbury Press, California
Cantoni, E., and Rochetti, E. 2001, Robust Inference for Generalized
Linear Models, Journal of the American Statistical Association,
96, 1022-1030
Dudewicz, E. J and Mishra, S.N. 1995. Statistika Matematika Modern.
Terjemahan. R. K Sembiring. Penerbit ITB Bandung
McCullagh, P. and Nelder, J. A. 1989, Generalized Linear Models, 2nd
edn, London. Chapman and Hall