pengujian vektor rataan-part1
Post on 02-Feb-2016
229 Views
Preview:
TRANSCRIPT
Pengujian Hipotesis tentang Vektor Rata-rata (Part 1)Nusar HajarismanDepartment of Statistics, Universitas Islam Bandung
Pendahuluan
¨ Pengujian hipotesis dalam konteks multivariat lebih kompleks daripada dalam konteks univariat.
¨ Begitu banyak parameter yang terlibat untuk dianalisis. ¨ Misalnya, untuk distribusi normal dengan p-variat akan
mempunyai p buah rata-rata, p varians, dan C(p, 2) kovarians, dimana besaran C(p, 2) menunjukkan banyaknya pasangan diantara p buah variabel.
¨ Dengan demikian banyaknya parameter yang terlibat adalah sebanyak
Pendahuluan
¨ Banyaknya parameter yang terlibat dalam analisis multivariat adalah sebanyak
¨ Sebagai contoh, untuk p = 10, maka banyaknya parameter ada sebanyak 65 yang masing-masing parameter dapat dirumuskan hipotesisnya.
¨ Lebih jauh, peneliti biasanya tertarik dalam pengujian hipotesis mengenai subset dari parameter-parameter tersebut atau mengenai fungsi dari parameter tersebut.
)3(
21
2+=
++ pp
ppp
Pendahuluan
¨ Setidaknya ada empat alasan mengapa menggunakan pendekatan multivariat untuk pengujian hipotesis pada p buah variabel daripada secara univariat, yaitu:
¨ Pertama:
¨ Penggunaan uji univariat akan meningkatkan kekeliruan jenis I, α, sedangkan dalam uji multivariat tetap mempertahankan pada taraf sebesar α.
Pendahuluan
¨ Sebagai contoh, misalnya jika melakukan uji univariat sebanyak p = 10 secara terpisah pada taraf 0.05, maka peluang paling tidak melakukan kesalahan dalam menolak hipotesis nol akan lebih besar daripada 0.05.
¨ Apabila variabel-variabel tersebut saling bebas (yang pada kenyataannya jarang terjadi), maka kita akan mempunyai (di bawah H0):
¨ P(menolak H0) = 1 – P(seluruh pengujian menerima H0) ¨ = 1 – (0.95)10 = 0.40
Pendahuluan
¨ Taraf signifikansi sebesar 0.40 tentu saja merupakan tingkat kekeliruan yang tidak dapat diterima.
¨ Biasanya, untuk 10 buah variabel yang saling berkorelasi, maka taraf signifikansinya akan berada diantara 0.05 sampai dengan 0.40.
Pendahuluan
¨ Kedua:¤ Uji univariat sama sekali mengabaikan korelasi
diantara variabel yang diamati, sedangkan uji multivariat sudah mengakomodir secara langsung korelasinya.
¨ Ketiga:¤ Pada umumnya terjadinya penolakan hipotesis dalam
uji multivariat disebabkan oleh rata-rata yang terbentuk dari suatu kombinasi linear variabel daripada oleh suatu variabel yang berdiri sendiri.
Pendahuluan
¨ Keempat:¤ Uji multivariat lebih kuasa dalam banyak kasus. Kuasa uji
adalah peluang menolak H0 pada saat H0 itu adalah benar.
¤ Dalam beberapa kasus, seluruh p variabel dari uji univariat seringkali gagal mencapai tingkat signifikansinya, tetapi dalam uji multivariat adalah signifikan dikarenakan oleh efek yang kecil pada beberapa variabel secara bersama-sama memberikan kontribusi pada terjadinya penolakan H0.
¤ Untuk ukuran sampel tertentu terdapat beberapa keterbatasan pada banyaknya variabel dapat ditangani oleh uji multivariat tanpa kehilangan kuasa ujinya.
Pengujian Satu Vektor Rata-rata
¨ Matriks Kovarians Σ Diketahui (Kasus Univariat)¨ Hipotesis yang akan diuji adalah rata-rata y sama
dengan suatu nilai tertentu, katakan saja µ0, melawan alternatif bahwa rata-rata y tidak sama dengan µ0:
¨ Disini tidak akan dibahas hipotesis alternatif satu-arah karena tidak akan digunakan dalam kasus multivariat.
0 0 1 0: vs :H Hµ µ µ µ= ≠
Pengujian Satu Vektor Rata-rata
¨ Matriks Kovarians Σ Diketahui (Kasus Univariat)¨ Diasumsikan bahwa sampel acak dari n buah
observasi y1, y2, …, yn berasal dari populasi yang berdistribusi N(µ, σ2) dengan σ2 diketahui.
¨ Statistik Uji:
¨ yang berdistribusi N(0, 1) pada saat H0 benar
nyy
zy /
00
σ
µσ
µ −=
−=
Pengujian Satu Vektor Rata-rata
¨ Matriks Kovarians Σ Diketahui (Kasus Univariat)
¨ Untuk α = 0.05, hipotesis H0 akan ditolak jika |z| ≥1.96.
¨ Alternatifnya, kita dapat menggunakan statistik z2
yang akan berdistribusi χ2 dengan derajat bebas satu, dan hipotesis nol ditolak jika z2 ≥ (1.96)2 = 3.84.
¨ Pasa saat n besar, kita yakin melalui dalil limit pusat bahwa z akan mendekati distribusi normal, bahkan jika observasinya bukan berasal dari distribusi normal.
Pengujian Satu Vektor Rata-rata
¨ Dalam kasus multivariat kita akan mempunyai beberapa variabel yang diukur pada masing-masing unit sampling, kemudian akan dihipotesiskan suatu nilai untuk rata-rata dari setiap variabel, H0: µ = µ0 melawan H1: µ ≠ µ0. Lebih eksplisit lagi bentuk hipotesisnya menjadi
01 011 1
2 02 2 020 1
0 0
: :
p pp p
H H
µ µµ µµ µ µ µ
µ µµ µ
= ≠
M MM M
Pengujian Satu Vektor Rata-rata
¨ Dimana setiap µ0j dinyatakan berdasarkan pada pengalaman sebelumnya atau nilai yang ditargetkan.
¨ Kesamaan vektor dalam H0 mempunyai makna µj = µ0j untuk seluruh j = 1, 2, …, p.
¨ Ketidaksamaan vektor dalam H1 mempunyai makna bahwa paling tidak terdapat satu µj ≠ µ0j.
¨ Jadi, misalnya jika µj = µ0j untuk seluruh j kecuali j= 2, dimana µ2 ≠ µ02, maka hipotesis nol akan ditolak.
Pengujian Satu Vektor Rata-rata
¨ Untuk menguji H0, kita akan menggunakan sampel acak dari n vektor observasi y1, y2, …, yn yang berasal dari Np(µ, Σ), dimana Σ diketahui, serta menghitung vektor rata-rata, maka statistik ujinya adalah:
¨ Jika H0 benar, maka Z2 akan berdistribusi χ2, dengan demikian hipotesis nol akan ditolak jika
¨ Z2 >
)()'( 01
02 µµ −Σ−= − yynZ
2, pαχ
Pengujian Satu Vektor Rata-rata
¨ Jika Σ tidak diketahui, kita dalam menggunakan Sdan menggantikannya ke dalam (5.2), serta Z2
akan mengikuti pendekatan distribusi chi-kuadrat. ¨ Tetapi menurut Rencher (2002), ukuran sampel n
akan lebih besar daripada yang ada dalam situasi univariat, dimana
( ) ( )0 / / (0,1)t y s n Nµ= − :
Contoh 5.1:
¨ Data yang disajikan pada Tabel 3.1 adalah data tentang tinggi dan berat badan dari 20 siswa laki-laki.
¨ Misalkan diasumsikan bahwa sampel tersebut berasal dari populasi bivariat normal N2(µ, Σ), dimana:
=Σ
100010010020
Contoh 5.1:
¨ Misalkan akan diuji suatu hipotesis H0: µ = (70, 170)`
¨ Dari hasil perhitungan diperoleh informasi
1 71.45y = 2 164.7y =
( ) ( )2 10 0
' 1
'
71.45 70 20 100 71.45 70(20)
164.7 170 100 1000 164.7 170
0.1 0.01 1.45(20) (1.45 5.3) 8.4026
0.01 0.002 5.3
Z n y y−
−
= − −
− − = − −
− = − = − −
μ Σ μ
Contoh 5.1:
¨ Dengan menggunakan α =0.05, maka diketahui:
¨ Hipotesis H0: µ = (70, 170)` ditolak sebab Z2 = 8.4026 > 5.99
¨ Daerah penolakan untuk adalah berada dalam atau diluar ellips sebagaimana yang ditunjukkan dalam Gambar 5.1
¨ artinya statistik uji Z2 adalah lebih besar daripada 5.99 jika dan hanya jika berada diluar ellips
20.05;2 5.99χ =
( )1 2, `y y=y
( )1 2, `y y=y
Contoh 5.1:
¨ Jika berada dalam wilayah ellips, maka H0 diterima.
¨ Jadi jarak dari µ0 harus diperhitungkan dalam proses pengujian hipotesis.
¨ Apabila jarak tersebut dibakukan oleh Σ-1, maka seluruh titik-titik pada kurva secara statistik berjarak sama dari titik pusatnya.
( )1 2, `y y=y
Gambar 5.1
Contoh 5.1:
¨ Perlu dicatat bahwa pengujian ini sensitif terhadap struktur kovarians.
¨ Apabila cov(y1, y2) adalah negatif, maka y2cenderung akan naik pada saat y1 menurun, sehingga ellips akan mempunyai tingkat kemiringan dalam arah yang berbeda.
¨ Dalam hal seperti ini, akan berada dalam daerah penerimaan.
( )1 2, `y y=y
Contoh 5.1:
¨ Selanjutnya akan diselidiki uji lanjutan pada masing-masing variabel secara terpisah.
¨ Dengan menggunakan zα/2 = 1.96 untuk α = 0.05, diperoleh
96.17495.0/
96.1450.1/
21
0222
1
0111
−>−=−
=
<=−
=
nyz
ny
z
σ
µ
σ
µ
Contoh 5.1:
¨ Jadi dalam hal ini kedua pengujian menghasilkan penerimaan hipotesis.
¨ Dalam hal ini kedua rata-rata untuk y1 dan y2 cukup jauh dari suatu nilai yang dihipotesiskan yang menyebabkan terjadi penolakan pada hipotesis nol.
¨ Akan tetapi pada saat terdapat korelasi positif antara y1dan y2 yang diperhitungkan ke dalam uji multivariat, maka terjadilah penolakan terhadap hipotesis nol.
¨ Hasil ini mengilustrasikan kelebihan dari uji multivariat dibandingkan dengan hasil-hasil dari uji univariat.
Contoh 5.1:
¨ Gambar 5.2 menunjukkan daerah penerimaan segiempat untuk uji univariat yang disatukan dengan daerah penerimaan ellips untuk uji multivariat.
¨ Segiempat ini diperoleh dengan cara menghitung dua buah daerah penerimaan:
1 1
01 1 01
2 202 2 02
1.96 1.96
1.96 1.96
yn n
yn n
σ σµ µ
σ σµ µ
− < < +
− < < +
Gambar 5.2
Contoh 5.1:
¨ Titik-titik di dalam ellips tetapi berada di luar segiempat akan ditolak paling tidak dalam satu dimensi univariat tetapi akan diterima secara multivariat.
¨ Hal ini mengilustrasikan adanya peningkatan dalam α sebagai hasil dari uji univariat.
¨ Titik-titik di luar ellips tetapi berada dalam segiempat akan ditolak secara multivariat tetapi diterima dalam uji univariat.
Contoh 5.1:
¨ Jadi dalam kedua kasus yang ditunjukkan dalam wilayah yang diarsir, kita seharusnya menggunakan hasil-hasil yang diberikan dalam uji multivariat.
¨ Dalam satu kasus, uji multivariat lebih kuasa dibandingkan dengan uji univariat, dalam kasus yang lain uji multivariat memberikan nilai α yang eksak dibandingkan nilai α yang meningkat dalam uji univariat.
Kasus varians Σ tidak diketahui
¨ Pada bagian sebelumnya telah disinggung sedikit mengenai sifat-sifat pengujian hipotesis, sebab pengujian tersebut diterapkan dengan asumsi bahwa Σ diketahui.
¨ Pembahasan mengenai pengujian untuk satu-sampel penting untuk dibahas karena dapat dijadikan dasar untuk lebih memahami kasus dua-sampel yang memang sering diterapkan.
¨ Menurut Rencher (2002) ada dua alasan mengapa kasus satu-sampel penting untuk dibahas, yaitu:
Kasus varians Σ tidak diketahui
¨ Banyak sekali konsep-konsep dasar akan lebih mudah diilustrasikan dalam kerangka kerja satu-sampel dibandingkan dalam kasus dua-sampel.
¨ Beberapa pengujian yang sangat bermanfaat dapat dituangkan dalam kerangka kerja satu-sampel. Misalnya nanti akan diterapkan pada pengujian data berapasangan (dibahas pada bab ini juga), serta dalam rancangan pengukuran berulang dan analisis profil yang dibahas pada Bab 6.
Kasus varians Σ tidak diketahui (Univariat)¨ Pertama-tama kita lihat kembali uji-t pada satu-
sampel dalam kasus univariat, dengan hanya satu variabel yang diukur pada setiap unit sampling.
¨ Diasumsikan bahwa sampel acak y1, y2, …, ynberasal dari distribusi N(µ, σ2).
¨ Akan ditaksir µ oleh dan σ2 oleh s2. ¨ Untuk menguji hipotesis H0: µ = µ0 melawan H1: µ ≠
µ0, akan menggunakan statistik uji:
y
( )00
/n yyt
ss nµµ −−
= =
Kasus varians Σ tidak diketahui (Univariat)¨ Jika H0 benar, maka t akan berdistribusi tn – 1,
dimana n – 1 adalah derajat bebasnya. ¨ Hipotesis nol akan ditolak jika |t| ≥ tα/2,n–1, dimana
tα/2,n–1 adl nilai kritis yang diperoleh dari tabel-t.¨ merupakan bentuk karakteristik
dari statistik-t, yang menunjukkan suatu jarak sampel yang dibakukan antara dengan µ0.
¨ Dalam bentuk seperti ini, rata-rata yang dihipotesiskan dikurangi oleh , dan selisihnya itu kemudian dibagi oleh
( )0 /t y s nµ= −
y
y /ys s n=
Kasus varians Σ tidak diketahui (Univariat)¨ Oleh karena y1, y2, …, yn merupakan sampel acak
dari N(µ, σ2), maka variabel acak dan s adalah saling bebas.
¨ Selanjutnya bentuk karakteristik ini akan analog dengan statistik-T2 dalam kasus multivariat.
y
Kasus varians Σ tidak diketahui (Multivariat)¨ Sekarang pembahasan dilanjutkan pada kasus
multivariat dimana p buah variabel diukur pada masing-masing unit sampling.
¨ Diasumsikan bahwa sampel acak y1, y2, …, ynberasal dari Np(µ, Σ), dimana yi berisi ppengukuran pada unit sampling ke-i.
¨ Vektor rata-rata µ akan ditaksir oleh dan matriks kovarians Σ oleh S. Untuk menguji hipotesis H0: µ = µ0 melawan H1: µ ≠ µ0, akan digunakan perluasan dari statistik-t univariat.
Kasus varians Σ tidak diketahui (Multivariat)¨ Dalam bentuk kuadrat, statistik-t univariat dapat
ditulis kembali sebagai
¨ Pada saat dan s2 digantikan oleh dan S, maka akan diperoleh statistik uji
¨ Alternatifnya, T2 dapat diperoleh melalui Z2
dengan cara menggantikan Σ oleh S.
( ) ( ) ( )2
02 2 10 02 ( )
n yt n y s y
sµ
µ µ−−= = − −
( )0y µ− ( )0−y μ
( ) ( )2 10 0( )T n −= − −y μ S y μ
Kasus varians Σ tidak diketahui (Multivariat)¨ Distribusi dari T2 ditemukan oleh Hotelling pada
tahun 1931 dengan mengasumsikan bahwa H0benar dan samplingnya adalah Np(µ, Σ).
¨ Distribusi ini mempunyai indeks dua buah parameter, yaitu p dimensi dan derajat bebas v = n – 1. Hipotesis nol ditolak jika T2 > .
¨ Apabila sampel berukuran besar dan hipotesis nol diterima, maka kita cukup mempunyai keyakinan bahwa nilai µ yang sebenarnya mendekati suatu nilai µ0 yang dihipotesiskan.
2, , 1p nTα −
Kasus varians Σ tidak diketahui (Multivariat)¨ Statistik-T2 dapat dipandang sebagai jarak sampel
dibakukan antara vektor rata-rata observasi dengan vektor rata-rata yang dihipotesiskan.
¨ Apabila vektor rata-rata sampel mempunyai jarak yang cukup jauh dengan vektor rata-rata yang dihipotesiskan, maka akan terjadi penolakan terhadap H0.
¨ Densitas dari T2 adalah miring sebab batas bawahnya adalah nol dan tidak mempunyai batas atas.
Kasus varians Σ tidak diketahui (Multivariat)¨ Statistik uji merupakan besaran skalar, karena
¨ merupakan bentuk kuadratik.¨ Bentuk karakteristik dari statistik-T2 adalah
( ) ( )
12
0 0Tn
− = − −
Sy μ y μ
( ) ( )2 10 0( )T n −= − −y μ S y μ
Kasus varians Σ tidak diketahui (Multivariat)¨ Bentuk karakteristik ini mempunyai dua sifat
penting, yaitu:¨ S/n adalah matriks kovarians sampel dari dan
dianggap sebagai matriks dibakukan dalam suatu fungsi jarak.
¨ Oleh karena y1, y2, …, yn adalah bersitribusi Np(µ, Σ), maka akan berdistribusi , (n – 1)Sakan berdistribusi W(n – 1, Σ), serta dan S adalah saling bebas.
y
( )1,p nN μ Σ y
Kasus varians Σ tidak diketahui (Multivariat)¨ Beberapa sifat tambahan statistik-T2 :¨ Kita harus mempunyai n – 1 > p. Jika tidak, maka S
akan singular dan statistik-T2 tidak dapat dihitung.¨ Dalam kasus satu-sampel maupun dua-sampel,
derajat bebas untuk statistik-T2 akan sama dengan uji-t univariat, yaitu v = n – 1 untuk kasus satu-sampel, serta v = n1 + n2 – 2 untuk kasus dua-sampel.
Kasus varians Σ tidak diketahui (Multivariat)¨ Hipotesis alternatif H1 adalah dua-pihak. ¨ Oleh karena statistik-T2 bekerja dalam ruang
multidimensi, maka di sini tidak akan dipertimbangkan hipotesis alternatif satu-pihak.
¨ Walaupun hipotesis alternatif H1: µ ≠ µ0 pada dasarnya merupakan uji dua-pihak, namun demikian daerah kritisnya adalah satu-pihak
¨ Artinya hipotesis nol akan ditolak pada saat diperoleh T2 yang relatif besar
Kasus varians Σ tidak diketahui (Multivariat)¨ Dalam kasus univariat, . Statistik-T2 juga dapat
dikonversikan ke dalam statistik-F sebagai berikut:
¨ Perlu dicatat bahwa p dimensi (banyaknya variabel) dari statistik-T2 akan menjadi parameter derajat bebas pertama dari statistik-F.
¨ Banyaknya derajat bebas dari T2 dinyatakan dengan v, dan transformasi F diberikan dalam bentuk umum v, karena aplikasi dari T2 lainnya akan mempunyai v yang berbeda dengan n – 1.
21 1, 1n nt F− −=
1,
2,
1+−=
+−pvpvp FT
vppv
Kasus varians Σ tidak diketahui (Multivariat)¨ Jika hasil pengujian membawa kepada penolakan
terhadap H0: µ = µ0, maka pertanyaan selanjutnya yang akan muncul adalah variabel mana yang memberikan kontribusi penting terhadap terjadinya penolakan H0 tersebut.
¨ Masalah ini dapat ditangani dengan membentuk selang kepercayaan simultan yang didasarkan pada statistik Hotelling-T2 (interval T2) untuk sampel acak y1, y2, …, yn yang berasal dari populasi Np(µ, Σ) yang didefiniskan oleh
Kasus varians Σ tidak diketahui (Multivariat)
11
1 1 ,
222 2 ,
,
( 1): ( )( )
( 1): ( )( )
( 1): ( )( )
p n p
p n p
ppp p p n p
sp ny Fn p n
sp ny Fn p n
sp ny Fn p n
µ α
µ α
µ α
−
−
−
−±
−
−±
−
−±
−
M
Contoh 5.2:
¨ Dalam Tabel 3.3, diketahui bahwa n = 10 observasi dan p = 3 variabel. Nilai rata-rata yang dihipotesiskan untuk variabel y1 = 15.0, y2 = 6.0, dan y3 = 2.85, sehingga hipotesis nolnya dapat dinyatakan sebagai:
=
85.20.60.15
:0 µH
Contoh 5.2:
¨ Dari hasil perhitungan diperoleh informasi untuk dan S sebagai berikut:
y
28.17.18 ,3.09
140.54 49.68 1.9449.68 72.25 3.68
1.94 3.68 0.25
=
=
y
S
Contoh 5.2:
¨ Untuk menguji hipotesis H0 akan digunakan statistik-T2 sebagai berikut:
¨ Dari Tabel A7, diperoleh nilai kritis Oleh karena T2 = 24.559 > , maka hipotesis nol di atas adalah ditolak.
( ) ( )2 10 0
/ 128.1 15.0 140.54 49.68 1.94 28.1 15.010 7.18 6.0 49.68 72.25 3.68 7.18 6.0
3.09 2.85 1.94 3.68 0.25 3.09 2.8524.559
T n −
−
= − −
− − = − − − −
=
y μ S y μ
20.05,3,9 16.766T =
20.05,3,9 16.766T =
Contoh 5.2:
11
1 1 ,( 1) 140.5444: ( ) 28.100 16.766
( ) 10
(23.2457; 32.9542)
p n psp ny F
n p nµ α−
−± = ±
−
=
22
2 2 ,( 1) 72.2484: ( ) 7.180 16.766
( ) 10
(3.6996;10.6604)
p n psp ny F
n p nµ α−
−± = ±
−
=
33
3 3 ,( 1) 0.2501: ( ) 3.089 16.766
( ) 10
(2.8842; 3.2938)
p n psp ny F
n p nµ α−
−± = ±
−
=
Contoh 5.2:
¨ Dari hasil di atas terlihat bahwa selang kepercayaan simultanuntuk µ1, µ2, dan µ3 semuanya tidak mencakup nilai nol.
¨ Akan tetapi tidak semua selang kepercayaan tersebutmencakup nilai yang rata-rata yang dihipotesiskan.
¨ Sebagai contoh, misalnya untuk variabel y1, terlihat bahwabatas bawah dan batas atasnya masing-masing adalah23.2457 dan 32.9542,
¨ Sementara nilai rata-rata yang dihipotesiskan untuk y1 adalah15.000, begitu juga untuk variabel y3.
¨ Sedangkan untuk variabel y2, selang kepercayaan yang terbentuk mencakup nilai dari rata-rata yang dihipotesiskan.
Perbandingan 2 Vektor Rataan (Univariat)¨ →
¨ →¨ Diasumsikan bahwa kedua sampel itu saling bebas
dan memenuhi syarat bahwa , dimana σ2 tidak diketahui.
¨ Asumsi mengenai independensi dan bervarians sama sangat diperlukan agar statistik-t dalam Persamaan (5.8) akan mengikuti distribusi-t.
111 12 1, ,..., ny y y ( )2
1 1,N µ σ
121 22 2, ,..., ny y y ( )2
2 2,N µ σ
2 2 21 2σ σ σ= =
Perbandingan 2 Vektor Rataan (Univariat)¨ Dari kedua sampel tersebut akan dihitung
beberapa besaran yang diperlukan, yaitu dan 1y
2y
( ) ( )1 2 21 1 1 1 11
SS 1nii
y y n s=
= − = −∑
( ) ( )2 2 22 2 2 2 21
SS 1nii
y y n s=
= − = −∑
2 22 1 2 1 1 2 2gab
1 2 1 2
SS SS ( 1) ( 1)2 2
n s n ssn n n n
+ − + −= =
+ − + −
Perbandingan 2 Vektor Rataan (Univariat)¨ Diketahui bahwa¨ Untuk menguji hipotesis bahwa H0: µ1 = µ2 vs H1: µ1
≠ µ2, maka akan digunakan statistik uji
¨ yang akan mengikuti distribusi-t dengan derajat bebas n1 + n2 – 2 pada saat H0 benar.
¨ H0 akan ditolak pada saat
( )2 2gabE s σ=
1 2
1 2
1 1gab
y yts
n n
−=
+
1 2/2, 2n nt tα + −≥
Perbandingan 2 Vektor Rataan (Multivariat)¨ →
¨ →
¨ Untuk kasus dimana p buah variabel diukur pada setiap unit sampling dalam dua sampel. Disini akan diuji suatu hipotesis
111 12 1, , ..., ny y y
121 22 2, , ..., ny y y
( )1 1,pN μ Σ
( )2 2,pN μ Σ
0 1 2 1 1 2: melawan :H H= ≠μ μ μ μ
Perbandingan 2 Vektor Rataan (Multivariat)¨ Diasumsikan bahwa kedua sampel itu saling bebas
dan memenuhi syarat bahwa ,
¨ dimana Σ tidak diketahui. ¨ Asumsi mengenai independensi dan bervarians
sama sangat diperlukan agar statistik-T2 dalam Persamaan (5.9) akan mengikuti distribusi-T2.
1 2= =Σ Σ Σ
Perbandingan 2 Vektor Rataan (Multivariat)¨ Vektor rata-rata sampel 1:
¨ Vektor rata-rata sampel 2:
¨ Matriks jumlah kuadrat dan perkalian silang untuk kedua sampel
1
1 1 11/n
iin
==∑y y
2
2 2 21/n
iin
==∑y y
( )( ) ( )
1
1 1 1 1 1 1 11
' 1n
i ii
n=
= − − = −∑W y y y y S
( )( ) ( )
2
2 2 2 2 2 2 21
' 1n
i ii
n=
= − − = −∑W y y y y S
Perbandingan 2 Vektor Rataan (Multivariat)¨ Oleh karena (n1 – 1)S1 merupakan penaksir takbias
bagi (n1 – 1)Σ1 dan (n2 – 1)S2 merupakan penaksir takbias bagi (n2 – 1)Σ2, maka kita dapat menggabungkannya untuk memperoleh penaksir takbias bagi matriks kovarians populasi Σ, yaitu
( )gab 1 2
1 2
1 1 2 21 2
12
1 [ ( 1) ( 1) ]2
n n
n nn n
= ++ −
= − + −+ −
S W W
S S
Perbandingan 2 Vektor Rataan (Multivariat)¨ Jadi E(Sgab) = Σ. Kuadrat dari statistik-t univariat
dalam (5.8) dapat dinyatakan sebagai
¨ Bentuk di atas dapat diperluas pada p buah variabel dengan mensubstitusikan
¨ ke ¨ Sgab ke
( ) ( ) ( )12 21 2
1 2 1 21 2
gabn nt y y s y y
n n−
= − −+
( )1 2−y y ( )1 2y y− 2
gabs
Perbandingan 2 Vektor Rataan (Multivariat)¨ Sehingga diperoleh
¨ yang akan mengikuti distribusi pada saat H0 benar. Untuk dapat melakukan pengujian hipotesis ini, langkah-langkahnya adalah kumpulkan data untuk dua sampel, hitung statistik-T2 dalam (5.9), kemudian tolak hipotesis H0 jika
( ) ( )2 11 2
1 2 gab 1 21 2
'n nT Sn n
−= − −+
y y y y
1 2
2, 2p n nT + −
1 2
2 2, , 2p n nT Tα + −≥
Perbandingan 2 Vektor Rataan (Multivariat)¨ Statistik-T2 dalam (5.9) dapat dinyatakan dalam
bentuk karakteristik sebagai jarak dibakukan antara dan :
¨ dimana (1/n1 + 1/n2)Sgab adalah matriks kovarians sampel untuk dan Sgab adalah saling bebas dengan sebab sampling berasal dari populasi normal multivariat
1y
2y
( ) ( )1
21 2 gab 1 2
1 2
1 1'Tn n
−
= − + −
y y S y y
( )1 2−y y ( )1 2−y y
Perbandingan 2 Vektor Rataan (Multivariat)¨ Berikut ini adalah beberapa sifat penting
dari statistik-T2:¨ Diperlukan syarat bahwa n1 + n2 – 2 > p supaya
Sgab bersifat nonsingular.¨ Pada saat T2 besar maka hasil pengujian
cenderung akan mendukung H1, sedangkan untuk nilai T2 kecil akan memberikan hasil pengujian yang cenderung mendukung H0.
Perbandingan 2 Vektor Rataan (Multivariat)¨ Oleh karena batas bawah dari T2 adalah nol dan
tidak mempunyai batas atas, maka densitas dari T2
adalah miring. Dalam kenyataannya memang T2
dapat dihubungkan secara langsung ke statistik-Fyang juga berdistribusi miring.
¨ Derajat bebas untuk T2 adalah n1 + n2 – 2 yang berarti sama dengan derajat bebas untuk statistik-tunivariat.
Perbandingan 2 Vektor Rataan (Multivariat)¨ Hipotesis alternatif merupakan uji dua-
pihak. Akan tetapi daerah kritisnya adalah yang merupakan uji satu-pihak.
¨ Statistik-T2 dapat ditransformasikan ke statistik-Fdengan menggunakan Persamaan (5.7):
¨ dimana p dimensi dari statistik-T2 menjadi parameter derajat bebas pertama untuk statistik-F.
1 1 2:H ≠μ μ
1,
2
21
2121)2(
1−−+=
−+−−+
pnnpFTpnn
pnn
Perbandingan 2 Vektor Rataan (Multivariat)¨ Dimungkinkan untuk membentuk selang
kepercayaan simultan untuk komponen-komponen di dalam vektor µ1 – µ2.
¨ Selang kepercayaan ini dibentuk dengan cara mempertimbangkan seluruh kombinasi linear yang mungkin dari selisih dalam vektor rata-rata. Diasumsikan bahwa data berasal dari populasi yang berdistribusi normal multivariat dan matriks kovarians Σ sama.
Perbandingan 2 Vektor Rataan (Multivariat)¨ Untuk membentuk 100(1 – α)% selang
kepercayaan ini, misalkan diketahui bahwa
¨ Kemudian, dengan peluang sebesar 1 – α maka seleng kepercayaannya menjadi:
( ) ( )1 2
21 2 1 2 , , 12 / 1 p n n pc n n p n n p Fα + − −= + − + − −
( )1 2
1 2
1 1` ` gabcn n
− ± +
a y y a S a
Perbandingan 2 Vektor Rataan (Multivariat)¨ Secara khusus, selang kepercayaan untuk µ1i – µ2i
akan diberikan oleh
¨ Selain itu, dapat juga dibentuk selang kepercayaan 100(1 – α)% Bonferonni untuk selisih rata-rata dari p buah populasi yang diberikan oleh
( )1 2
1 2
1 1iii i gaby y c
n n
− ± +
S
( )
1 21 2 1 2 2 gab1 2
1 1:2 iii i i i n nx x t s
p n nα
µ µ + −
− − ± +
Contoh 5.3:
¨ Empat jenis uji psikolgi diberikan pada 32 laki-laki dan 32 wanita. Hasil pengujian tersebut disajikan pada Tabel 5.1. Empat buah variabel yang diamati itu adalah
¨ y1 = pictorial inconsistencies; ¨ y2 = tool recognition; ¨ y3 = paper form board; serta ¨ y4 = vocabulary.
Contoh 5.3:
¨ Vektor rata-rata untuk sampel 1 dan 2:
¨ Matriks varians-kovarians untuk sampel 1 dan 2:
1
15.9715.9127.1922.75
=
y
2
12.3413.9116.6621.94
=
y
1
5.192 4.545 6.522 5.2504.545 13.18 6.760 6.2666.522 6.760 28.67 14.475.250 6.266 14.47 16.65
=
S
2
9.136 7.549 4.864 4.1517.549 18.60 10.22 5.4464.864 10.22 30.04 13.494.151 5.446 13.49 28.00
=
S
Contoh 5.3:
¨ Matriks varians-kovarians gabungan:
¨ Nilai statistik-T2:
[ ]gab 1 2
1 (32 1) (32 1)32 32 27.164 6.047 5.693 4.7016.047 15.89 8.492 5.8565.693 8.492 29.36 13.894.701 5.856 13.98 22.32
= − + −+ −
=
S S S
( ) ( )2 11 2
1 2 gab 1 21 2
' 97.6015n nT Sn n
−= − − =+
y y y y
Contoh 5.3:
¨ Melalui proses interpolasi dalam Tabel A7, diperoleh ,
¨ dengan demikian hipotesis ditolak.¨ 95% selang kepercayaan simultan µ1i – µ2i, untuk i
= 1, 2, 3, dan 4 yang dihitung melalui Persamaan (5.13). Hasilnya adalah
20.01,4,62 15.373T =
0 1 2:H =μ μ
( )11 21
1 2
11 21
1 1 1 13.625 10.6258 7.164332 32
1.4437 5.8062
iigaby y cn n
µ µ
− ± + = ± +
≤ − ≤
S
Contoh 5.3:
( )
2212 221 2
12 22
1 1 1 12.000 10.6258 15.894132 32
1.2489 5.2489
gaby y cn n
µ µ
− ± + = ± +
− ≤ − ≤
S
( )
3313 23 gab1 2
13 23
1 1 1 110.531 10.6258 29.356432 32
6.1158 14.9467
y y cn n
µ µ
− ± + = ± +
≤ − ≤
S
( )
4414 24 gab1 2
14 24
1 1 1 10.8125 10.6258 22.320632 32
3.0376 4.6626
y y cn n
µ µ
− ± + = ± +
− ≤ − ≤
S
Contoh 5.3:
¨ Dari keempat selang kepercayaan simultan yang terbentuk di atas, terlihat bahwa terdapat dua selang yang mencakup nilai nol, dan dua selang lainnya tidak mencakup nol.
¨ Selang kepercayaan simultan yang tidak mencakup nol adalah yang berhubungan dengan variabel y1dan y3,
¨ Selang kepercayaan yang mencakup nilai nol adl yg berhubungan dengan variabel y2 dan y4.
Contoh 5.3:
¨ Dengan demikian dapat dikatakan bahwa variabel y1 dan y3 merupakan variabel yang memberikan kontribusi terhadap terjadinya penolakan pada hipotesis nol.
¨ Variabel y2 dan y4 menunjukan bahwa secara rata-rata untuk kedua variabel tersebut pada kelompok laki-laki dan wanita adalah sama.
Uji Rasio Kemungkinan
¨ Pada bagian sebelumnya telah diperkenalkan statistik-T2 sebagai analogi dari jarak kuadrat univariat, t2.
¨ Ada prinsip-prinsip yang lebih umum untuk membentukprosedur pengujian yang disebut dengan metode rasiokemungkinan (likelihood ratio method, dimana statistik-T2 dapat diturunkan sebagai uji rasio kemungkinan dariH0: µ = µ0.
¨ Uji rasio kemungkinan mempunyai beberapa sifat yang optimum pada sampel berukuran besar, dan akan lebihtepat digunakan dengan asumsi bahwa data mengikutidistribusi normal multivariat.
Uji Rasio Kemungkinan
¨ Pendekatan kemungkinan maksimum banyak digunakan untuk proses penaksiran parameter.
¨ Fungsi kemungkinan adalah densitas gabungan dari y1, y2, …, yn.
¨ Nilai dari parameter yang memaksimumkan fungsi kemungkinan disebut sebagai penaksir kemungkinan maksimum yang diberikan oleh
( ) /2
/2, /2
1max ,ˆ(2 )
npnnp
L eπ
−=μ Σ
μ ΣΣ
Uji Rasio Kemungkinan
¨ Diketahui bahwa:
¨ adalah penaksir kemungkinan maksimum. Perludiketahui bahwa penaksir kemungkinan maksimumdan dipilih sedemikian rupa sehingga mampumenjelaskan dengan baik nilai pengamatan dari suatusampel acak.
( ) ( )
1
1ˆ `n
i iin =
= − −∑Σ y y y y
1
1ˆn
iin =
= = ∑μ y y
μ̂ Σ̂
Uji Rasio Kemungkinan
¨ Untuk kasus pengujian satu vektor rata-rata, dimana hipotesis yang akan diuji adalah H0: µ = µ0melawan H1: µ ≠ µ0.
¨ Di bawah H0: µ = µ0, maka fungsi kemungkinannya adalah
( ) ( ) ( )1
0 0 0/2 /21
1 1, exp `(2 ) | | 2
n
i inp ni
Lπ
−
=
= − −
∑μ Σ y μ Σ y μΣ
Uji Rasio Kemungkinan:
¨ Maksimum dari fungsi kemungkinan dalam persamaan di atas diberikan oleh:
¨ dimana:
( ) /2
0 /2, /20
1max ,ˆ(2 )
npnnp
L eπ
−=μ Σ
μ ΣΣ
( )( )0 0 0
1
1ˆ `n
i iin =
= − −∑Σ y μ y μ
Uji Rasio Kemungkinan:
¨ Kemudian akan dibandingkan maksimum dari L(µ0, Σ) dengan maksimum tak-terbatas L(µ, Σ).
¨ Perbandingan disebut juga sebagai statistik uji rasio kemungkinan (likelihood ratio tests) yang didefiniskan sebagai:
/2
,
ˆmax ( , )ˆmax ( , )
nL
Lµ
Σ
Σ
Λ = =
0
0
μ Σ Σ
μ Σ Σ
Uji Rasio Kemungkinan:
¨ Statistik yang ekivalen Λn/2 = disebut sebagai Wilks’ lambda.
¨ Apabila nilai pengamatan dari rasio kemungkinan ini terlalu kecil, maka hipotesis H0: µ = µ0 akan ditolak.
¨ Uji rasio kemungkinan H0: µ = µ0 melawan H0: µ ≠µ0 akan menolak jika:
ˆ ˆ0Σ Σ
( )( )
( )( )
/ 2
/2
1
1
`ˆ
ˆ`
nnn
i ii
n
i ii
Cα=
=
− −
Λ = = <
− −
∑
∑00 0
y y y yΣ
Σ y μ y μ
Uji Rasio Kemungkinan
¨ Statistik-T2 yang diberikan dalam Persamaan (5.9) dengan dengan uji rasio kemungkinan pada Persamaan(5.18) dapat dihubungkan melalui persamaan berikut:
¨ Sekali lagi, metode rasio kemungkinan dari suatupengujian hipotesis menggunakan rasio antara nilaimaksimum dari fungsi kemungkinan denganmengasumsikan bahwa H0 benar dengan maksimumdari fungsi kemungkinan di bawah H1.
122/ 1
( 1)n T
n
−
Λ = + −
Uji Rasio Kemungkinan:
¨ Uji rasio kemungkinan ini mempunyai kuasa uji yang baik, dan kadang-kadang mempunyai kuasa yang optimum dibandingkan dengan alternatif lainnya.
¨ Dengan cara yang sama, ketika diterapkan pada sampel normal multivariat dan untuk menguji hipotesis , maka pendekatan rasio kemungkinan akan membawa pada statistik-T2
Hotelling yang diberikan pada Persamaan (5.9).
0 1 2:H =μ μ
top related