pengujian vektor rataan-part1

Pengujian Hipotesis tentang Vektor Rata-rata (Part 1)Nusar HajarismanDepartment of Statistics, Universitas Islam Bandung

Pendahuluan

¨ Pengujian hipotesis dalam konteks multivariat lebih kompleks daripada dalam konteks univariat.

¨ Begitu banyak parameter yang terlibat untuk dianalisis. ¨ Misalnya, untuk distribusi normal dengan p-variat akan

mempunyai p buah rata-rata, p varians, dan C(p, 2) kovarians, dimana besaran C(p, 2) menunjukkan banyaknya pasangan diantara p buah variabel.

¨ Dengan demikian banyaknya parameter yang terlibat adalah sebanyak

Pendahuluan

¨ Banyaknya parameter yang terlibat dalam analisis multivariat adalah sebanyak

¨ Sebagai contoh, untuk p = 10, maka banyaknya parameter ada sebanyak 65 yang masing-masing parameter dapat dirumuskan hipotesisnya.

¨ Lebih jauh, peneliti biasanya tertarik dalam pengujian hipotesis mengenai subset dari parameter-parameter tersebut atau mengenai fungsi dari parameter tersebut.

Pendahuluan

¨ Setidaknya ada empat alasan mengapa menggunakan pendekatan multivariat untuk pengujian hipotesis pada p buah variabel daripada secara univariat, yaitu:

¨ Pertama:

¨ Penggunaan uji univariat akan meningkatkan kekeliruan jenis I, α, sedangkan dalam uji multivariat tetap mempertahankan pada taraf sebesar α.

Pendahuluan

¨ Sebagai contoh, misalnya jika melakukan uji univariat sebanyak p = 10 secara terpisah pada taraf 0.05, maka peluang paling tidak melakukan kesalahan dalam menolak hipotesis nol akan lebih besar daripada 0.05.

¨ Apabila variabel-variabel tersebut saling bebas (yang pada kenyataannya jarang terjadi), maka kita akan mempunyai (di bawah H0):

¨ P(menolak H0) = 1 – P(seluruh pengujian menerima H0) ¨ = 1 – (0.95)10 = 0.40

Pendahuluan

¨ Taraf signifikansi sebesar 0.40 tentu saja merupakan tingkat kekeliruan yang tidak dapat diterima.

¨ Biasanya, untuk 10 buah variabel yang saling berkorelasi, maka taraf signifikansinya akan berada diantara 0.05 sampai dengan 0.40.

Pendahuluan

¨ Kedua:¤ Uji univariat sama sekali mengabaikan korelasi

diantara variabel yang diamati, sedangkan uji multivariat sudah mengakomodir secara langsung korelasinya.

¨ Ketiga:¤ Pada umumnya terjadinya penolakan hipotesis dalam

uji multivariat disebabkan oleh rata-rata yang terbentuk dari suatu kombinasi linear variabel daripada oleh suatu variabel yang berdiri sendiri.

Pendahuluan

¨ Keempat:¤ Uji multivariat lebih kuasa dalam banyak kasus. Kuasa uji

adalah peluang menolak H0 pada saat H0 itu adalah benar.

¤ Dalam beberapa kasus, seluruh p variabel dari uji univariat seringkali gagal mencapai tingkat signifikansinya, tetapi dalam uji multivariat adalah signifikan dikarenakan oleh efek yang kecil pada beberapa variabel secara bersama-sama memberikan kontribusi pada terjadinya penolakan H0.

¤ Untuk ukuran sampel tertentu terdapat beberapa keterbatasan pada banyaknya variabel dapat ditangani oleh uji multivariat tanpa kehilangan kuasa ujinya.

Pengujian Satu Vektor Rata-rata

¨ Matriks Kovarians Σ Diketahui (Kasus Univariat)¨ Hipotesis yang akan diuji adalah rata-rata y sama

dengan suatu nilai tertentu, katakan saja µ0, melawan alternatif bahwa rata-rata y tidak sama dengan µ0:

¨ Disini tidak akan dibahas hipotesis alternatif satu-arah karena tidak akan digunakan dalam kasus multivariat.

0 0 1 0: vs :H Hµ µ µ µ= ≠

¨ Matriks Kovarians Σ Diketahui (Kasus Univariat)¨ Diasumsikan bahwa sampel acak dari n buah

observasi y1, y2, …, yn berasal dari populasi yang berdistribusi N(µ, σ2) dengan σ2 diketahui.

¨ Statistik Uji:

¨ yang berdistribusi N(0, 1) pada saat H0 benar

µ −=

¨ Matriks Kovarians Σ Diketahui (Kasus Univariat)

¨ Untuk α = 0.05, hipotesis H0 akan ditolak jika |z| ≥1.96.

¨ Alternatifnya, kita dapat menggunakan statistik z2

yang akan berdistribusi χ2 dengan derajat bebas satu, dan hipotesis nol ditolak jika z2 ≥ (1.96)2 = 3.84.

¨ Pasa saat n besar, kita yakin melalui dalil limit pusat bahwa z akan mendekati distribusi normal, bahkan jika observasinya bukan berasal dari distribusi normal.

¨ Dalam kasus multivariat kita akan mempunyai beberapa variabel yang diukur pada masing-masing unit sampling, kemudian akan dihipotesiskan suatu nilai untuk rata-rata dari setiap variabel, H0: µ = µ0 melawan H1: µ ≠ µ0. Lebih eksplisit lagi bentuk hipotesisnya menjadi

01 011 1

2 02 2 020 1

p pp p

µ µµ µµ µ µ µ

µ µµ µ

M MM M

¨ Dimana setiap µ0j dinyatakan berdasarkan pada pengalaman sebelumnya atau nilai yang ditargetkan.

¨ Kesamaan vektor dalam H0 mempunyai makna µj = µ0j untuk seluruh j = 1, 2, …, p.

¨ Ketidaksamaan vektor dalam H1 mempunyai makna bahwa paling tidak terdapat satu µj ≠ µ0j.

¨ Jadi, misalnya jika µj = µ0j untuk seluruh j kecuali j= 2, dimana µ2 ≠ µ02, maka hipotesis nol akan ditolak.

¨ Untuk menguji H0, kita akan menggunakan sampel acak dari n vektor observasi y1, y2, …, yn yang berasal dari Np(µ, Σ), dimana Σ diketahui, serta menghitung vektor rata-rata, maka statistik ujinya adalah:

¨ Jika H0 benar, maka Z2 akan berdistribusi χ2, dengan demikian hipotesis nol akan ditolak jika

¨ Z2 >

)()'( 01

02 µµ −Σ−= − yynZ

2, pαχ

¨ Jika Σ tidak diketahui, kita dalam menggunakan Sdan menggantikannya ke dalam (5.2), serta Z2

akan mengikuti pendekatan distribusi chi-kuadrat. ¨ Tetapi menurut Rencher (2002), ukuran sampel n

akan lebih besar daripada yang ada dalam situasi univariat, dimana

( ) ( )0 / / (0,1)t y s n Nµ= − :

Contoh 5.1:

¨ Data yang disajikan pada Tabel 3.1 adalah data tentang tinggi dan berat badan dari 20 siswa laki-laki.

¨ Misalkan diasumsikan bahwa sampel tersebut berasal dari populasi bivariat normal N2(µ, Σ), dimana:

100010010020

Contoh 5.1:

¨ Misalkan akan diuji suatu hipotesis H0: µ = (70, 170)`

¨ Dari hasil perhitungan diperoleh informasi

1 71.45y = 2 164.7y =

( ) ( )2 10 0

71.45 70 20 100 71.45 70(20)

164.7 170 100 1000 164.7 170

0.1 0.01 1.45(20) (1.45 5.3) 8.4026

0.01 0.002 5.3

Z n y y−

= − −

− − = − −

− = − = − −

μ Σ μ

Contoh 5.1:

¨ Dengan menggunakan α =0.05, maka diketahui:

¨ Hipotesis H0: µ = (70, 170)` ditolak sebab Z2 = 8.4026 > 5.99

¨ Daerah penolakan untuk adalah berada dalam atau diluar ellips sebagaimana yang ditunjukkan dalam Gambar 5.1

¨ artinya statistik uji Z2 adalah lebih besar daripada 5.99 jika dan hanya jika berada diluar ellips

20.05;2 5.99χ =

( )1 2, `y y=y

Contoh 5.1:

¨ Jika berada dalam wilayah ellips, maka H0 diterima.

¨ Jadi jarak dari µ0 harus diperhitungkan dalam proses pengujian hipotesis.

¨ Apabila jarak tersebut dibakukan oleh Σ-1, maka seluruh titik-titik pada kurva secara statistik berjarak sama dari titik pusatnya.

( )1 2, `y y=y

Gambar 5.1

Contoh 5.1:

¨ Perlu dicatat bahwa pengujian ini sensitif terhadap struktur kovarians.

¨ Apabila cov(y1, y2) adalah negatif, maka y2cenderung akan naik pada saat y1 menurun, sehingga ellips akan mempunyai tingkat kemiringan dalam arah yang berbeda.

¨ Dalam hal seperti ini, akan berada dalam daerah penerimaan.

( )1 2, `y y=y

Contoh 5.1:

¨ Selanjutnya akan diselidiki uji lanjutan pada masing-masing variabel secara terpisah.

¨ Dengan menggunakan zα/2 = 1.96 untuk α = 0.05, diperoleh

96.17495.0/

96.1450.1/

−>−=−

Contoh 5.1:

¨ Jadi dalam hal ini kedua pengujian menghasilkan penerimaan hipotesis.

¨ Dalam hal ini kedua rata-rata untuk y1 dan y2 cukup jauh dari suatu nilai yang dihipotesiskan yang menyebabkan terjadi penolakan pada hipotesis nol.

¨ Akan tetapi pada saat terdapat korelasi positif antara y1dan y2 yang diperhitungkan ke dalam uji multivariat, maka terjadilah penolakan terhadap hipotesis nol.

¨ Hasil ini mengilustrasikan kelebihan dari uji multivariat dibandingkan dengan hasil-hasil dari uji univariat.

Contoh 5.1:

¨ Gambar 5.2 menunjukkan daerah penerimaan segiempat untuk uji univariat yang disatukan dengan daerah penerimaan ellips untuk uji multivariat.

¨ Segiempat ini diperoleh dengan cara menghitung dua buah daerah penerimaan:

01 1 01

2 202 2 02

1.96 1.96

σ σµ µ

− < < +

Gambar 5.2

Contoh 5.1:

¨ Titik-titik di dalam ellips tetapi berada di luar segiempat akan ditolak paling tidak dalam satu dimensi univariat tetapi akan diterima secara multivariat.

¨ Hal ini mengilustrasikan adanya peningkatan dalam α sebagai hasil dari uji univariat.

¨ Titik-titik di luar ellips tetapi berada dalam segiempat akan ditolak secara multivariat tetapi diterima dalam uji univariat.

Contoh 5.1:

¨ Jadi dalam kedua kasus yang ditunjukkan dalam wilayah yang diarsir, kita seharusnya menggunakan hasil-hasil yang diberikan dalam uji multivariat.

¨ Dalam satu kasus, uji multivariat lebih kuasa dibandingkan dengan uji univariat, dalam kasus yang lain uji multivariat memberikan nilai α yang eksak dibandingkan nilai α yang meningkat dalam uji univariat.

Kasus varians Σ tidak diketahui

¨ Pada bagian sebelumnya telah disinggung sedikit mengenai sifat-sifat pengujian hipotesis, sebab pengujian tersebut diterapkan dengan asumsi bahwa Σ diketahui.

¨ Pembahasan mengenai pengujian untuk satu-sampel penting untuk dibahas karena dapat dijadikan dasar untuk lebih memahami kasus dua-sampel yang memang sering diterapkan.

¨ Menurut Rencher (2002) ada dua alasan mengapa kasus satu-sampel penting untuk dibahas, yaitu:

Kasus varians Σ tidak diketahui

¨ Banyak sekali konsep-konsep dasar akan lebih mudah diilustrasikan dalam kerangka kerja satu-sampel dibandingkan dalam kasus dua-sampel.

¨ Beberapa pengujian yang sangat bermanfaat dapat dituangkan dalam kerangka kerja satu-sampel. Misalnya nanti akan diterapkan pada pengujian data berapasangan (dibahas pada bab ini juga), serta dalam rancangan pengukuran berulang dan analisis profil yang dibahas pada Bab 6.

Kasus varians Σ tidak diketahui (Univariat)¨ Pertama-tama kita lihat kembali uji-t pada satu-

sampel dalam kasus univariat, dengan hanya satu variabel yang diukur pada setiap unit sampling.

¨ Diasumsikan bahwa sampel acak y1, y2, …, ynberasal dari distribusi N(µ, σ2).

¨ Akan ditaksir µ oleh dan σ2 oleh s2. ¨ Untuk menguji hipotesis H0: µ = µ0 melawan H1: µ ≠

µ0, akan menggunakan statistik uji:

/n yyt

ss nµµ −−

Kasus varians Σ tidak diketahui (Univariat)¨ Jika H0 benar, maka t akan berdistribusi tn – 1,

dimana n – 1 adalah derajat bebasnya. ¨ Hipotesis nol akan ditolak jika |t| ≥ tα/2,n–1, dimana

tα/2,n–1 adl nilai kritis yang diperoleh dari tabel-t.¨ merupakan bentuk karakteristik

dari statistik-t, yang menunjukkan suatu jarak sampel yang dibakukan antara dengan µ0.

¨ Dalam bentuk seperti ini, rata-rata yang dihipotesiskan dikurangi oleh , dan selisihnya itu kemudian dibagi oleh

( )0 /t y s nµ= −

y /ys s n=

Kasus varians Σ tidak diketahui (Univariat)¨ Oleh karena y1, y2, …, yn merupakan sampel acak

dari N(µ, σ2), maka variabel acak dan s adalah saling bebas.

¨ Selanjutnya bentuk karakteristik ini akan analog dengan statistik-T2 dalam kasus multivariat.

Kasus varians Σ tidak diketahui (Multivariat)¨ Sekarang pembahasan dilanjutkan pada kasus

multivariat dimana p buah variabel diukur pada masing-masing unit sampling.

¨ Diasumsikan bahwa sampel acak y1, y2, …, ynberasal dari Np(µ, Σ), dimana yi berisi ppengukuran pada unit sampling ke-i.

¨ Vektor rata-rata µ akan ditaksir oleh dan matriks kovarians Σ oleh S. Untuk menguji hipotesis H0: µ = µ0 melawan H1: µ ≠ µ0, akan digunakan perluasan dari statistik-t univariat.

Kasus varians Σ tidak diketahui (Multivariat)¨ Dalam bentuk kuadrat, statistik-t univariat dapat

ditulis kembali sebagai

¨ Pada saat dan s2 digantikan oleh dan S, maka akan diperoleh statistik uji

¨ Alternatifnya, T2 dapat diperoleh melalui Z2

dengan cara menggantikan Σ oleh S.

( ) ( ) ( )2

02 2 10 02 ( )

n yt n y s y

µ µ−−= = − −

( )0y µ− ( )0−y μ

( ) ( )2 10 0( )T n −= − −y μ S y μ

Kasus varians Σ tidak diketahui (Multivariat)¨ Distribusi dari T2 ditemukan oleh Hotelling pada

tahun 1931 dengan mengasumsikan bahwa H0benar dan samplingnya adalah Np(µ, Σ).

¨ Distribusi ini mempunyai indeks dua buah parameter, yaitu p dimensi dan derajat bebas v = n – 1. Hipotesis nol ditolak jika T2 > .

¨ Apabila sampel berukuran besar dan hipotesis nol diterima, maka kita cukup mempunyai keyakinan bahwa nilai µ yang sebenarnya mendekati suatu nilai µ0 yang dihipotesiskan.

2, , 1p nTα −

Kasus varians Σ tidak diketahui (Multivariat)¨ Statistik-T2 dapat dipandang sebagai jarak sampel

dibakukan antara vektor rata-rata observasi dengan vektor rata-rata yang dihipotesiskan.

¨ Apabila vektor rata-rata sampel mempunyai jarak yang cukup jauh dengan vektor rata-rata yang dihipotesiskan, maka akan terjadi penolakan terhadap H0.

¨ Densitas dari T2 adalah miring sebab batas bawahnya adalah nol dan tidak mempunyai batas atas.

Kasus varians Σ tidak diketahui (Multivariat)¨ Statistik uji merupakan besaran skalar, karena

¨ merupakan bentuk kuadratik.¨ Bentuk karakteristik dari statistik-T2 adalah

( ) ( )

− = − −

Sy μ y μ

( ) ( )2 10 0( )T n −= − −y μ S y μ

Kasus varians Σ tidak diketahui (Multivariat)¨ Bentuk karakteristik ini mempunyai dua sifat

penting, yaitu:¨ S/n adalah matriks kovarians sampel dari dan

dianggap sebagai matriks dibakukan dalam suatu fungsi jarak.

¨ Oleh karena y1, y2, …, yn adalah bersitribusi Np(µ, Σ), maka akan berdistribusi , (n – 1)Sakan berdistribusi W(n – 1, Σ), serta dan S adalah saling bebas.

( )1,p nN μ Σ y

Kasus varians Σ tidak diketahui (Multivariat)¨ Beberapa sifat tambahan statistik-T2 :¨ Kita harus mempunyai n – 1 > p. Jika tidak, maka S

akan singular dan statistik-T2 tidak dapat dihitung.¨ Dalam kasus satu-sampel maupun dua-sampel,

derajat bebas untuk statistik-T2 akan sama dengan uji-t univariat, yaitu v = n – 1 untuk kasus satu-sampel, serta v = n1 + n2 – 2 untuk kasus dua-sampel.

Kasus varians Σ tidak diketahui (Multivariat)¨ Hipotesis alternatif H1 adalah dua-pihak. ¨ Oleh karena statistik-T2 bekerja dalam ruang

multidimensi, maka di sini tidak akan dipertimbangkan hipotesis alternatif satu-pihak.

¨ Walaupun hipotesis alternatif H1: µ ≠ µ0 pada dasarnya merupakan uji dua-pihak, namun demikian daerah kritisnya adalah satu-pihak

¨ Artinya hipotesis nol akan ditolak pada saat diperoleh T2 yang relatif besar

Kasus varians Σ tidak diketahui (Multivariat)¨ Dalam kasus univariat, . Statistik-T2 juga dapat

dikonversikan ke dalam statistik-F sebagai berikut:

¨ Perlu dicatat bahwa p dimensi (banyaknya variabel) dari statistik-T2 akan menjadi parameter derajat bebas pertama dari statistik-F.

¨ Banyaknya derajat bebas dari T2 dinyatakan dengan v, dan transformasi F diberikan dalam bentuk umum v, karena aplikasi dari T2 lainnya akan mempunyai v yang berbeda dengan n – 1.

21 1, 1n nt F− −=

1+−=

+−pvpvp FT

Kasus varians Σ tidak diketahui (Multivariat)¨ Jika hasil pengujian membawa kepada penolakan

terhadap H0: µ = µ0, maka pertanyaan selanjutnya yang akan muncul adalah variabel mana yang memberikan kontribusi penting terhadap terjadinya penolakan H0 tersebut.

¨ Masalah ini dapat ditangani dengan membentuk selang kepercayaan simultan yang didasarkan pada statistik Hotelling-T2 (interval T2) untuk sampel acak y1, y2, …, yn yang berasal dari populasi Np(µ, Σ) yang didefiniskan oleh

Kasus varians Σ tidak diketahui (Multivariat)

222 2 ,

( 1): ( )( )

ppp p p n p

sp ny Fn p n

Contoh 5.2:

¨ Dalam Tabel 3.3, diketahui bahwa n = 10 observasi dan p = 3 variabel. Nilai rata-rata yang dihipotesiskan untuk variabel y1 = 15.0, y2 = 6.0, dan y3 = 2.85, sehingga hipotesis nolnya dapat dinyatakan sebagai:

85.20.60.15

:0 µH

Contoh 5.2:

¨ Dari hasil perhitungan diperoleh informasi untuk dan S sebagai berikut:

28.17.18 ,3.09

140.54 49.68 1.9449.68 72.25 3.68

1.94 3.68 0.25

Contoh 5.2:

¨ Untuk menguji hipotesis H0 akan digunakan statistik-T2 sebagai berikut:

¨ Dari Tabel A7, diperoleh nilai kritis Oleh karena T2 = 24.559 > , maka hipotesis nol di atas adalah ditolak.

( ) ( )2 10 0

/ 128.1 15.0 140.54 49.68 1.94 28.1 15.010 7.18 6.0 49.68 72.25 3.68 7.18 6.0

3.09 2.85 1.94 3.68 0.25 3.09 2.8524.559

T n −

= − −

− − = − − − −

y μ S y μ

20.05,3,9 16.766T =

Contoh 5.2:

1 1 ,( 1) 140.5444: ( ) 28.100 16.766

( ) 10

(23.2457; 32.9542)

p n psp ny F

n p nµ α−

−± = ±

2 2 ,( 1) 72.2484: ( ) 7.180 16.766

( ) 10

(3.6996;10.6604)

p n psp ny F

n p nµ α−

−± = ±

3 3 ,( 1) 0.2501: ( ) 3.089 16.766

( ) 10

(2.8842; 3.2938)

p n psp ny F

n p nµ α−

−± = ±

Contoh 5.2:

¨ Dari hasil di atas terlihat bahwa selang kepercayaan simultanuntuk µ1, µ2, dan µ3 semuanya tidak mencakup nilai nol.

¨ Akan tetapi tidak semua selang kepercayaan tersebutmencakup nilai yang rata-rata yang dihipotesiskan.

¨ Sebagai contoh, misalnya untuk variabel y1, terlihat bahwabatas bawah dan batas atasnya masing-masing adalah23.2457 dan 32.9542,

¨ Sementara nilai rata-rata yang dihipotesiskan untuk y1 adalah15.000, begitu juga untuk variabel y3.

¨ Sedangkan untuk variabel y2, selang kepercayaan yang terbentuk mencakup nilai dari rata-rata yang dihipotesiskan.

Perbandingan 2 Vektor Rataan (Univariat)¨ →

¨ →¨ Diasumsikan bahwa kedua sampel itu saling bebas

dan memenuhi syarat bahwa , dimana σ2 tidak diketahui.

¨ Asumsi mengenai independensi dan bervarians sama sangat diperlukan agar statistik-t dalam Persamaan (5.8) akan mengikuti distribusi-t.

111 12 1, ,..., ny y y ( )2

1 1,N µ σ

121 22 2, ,..., ny y y ( )2

2 2,N µ σ

2 2 21 2σ σ σ= =

Perbandingan 2 Vektor Rataan (Univariat)¨ Dari kedua sampel tersebut akan dihitung

beberapa besaran yang diperlukan, yaitu dan 1y

( ) ( )1 2 21 1 1 1 11

SS 1nii

y y n s=

= − = −∑

( ) ( )2 2 22 2 2 2 21

SS 1nii

y y n s=

= − = −∑

2 22 1 2 1 1 2 2gab

1 2 1 2

SS SS ( 1) ( 1)2 2

n s n ssn n n n

+ − + −= =

+ − + −

Perbandingan 2 Vektor Rataan (Univariat)¨ Diketahui bahwa¨ Untuk menguji hipotesis bahwa H0: µ1 = µ2 vs H1: µ1

≠ µ2, maka akan digunakan statistik uji

¨ yang akan mengikuti distribusi-t dengan derajat bebas n1 + n2 – 2 pada saat H0 benar.

¨ H0 akan ditolak pada saat

( )2 2gabE s σ=

1 1gab

1 2/2, 2n nt tα + −≥

Perbandingan 2 Vektor Rataan (Multivariat)¨ →

¨ →

¨ Untuk kasus dimana p buah variabel diukur pada setiap unit sampling dalam dua sampel. Disini akan diuji suatu hipotesis

111 12 1, , ..., ny y y

121 22 2, , ..., ny y y

( )1 1,pN μ Σ

( )2 2,pN μ Σ

0 1 2 1 1 2: melawan :H H= ≠μ μ μ μ

Perbandingan 2 Vektor Rataan (Multivariat)¨ Diasumsikan bahwa kedua sampel itu saling bebas

dan memenuhi syarat bahwa ,

¨ dimana Σ tidak diketahui. ¨ Asumsi mengenai independensi dan bervarians

sama sangat diperlukan agar statistik-T2 dalam Persamaan (5.9) akan mengikuti distribusi-T2.

1 2= =Σ Σ Σ

Perbandingan 2 Vektor Rataan (Multivariat)¨ Vektor rata-rata sampel 1:

¨ Vektor rata-rata sampel 2:

¨ Matriks jumlah kuadrat dan perkalian silang untuk kedua sampel

1 1 11/n

==∑y y

2 2 21/n

==∑y y

( )( ) ( )

1 1 1 1 1 1 11

= − − = −∑W y y y y S

( )( ) ( )

2 2 2 2 2 2 21

= − − = −∑W y y y y S

Perbandingan 2 Vektor Rataan (Multivariat)¨ Oleh karena (n1 – 1)S1 merupakan penaksir takbias

bagi (n1 – 1)Σ1 dan (n2 – 1)S2 merupakan penaksir takbias bagi (n2 – 1)Σ2, maka kita dapat menggabungkannya untuk memperoleh penaksir takbias bagi matriks kovarians populasi Σ, yaitu

( )gab 1 2

1 1 2 21 2

1 [ ( 1) ( 1) ]2

n nn n

= ++ −

= − + −+ −

Perbandingan 2 Vektor Rataan (Multivariat)¨ Jadi E(Sgab) = Σ. Kuadrat dari statistik-t univariat

dalam (5.8) dapat dinyatakan sebagai

¨ Bentuk di atas dapat diperluas pada p buah variabel dengan mensubstitusikan

¨ ke ¨ Sgab ke

( ) ( ) ( )12 21 2

1 2 1 21 2

gabn nt y y s y y

n n−

= − −+

( )1 2−y y ( )1 2y y− 2

Perbandingan 2 Vektor Rataan (Multivariat)¨ Sehingga diperoleh

¨ yang akan mengikuti distribusi pada saat H0 benar. Untuk dapat melakukan pengujian hipotesis ini, langkah-langkahnya adalah kumpulkan data untuk dua sampel, hitung statistik-T2 dalam (5.9), kemudian tolak hipotesis H0 jika

( ) ( )2 11 2

1 2 gab 1 21 2

'n nT Sn n

−= − −+

y y y y

2, 2p n nT + −

2 2, , 2p n nT Tα + −≥

Perbandingan 2 Vektor Rataan (Multivariat)¨ Statistik-T2 dalam (5.9) dapat dinyatakan dalam

bentuk karakteristik sebagai jarak dibakukan antara dan :

¨ dimana (1/n1 + 1/n2)Sgab adalah matriks kovarians sampel untuk dan Sgab adalah saling bebas dengan sebab sampling berasal dari populasi normal multivariat

( ) ( )1

21 2 gab 1 2

1 1'Tn n

= − + −

y y S y y

( )1 2−y y ( )1 2−y y

Perbandingan 2 Vektor Rataan (Multivariat)¨ Berikut ini adalah beberapa sifat penting

dari statistik-T2:¨ Diperlukan syarat bahwa n1 + n2 – 2 > p supaya

Sgab bersifat nonsingular.¨ Pada saat T2 besar maka hasil pengujian

cenderung akan mendukung H1, sedangkan untuk nilai T2 kecil akan memberikan hasil pengujian yang cenderung mendukung H0.

Perbandingan 2 Vektor Rataan (Multivariat)¨ Oleh karena batas bawah dari T2 adalah nol dan

tidak mempunyai batas atas, maka densitas dari T2

adalah miring. Dalam kenyataannya memang T2

dapat dihubungkan secara langsung ke statistik-Fyang juga berdistribusi miring.

¨ Derajat bebas untuk T2 adalah n1 + n2 – 2 yang berarti sama dengan derajat bebas untuk statistik-tunivariat.

Perbandingan 2 Vektor Rataan (Multivariat)¨ Hipotesis alternatif merupakan uji dua-

pihak. Akan tetapi daerah kritisnya adalah yang merupakan uji satu-pihak.

¨ Statistik-T2 dapat ditransformasikan ke statistik-Fdengan menggunakan Persamaan (5.7):

¨ dimana p dimensi dari statistik-T2 menjadi parameter derajat bebas pertama untuk statistik-F.

1 1 2:H ≠μ μ

2121)2(

1−−+=

−+−−+

pnnpFTpnn

Perbandingan 2 Vektor Rataan (Multivariat)¨ Dimungkinkan untuk membentuk selang

kepercayaan simultan untuk komponen-komponen di dalam vektor µ1 – µ2.

¨ Selang kepercayaan ini dibentuk dengan cara mempertimbangkan seluruh kombinasi linear yang mungkin dari selisih dalam vektor rata-rata. Diasumsikan bahwa data berasal dari populasi yang berdistribusi normal multivariat dan matriks kovarians Σ sama.

Perbandingan 2 Vektor Rataan (Multivariat)¨ Untuk membentuk 100(1 – α)% selang

kepercayaan ini, misalkan diketahui bahwa

¨ Kemudian, dengan peluang sebesar 1 – α maka seleng kepercayaannya menjadi:

( ) ( )1 2

21 2 1 2 , , 12 / 1 p n n pc n n p n n p Fα + − −= + − + − −

( )1 2

1 1` ` gabcn n

− ± +

a y y a S a

Perbandingan 2 Vektor Rataan (Multivariat)¨ Secara khusus, selang kepercayaan untuk µ1i – µ2i

akan diberikan oleh

¨ Selain itu, dapat juga dibentuk selang kepercayaan 100(1 – α)% Bonferonni untuk selisih rata-rata dari p buah populasi yang diberikan oleh

( )1 2

1 1iii i gaby y c

− ± +

1 21 2 1 2 2 gab1 2

1 1:2 iii i i i n nx x t s

p n nα

µ µ + −

− − ± +

Contoh 5.3:

¨ Empat jenis uji psikolgi diberikan pada 32 laki-laki dan 32 wanita. Hasil pengujian tersebut disajikan pada Tabel 5.1. Empat buah variabel yang diamati itu adalah

¨ y1 = pictorial inconsistencies; ¨ y2 = tool recognition; ¨ y3 = paper form board; serta ¨ y4 = vocabulary.

Contoh 5.3:

¨ Vektor rata-rata untuk sampel 1 dan 2:

¨ Matriks varians-kovarians untuk sampel 1 dan 2:

15.9715.9127.1922.75

12.3413.9116.6621.94

5.192 4.545 6.522 5.2504.545 13.18 6.760 6.2666.522 6.760 28.67 14.475.250 6.266 14.47 16.65

9.136 7.549 4.864 4.1517.549 18.60 10.22 5.4464.864 10.22 30.04 13.494.151 5.446 13.49 28.00

Contoh 5.3:

¨ Matriks varians-kovarians gabungan:

¨ Nilai statistik-T2:

[ ]gab 1 2

1 (32 1) (32 1)32 32 27.164 6.047 5.693 4.7016.047 15.89 8.492 5.8565.693 8.492 29.36 13.894.701 5.856 13.98 22.32

= − + −+ −

( ) ( )2 11 2

1 2 gab 1 21 2

' 97.6015n nT Sn n

−= − − =+

y y y y

Contoh 5.3:

¨ Melalui proses interpolasi dalam Tabel A7, diperoleh ,

¨ dengan demikian hipotesis ditolak.¨ 95% selang kepercayaan simultan µ1i – µ2i, untuk i

= 1, 2, 3, dan 4 yang dihitung melalui Persamaan (5.13). Hasilnya adalah

20.01,4,62 15.373T =

0 1 2:H =μ μ

( )11 21

1 1 1 13.625 10.6258 7.164332 32

1.4437 5.8062

iigaby y cn n

− ± + = ± +

≤ − ≤

Contoh 5.3:

2212 221 2

1 1 1 12.000 10.6258 15.894132 32

1.2489 5.2489

gaby y cn n

− ± + = ± +

− ≤ − ≤

3313 23 gab1 2

1 1 1 110.531 10.6258 29.356432 32

6.1158 14.9467

y y cn n

− ± + = ± +

≤ − ≤

4414 24 gab1 2

1 1 1 10.8125 10.6258 22.320632 32

3.0376 4.6626

y y cn n

− ± + = ± +

− ≤ − ≤

Contoh 5.3:

¨ Dari keempat selang kepercayaan simultan yang terbentuk di atas, terlihat bahwa terdapat dua selang yang mencakup nilai nol, dan dua selang lainnya tidak mencakup nol.

¨ Selang kepercayaan simultan yang tidak mencakup nol adalah yang berhubungan dengan variabel y1dan y3,

¨ Selang kepercayaan yang mencakup nilai nol adl yg berhubungan dengan variabel y2 dan y4.

Contoh 5.3:

¨ Dengan demikian dapat dikatakan bahwa variabel y1 dan y3 merupakan variabel yang memberikan kontribusi terhadap terjadinya penolakan pada hipotesis nol.

¨ Variabel y2 dan y4 menunjukan bahwa secara rata-rata untuk kedua variabel tersebut pada kelompok laki-laki dan wanita adalah sama.

Uji Rasio Kemungkinan

¨ Pada bagian sebelumnya telah diperkenalkan statistik-T2 sebagai analogi dari jarak kuadrat univariat, t2.

¨ Ada prinsip-prinsip yang lebih umum untuk membentukprosedur pengujian yang disebut dengan metode rasiokemungkinan (likelihood ratio method, dimana statistik-T2 dapat diturunkan sebagai uji rasio kemungkinan dariH0: µ = µ0.

¨ Uji rasio kemungkinan mempunyai beberapa sifat yang optimum pada sampel berukuran besar, dan akan lebihtepat digunakan dengan asumsi bahwa data mengikutidistribusi normal multivariat.

¨ Pendekatan kemungkinan maksimum banyak digunakan untuk proses penaksiran parameter.

¨ Fungsi kemungkinan adalah densitas gabungan dari y1, y2, …, yn.

¨ Nilai dari parameter yang memaksimumkan fungsi kemungkinan disebut sebagai penaksir kemungkinan maksimum yang diberikan oleh

( ) /2

/2, /2

1max ,ˆ(2 )

−=μ Σ

μ ΣΣ

¨ Diketahui bahwa:

¨ adalah penaksir kemungkinan maksimum. Perludiketahui bahwa penaksir kemungkinan maksimumdan dipilih sedemikian rupa sehingga mampumenjelaskan dengan baik nilai pengamatan dari suatusampel acak.

( ) ( )

1ˆ `n

i iin =

= − −∑Σ y y y y

= = ∑μ y y

μ̂ Σ̂

¨ Untuk kasus pengujian satu vektor rata-rata, dimana hipotesis yang akan diuji adalah H0: µ = µ0melawan H1: µ ≠ µ0.

¨ Di bawah H0: µ = µ0, maka fungsi kemungkinannya adalah

( ) ( ) ( )1

0 0 0/2 /21

1 1, exp `(2 ) | | 2

i inp ni

= − −

∑μ Σ y μ Σ y μΣ

Uji Rasio Kemungkinan:

¨ Maksimum dari fungsi kemungkinan dalam persamaan di atas diberikan oleh:

¨ dimana:

( ) /2

0 /2, /20

1max ,ˆ(2 )

−=μ Σ

μ ΣΣ

( )( )0 0 0

1ˆ `n

i iin =

= − −∑Σ y μ y μ

¨ Kemudian akan dibandingkan maksimum dari L(µ0, Σ) dengan maksimum tak-terbatas L(µ, Σ).

¨ Perbandingan disebut juga sebagai statistik uji rasio kemungkinan (likelihood ratio tests) yang didefiniskan sebagai:

ˆmax ( , )ˆmax ( , )

Λ = =

μ Σ Σ

¨ Statistik yang ekivalen Λn/2 = disebut sebagai Wilks’ lambda.

¨ Apabila nilai pengamatan dari rasio kemungkinan ini terlalu kecil, maka hipotesis H0: µ = µ0 akan ditolak.

¨ Uji rasio kemungkinan H0: µ = µ0 melawan H0: µ ≠µ0 akan menolak jika:

ˆ ˆ0Σ Σ

( )( )

− −

Λ = = <

− −

∑00 0

y y y yΣ

Σ y μ y μ

¨ Statistik-T2 yang diberikan dalam Persamaan (5.9) dengan dengan uji rasio kemungkinan pada Persamaan(5.18) dapat dihubungkan melalui persamaan berikut:

¨ Sekali lagi, metode rasio kemungkinan dari suatupengujian hipotesis menggunakan rasio antara nilaimaksimum dari fungsi kemungkinan denganmengasumsikan bahwa H0 benar dengan maksimumdari fungsi kemungkinan di bawah H1.

122/ 1

( 1)n T

Λ = + −

¨ Uji rasio kemungkinan ini mempunyai kuasa uji yang baik, dan kadang-kadang mempunyai kuasa yang optimum dibandingkan dengan alternatif lainnya.

¨ Dengan cara yang sama, ketika diterapkan pada sampel normal multivariat dan untuk menguji hipotesis , maka pendekatan rasio kemungkinan akan membawa pada statistik-T2

Hotelling yang diberikan pada Persamaan (5.9).

0 1 2:H =μ μ

pengujian vektor rataan-part1

Documents

penerapan algoritma vektor pada finite automata untuk...

vektor induksi

model vektor tegangan dalam modulasi vektor …

mater-strategi pengujian perangkat...

pengujian lift / elevator.pdf

rex brasseriemenu 130919 vektor

survey vektor dhf

calculus vektor & integral fungsi vektor [compatibility...

vektor ng rus presentation

vektor-cd performance catalog

motion - vektor

pengujian drawdown

presentasi1_bab1 analisis vektor

vektor (8) - tantri

shape-it! vektor - foxbelysning.se filetrack 155 vektor-1 |...

analisis vektor [compatibility mode]

installation operation and maintenance manual...vektor®...

vektor space model - khairuddinuad.files.wordpress.com ·...

1. rataan, modus, median dan quartil tabel data berkelompok

monitoring resistensi vektor malaria