cluster sampling
DESCRIPTION
PERTEMUAN 3-MPC 2 TEORI. CLUSTER SAMPLING. Oleh : J. Purwanto Ruslam. SEKOLAH TINGGI ILMU STATISTIK. PENGANTAR. Jika jumlah elemen /unit yang menjadi populasi survei sangat besar maka sampling elemen akan sulit diterapkan . - PowerPoint PPT PresentationTRANSCRIPT
CLUSTER SAMPLING
Oleh: J. Purwanto Ruslam
SEKOLAH TINGGI ILMU STATISTIK
PERTEMUAN 3-MPC 2 TEORI
PENGANTAR
› Jika jumlah elemen/unit yang menjadi populasi survei sangat besar maka sampling elemen akan sulit diterapkan.
› Hali ini disebabkan oleh sulitnya menyediakan kerangka sampel (frame) sampai unit/elemen.
› Selain itu, penarikan sampel secara elemen sampling akan inefisiensi dari penggunaan sumber daya survei (waktu, biaya, tenaga) jika cakupan survei sangat luas.
PENGANTAR
› Misalkan, tahun kita ingin melakukan suatu survei rumah tangga di untuk estimasi level provinsi.
› Jika ingin melakukan sampel secara elemen sampling persyaratannya adalah kita harus mempunyai Daftar seluruh rumah tangga di provinsi tsb yang lengkap dan up to date, yaitu dari rumah tangga ke-1 sampai rumah tangga ke-N.
› Hal ini sulit dipenuhi karena pembentukan frame membutuhkan biaya, waktu, dan tenaga yang besar.
› Selain itu, sifat rumah tangga yang mempunyai kecenderungan untuk pindah dari tempat yang satu ke tempat yang lain akan menyebabkan persyaratan untuk tersedianya frame yang up to date tidak terpenuhi.
› Sekalipun frame rumah tangga tersedia, penarikan sampel secara elemen sampling akan menyebabkan sampel menyebar di seluruh wilayah cakupan survei sehingga operasional lapangan akan sangat sulit dan mahal.
1.Suatu populasi yang terdiri dari M elemen-dikelompokan menjadi N kelompok (cluster-gerombol) yang selanjutnya membentuk suatu Frame:
{ U } = { U1, U2, … Ui … UN }
{ Ui } = { ei1, ei2, … eij … UiM }
2. Kaidah asosiasi antara U(nit) dan E(lemen) adalah “One-to-Many”
PENGERTIAN
› Compact cluster, adalah cluster yang dibentuk oleh elemen-elemen yang saling berdekatan (contiguous).Contoh:• R(ukun) T(etangga) dgn elemen rumahtangga
atau penduduk,• Blok Sensus dgn elemen rumahtangga atau
penduduk,• Kelas dgn elemen murid/siswa
› Non-compact cluster, adalah cluster yang dibentuk oleh elemen-elemen yang non-contiguous
Cluster:
KlasterUnit Listing/ Daftar Unit
Elemen/Unit
AnalisisAplikasi
(1) (2) (3) (4)
1. Blok SensusRumah
tanggaOrang
Estimasi banyaknya rumahtangga/ penduduk beserta karakteristiknya
2. Desa SekolahGuru/
Murid
Estimasi banyaknya guru/ murid beserta karakteristiknya
3. Sekolah Kelas MuridEstimasi banyaknya murid beserta karakteristiknya
4. Halaman
bukuBaris Kata
Estimasi banyaknya kata dalam buku
5. Bulan Hari HariEstimasi rata-rata kepadatan lalu lintas.
Klaster, Unit Listing, Elemen/Unit Analisis, dan Aplikasi
Ditinjau dari jumlah unit/elemen dalam tiap cluster:
› Cluster yang jumlah elemen yang membentuk cluster sama, selanjutnya disebut clusters of equal size.– Bungkus rokok– Plot tanaman untuk percobaan
› Cluster yang jumlah elemen yang membentuk cluster tidak sama, selanjutnya disebut clusters of unequal size
Cluster:
Penarikan Sampel Cluster
Single stage Cluster Sampling
Multistage Sampling
Single stage vs Multi stage
› Ada dua cara untuk menentukan unit yang diteliti:
1. Semua unit yang ada dalam klaster terpilih dimasukkan
sebagai anggota sampel dan informasinya dikumpulkan. Dalam
sampling, penarikan sampel ini termasuk metode sampling
klaster satu tahap (single stage/ one stage cluster sampling).
2. Sebagian unit yang ada dalam klaster terpilih, dipilih dalam
sampel dan hanya dari unit terpilih informasi dikumpulkan.
Penarikan sampel ini termasuk metode sampling klaster
bertahap (multi stage cluster sampling).
› Pengumpulan data pada unit yang berdekatan lebih mudah,
murah, cepat, dan operasi lapangan lebih memungkinkan
dibandingkan bila unit menyebar ke seluruh wilayah.
› Biaya transpor antar unit sampel mahal dan tidak sebanding
dengan biaya penelitian per unit sampel.
› Bila dihadapkan pada kesulitan penyediaan kerangka
sampel yang memuat seluruh unit sampel dalam populasi
secara lengkap dan mutahir. Biaya untuk pembuatan
kerangka sampel ini sangat mahal.
Alasan penerapan cluster sampling
› Pada umumnya tidak lebih efisien daripada
elemen sampling (variansnya cenderung
lebih besar)
› Tidak bisa digunakan untuk mengestimasi
pada level cluster (bandingkan dg strata)
Kerugian penerapan cluster sampling
I. Equal Cluster Size› Misalkan suatu populasi {O} dikelompokan menjadi N
cluster yang membentuk suatu Frame:
{ U } = { U1, U2, … Ui … UN }
• Cluster ke-i (i : 1, 2, ….N) memuat M elemen (j : 1, 2, ….M)• yij menyatakan nilai karaktristik Y pada elemen ke-j
dalam cluster ke-i• Nilai Y dapat ditata dalam catatan matriks sbb:
Populasi dan Parameter
Elemen indeks
Cluster indeks
1 2 … i … N
1 y11 y21 … yi1 … yN1
2 y12 y22 … yi2 … yN2
: : : : : : :
j y1j y2j … yij … yNj
: : : : : : :
M y1M y2M … yiM … yNM
Total y1. y2. … yi. … yN.
Matriks nilai yij
› Rataan per-elemen dalam cluster
› Rataan umum per cluster
› Rataan umum per-elemen
› Varians populasi
Populasi dan Parameter
Dekomposisi Varians Populasi
Maka:
› Misalkan suatu populasi terdiri atas N cluster, dan masing-
masing cluster berukuran sama yaitu M elemen. Satu gugus
sampel yang berukuran n cluster ditarik dari N cluster
secara SRSWOR/sistematik linear. Seluruh elemen didalam
cluster terpilih diteliti.
› Misalkan yij (j:1,2,3,…, M; i: 1,2,3,4,…,n) menyatakan nilai
kharakteristik y pada elemen ke-j dalam cluster terpilih ke-i.
Estimasi
N Populasi
SRSWOR/Sistematik n sampel
› Estimasi total bagi karakteristik Y
› Estimasi varians bagi total Y
dengan:
› Rumus estimasi varians bagi total Y dapat dijabarkan:
Keterangan:
› Estimasi rata-rata per-cluster
– Estimasi varians
› Estimasi rata2 per-elemen (lebih menarik daripada rata2 per-cluster)
– Estimasi varians
Estimasi rata-rata
› Estimasi standard error= akar estimasi varians
› Estimasi Confidence interval (1-α) 100% bagi rata2
yang sebenarnya adalah
› Seorang manager sirkulasi surat kabar ingin mengetahui rata2
banyaknya surat kabar yang dibeli oleh rumah tangga di suatu
komunitas. Dalam komunitas tersebut terdapat 400 rumah tangga
yang terdaftar 40 geographical cluster yg setiap cluster-nya
memuat 10 ruta. Satu gugus sampel yang berukuran 4 cluster
ditarik secara SRSWOR, dan semua rumah tangga dalam cluster
terpilih diwawancarai, dan hasilnya seperti tercantum pada Tabel
1. Berapa estimasi rata2 banyaknya surat kabar yang dibeli oleh
rumah tangga berikut standard error dan relative standar error-
nya !
Contoh Soal
Ilustrasi
Cluster terpilih sampel
Cluster tidak terpilih sampel
Keterangan:
: rumah tangga
Tabel 1: Jumlah surat kabar yang dibeli oleh ruta menurut cluster
No. Ruta
Nomor cluster terpilih Grand Total1 2 3 4
1 1 1 2 1
2 2 3 1 1
3 1 2 1 3
4 3 2 1 2
5 3 3 1 1
6 2 1 3 5
7 1 4 2 1
8 4 1 1 2
9 1 1 3 3
10 1 2 1 1
Total 19 20 16 20 75
Penyelesaian:
› Rata-rata banyaknya koran yang dibeli tiap rumah tangga:
› Sampling varians:
TERIMA KASIHHave A Nice Sampling