statistik 1 3 dispersi

Post on 20-Jul-2015

228 Views

Category:

Education

10 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Pengukuran Dispersi

1

Menjelaskan Data

Buku Teks

2

Lind, Marchal and Wathen, 2005, Statistical Techniques in Business & Economics, 12th Ed., McGraw Hill, Irwin.

Pengukuran Dispersi

3

Mengapa perlu mempelajari Dispersi?Pengukuran Range, Deviasi Rata-rata, Varians dan

Standar Deviasi, dan Koefisien VariasiPengukuran Kemencengan (Skewness)Pengukuran Kurtosis (Peakedness)Pengukuran Kuartil, Desil, dan Persentil

Mengapa perlu mempelajari Dispersi?

4

Pengukuran nilai sentral (e.g. mean, modus, median) hanya menjelaskan pusat data, tidak menjelaskan sebaran data.

Dispersi dapat dipergunakan untuk membandingkan sebaran pada dua distribusi data atau lebih.

Pengukuran Range (Rentang/ Jangkauan)

5

Range (Rentang/ Jangkauan) adalah perbedaan antara terbesar dan nilai terkecil.

Range = H - L

Hanya dua nilai yang digunakan dalam perhitungan.Sangat dipengaruhi oleh nilai ekstrem.Mudah untuk dihitung dan dimengerti.

Deviasi Rata-rata (Mean Deviation)

Deviasi Rata-Rata (Mean Deviation) adalah rata-rata arimatik/hitung dari nilai absolut deviasi terhadap nilai rata-rata aritmatik/hitung.

Semua nilai yang digunakan dalam perhitungan.Tidak terlalu banyak dipengaruhi oleh nilai-nilai yang

besar atau kecil.Nilai absolut sulit untuk dimanipulasi.

nX-X Σ

=MD

Mean deviation juga disebut Mean Absolute Deviation (MAD).

Contoh 1

7

Berat sampel peti-peti berisi buku untuk toko buku (dalam Kg) adalah:

103, 97, 101, 106, 103Tentukan rentang dan deviasi rata-rata-nya.

Range = 106 – 97 = 9

Contoh 1

8

Langkah pertama adalah menentukan rata-rata berat kotak tsb:

Deviasi rata-rata-nya adalah:

102=5

510=

nΣX

=X

Σ X - X 12MD= = = 2.4n 5

x |x-xbar|103 197 5

101 1106 4103 1510 12

Varians & Standar Deviasi

9

Varians adalah rata-rata aritmatik/hitung dari kuadrat deviasi rata-rata.

Standar Deviasi adalah akar kuadrat dari Varians.

Varians Populasi

10

Varians populasi adalah rata-rata aritmetik/hitung dari kuadrat deviasi terhadap rata-rata populasi.

Semua nilai yang digunakan dalam perhitungan.Lebih cenderung dipengaruhi oleh nilai-nilai ekstrim

dibandingkan dengan deviasi rata-rata.

Varians

11

Rumus untuk Varians Populasi adalah:

Rumus untuk Varians Sampel adalah:N

μ)-Σ(X=σ2

2

1-n)X-Σ(X

=s2

2

Catatan dalam rumus varians sampel jumlah deviasi dibagi oleh (n-1) bukan n. Walaupun secara logis seharusnya menggunakan n bukan (n-1), pembagian dengan (n-1) menghasilkan estimator yang tidak bias terhadap varians populasi, sedangkan pembagian menggunakan n menghasilkan estimator yang bias.

Untuk memudahkan hitungan manual:

12

( ) ( )

( )

( )

2

2 2

2

2

2

2

2

1

1

XX X X

n

X Xs

n

XX

nsn

− = −

−=

−=

∑∑ ∑∑

∑∑

Contoh 2

13

Usia masing-masing anggota keluarga Pak Arman adalah sbb:

2, 18, 34, 42 Berapa varians populasi-nya?

24=496

=n

ΣX=μ

22 Σ(X- μ) 944σ = = = 236

N 4

x x- µ (x- µ)2

2 -22 484

18 -6 36

34 -10 100

42 18 324

Σ=96 Σ=944

Standar Deviasi Populasi

14

Standar Deviasi populasi (σ) adalah akar kuadrat dari varians populasi.

Untuk Contoh 2, Standar Deviasi populasi-nya adalah 15.36, diperoleh dari:

15.36=236=σ=σ 2

Contoh 3 Untuk data Sampel

15

Upah per jam yang diperoleh dari sampel lima pekerja adalah:

$7, $5, $11, $8, $6.

Hitunglah varians dari data tsb.

7.40=537

=n

ΣX=X

x x- x bar (x- x bar)2

7 -0.4 0.16

5 -2.4 5.76

11 3.6 12.96

8 0.6 0.36

6 -1.4 1.96

Σ=37 Σ=21.2

( )2

2Σ X- X 21.2s = = = 5.30

n-1 5-1

Standar Deviasi Sample

16

Standar deviasi sampel adalah akar kuadrat dari varians sampel.

In Contoh 3, standar deviasi sample adalah 2.30

2.30=5.29=s=s 2

Variance

Ungrouped Data• Population

• Sample

Grouped Data• Population

Sample

( )

( )

2

2

2

2

2

X

N

XX

NN

µσ

σ

−=

−=

∑∑

( )

( )

1

12

2

2

2

2

−=

−−

=

∑ ∑

nn

XX

s

n

XXs

( )

( )

2

2

2

2

2

f X

N

fXfX

NN

µσ

σ

−=

−=

∑∑

( )

( )

1

12

2

2

2

2

−=

−−

=

∑ ∑

nn

fXfX

s

n

XXfs

Standard Deviation

Ungrouped Data• Population

• Sample

Grouped Data• Population

Sample

( )

( ) ( )

2

2

2

X

N

XX

NN

µσ

σ

−=

−=

∑∑

( )

( ) ( )

2

2

2

if X

N

fXfX

NN

µσ

σ

−=

−=

∑∑

( )

( ) ( )

1

12

2

2

−=

−−

=

∑∑

nn

XX

s

n

XXs

( )

( ) ( )

1

12

2

2

−=

−−

=

∑∑

nn

fXfX

s

n

XXfs

Sebuah sampel yang terdiri dari sepuluh bioskop di Surabaya dihitung jumlah film yang diputar minggu lalu. Hitunglah varian dan standar deviasinya.

Jumlah f i lm yang diputar

f requency f

1 up t o 3 1

3 up t o 5 2

5 up t o 7 3

7 up t o 9 1

9 up t o 11 3

Total 10

Movies show ing

f class midpoint

x

( f .x) x-xbar f*(x-xbar)^2

1 up t o 3 1 2 2 -4.6 21.16 3 up t o 5 2 4 8 -2.6 13.52 5 up t o 7 3 6 18 -0.6 1.08 7 up t o 9 1 8 8 1.4 1.96

9 up to 11 3 10 30 3.4 34.68 Total 10 66 72.40

( ) 2

2 72.408.04

1 10 1

f X Xs

n

−= = =

− −∑

2 8.04 2.83s s= = =

Interpretasi dan Penggunaan Standar Deviasi

21

Teorema Chebyshev : untuk setiap kelompok pengamatan (baik sampel maupun populasi), proporsi minimum nilai-nilai yang terletak dalam standar deviasi rata-rata k sekurang-kurangnya adalah:

dimana k2 adalah konstanta yang lebih besar dari 1.

2k1-1

Contoh:Rata-rata hitung harga sepatu Nike adalah $51.54 dengan standar deviasi $7.51. Setidaknya berapa persen harga yang berada antara plus 3.5 standar deviasi dan minus 3.5 standar deviasi dari rata-rata?

Sekitar 92%

10.92

(3.5) 12.25= = =2 2

1 11- 1-k

Teorema Chebyshev

K Coverage1 0%2 75.00%3 88.89%4 93.75%5 96.00%6 97.22%

Teorema Chebyshev: Untuk semua jenis pengamatan, proposi minimum nilai yang terletak dalam kisaran standar deviasi rata-rata k sekurang-kurangnya adalah 1- 1/k2

Ingat: semakin kecil standar deviasi, menunjukkan bahwa pengamatan berada didekat rata-rata, vice versa.

Interpretasi dan Penggunaan Standar Deviasi

24

Aturan Empiris: Untuk setiap distribusi yang simetris & berbentuk lonceng (bell-shaped) :Sekitar 68% observasi akan berada pada plus dan minus 1 standar

deviasi rata-rata, Sekitar 95% observasi akan berada pada plus dan minus 2 standar

deviasi rata-rata, Dalam prakteknya, hampir semua observasi berada dalam plus

dan minus 3 standar deviasi rata-rata.

Aturan Empiris juga disebut sebagai Aturan normal.

25µ−3σ µ−2σ µ−1σ µ µ+1σ µ+2σ µ+ 3σ

Kurva Berbentuk Lonceng menunukkan hubungan antara σ dan μ

Mengapa perlu memperhatikan dispersi?

26

Dispersi dipergunakan sebagai salah satu ukuran risiko. Bandingkan dua aset dengan rata-rata expected return

yang sama:-2%, 0%,+2%-4%, 0%,+4%

Dispersi return aset kedua lebih besar dibandingkan yang pertama. Dengan demikian, aset kedua yang lebih berisiko.

Hal ini menunjukkan bahwa dispersi sangat penting untuk keputusan investasi, disamping informasi rata-rata expected return .

Dispersi RelatifKoefisien Variasi adalah rasio dari standar deviasi terhadap rata-

rata aritmatik, dinyatakan dalam persentase:

CV: coefficient of variations: standar deviasix-bar: rata-rata

Berguna untuk membandingkan dua atau lebih distribusi yang:Datanya memiliki satuan /unit yang berbeda (misalnya: hari dan Rupiah)Datanya memiliki satuan / unit yang sama, tetapi rata-ratanya sangat jauh

berbeda (misal: gaji direktur dengan gaji buruh kasar)

(100%)Xs

=CV

Contoh

28

Sebuah studi tentang bonus dan lama bekerja menghasilkan informasi statistik sebagai berikut:

Rata-rata bonus: $200, standar deviasi bonus: $40Rata-rata lama bekerja: 20 tahun, standar deviasi: 2 tahunBandingkan kedua distribusi tersebut (ingat masing-masing memiliki satuan yang

berbeda) Digunakan koefisien variasi:

Untuk Bonus:

Untuk lama bekerja

Dispersi untuk bonus lebih besar dibanding rata-ratanya.

40

200

sCV= (100%) = (100%) = 20%X

2

20

sCV= (100%) = (100%) = 10%X

Skewness (Kemencengan/ asimetris) α3

Skewness (Kemencengan/ asimetris) adalah pengukuran dari kurangnya simetri pada distribusi.

Koefisien skewness (kemencengan) dapat berkisar dari -3,00 (asimetris negatif) sampai 3,00 (asimetris positif).

Nilai 0 menunjukkan distribusi yang simetris.Koefisien Kemencengan ini dihitung sebagai berikut:

Pearson:

Software:

Smedian)-x3(

=sk

−∑3

s

xx

2)-1)(n-(nn=sk

SkewnessSk = 0 (symmetric)Sk = + (positively skewed)Sk = - (negatively skewed)Croxton & Cowden -3 ≤ Sk ≤ 3

Cont..Bowley :

SkB = 0 symmetric (Q2-Q1 = Q3-Q2)SkB = + positively skewed

(Q2-Q1 < Q3-Q2)SkB = - negatively skewed

(Q2-Q1 > Q3-Q2)SkB = ± 0,1 (not significantly skewed) SkB > ± 0,3 (significantly skewed)

( ) ( )( ) ( )1223

1223

QQQQ

QQQQS

Bk −+−−−−=

Cont..Relative skewness :

Ungrouped data :

Grouped data :

Karl Pearson : α3 ≥ ± 0,5Kenny & Keeping :

-2 ≤ α3 ≤ 2 (moderately skewed)α3 ≥ ± 2 (significantly skewed)

( )3

3

3

1

s

XXn∑ −=α

( )3

3

3

1

s

XXfn∑ −=α

Skewness for Grouped DataPenjualan f Xi f (Xi - X ) ^3

20-30 4 25 -101,648.74

30-40 7 35 -51,109.69

40-50 8 45 -6,644.67

50-60 12 55 2.59

60-70 9 65 10,719.14

70-80 8 75 69,934.53

80-90 2 85 57,305.23

Total 50 -21,441.60

( )10,0

18,16

60,441.21501

33 −=−

Kurtosis (Peakedness)� Kurtosis

Ukuran ketinggian distribusi frekuensiPlatykurtic (relatif datar dan menyebar)Mesokurtic (normal)Leptokurtic (tinggi dan tipis)

Kurtosis (1)

3 . 72 . 92 . 11 . 30 . 5- 0 . 3- 1 . 1- 1 . 9- 2 . 7- 3 . 5

7 0 0

6 0 0

5 0 0

4 0 0

3 0 0

2 0 0

1 0 0

0

X

Frequency

Platykurtic - flat distribution

Kurtosis (2)

43210- 1- 2- 3- 4

5 0 0

4 0 0

3 0 0

2 0 0

1 0 0

0

X

Frequency

Mesokurtic – tidak terlalu datar & tidak terlalu tinggi (normal)

Kurtosis (3)

Leptokurtic – distribusi yang tinggi

1 00- 1 0

2 0 0 0

1 0 0 0

0

Y

Frequency

Kurtosis (Peakedness)

Formula :Ungrouped data :

Grouped data :

Note :α4 = 3 normal/mesokurtic

α4 = > 3 leptokurtic

α4 = < 3 platykurtic

( )4

4

4

1

s

XXn∑ −=α

( )4

4

4

1

s

XXfN∑ −=α

Peakedness for Grouped DataPenjualan f Xi f . Xi f (Xi - X ) ^4

20-<30 4 25 100.00 2,988,472.84

30-<40 7 35 245.00 991,527.95

40-<50 8 45 360.00 62,459.92

50-<60 12 55 660.00 1.56

60-<70 9 65 585.00 113,622.93

70-<80 8 75 600.00 1,440,651.28

80-<90 2 85 170.00 1,753,540.10

Total 50 2,720.00 7,350,276.56

( )15,2

18,16

56,276.350.7501

44 ==α

Kuarti l , Desil , dan Persentil

42

Fraktil adalah nilai-nilai data yang membagi seperangkat data yang telah terurut menjadi beberapa bagian yang sama.

Kuartil: membagi sekelompok observasi/ pengamatan yang telah diurutkan dari kecil ke besar menjadi 4 bagian yang sama.

(Q1: 25%, Q2: 50%, Q3: 75%)

Desil: membagi sekelompok observasi/ pengamatan yang telah diurutkan dari kecil ke besar menjadi 10 bagian yang sama.

Persentil: membagi sekelompok observasi/ pengamatan yang telah diurutkan dari kecil ke besar menjadi 100 bagian yang sama.

Lokasi Persentil

43

Lokasi persentil dapat ditentukan dengan rumus sbb:

Lp : Lokasi persentil yang dicarin : jumlah pengamatanP: Persentil yang dicari

100P1)(n=Lp +

Contoh 5

44

Quality Control pabrik selai kacang DK mencatat data berat 9 botol selai yang diproduksi dalam satu jam terakhir:

7,69 7,72 7,8 7,86 7,90 7,94 7,97 8,06 8,09

Tentukan Kuartil pertama.Tentukan Persentil ke-67.

Contoh 5 continued

45

7,69 7,72 7,8 7,86 7,90 7,94 7,97 8,06 8,09

Kuartil pertama:

Kuartil pertama berada pada urutan ke-2.5 (antara data ke-2 dan ke-3):

7,72 + [(7,8-7,72)*0.5)= 7,72 + 0.04 = 7.76

Persentil ke-67:

Persentil ke-67 berada pada urutan ke-6.70 (antara ke-6 & ke-7):

7,94 + [(7.97-7,94)*0.7]= 7.94 + 0.02 = 7.96

2.5100251)(9=L25 =+

+ =6767L = (9 1) 6.70

100

Untuk data yang dikelompokkan, urutan:

1. Susun Distribusi Frekuensi Kumulatif2. Tentukan Lokasi Persentil:

Lokasi Persentil Lp = n . P . 100

3. Gunakan formula sbb:

Persentil : P = L + ( n. P/100 - CF) . i fp

Pi = Persentil ke-i.L = Batas bawah kelas persentiln = Jumlah frekuensi.CF = Frekuensi kumulatif sebelum kelas Persentil f = Frekuensi kelas persentili = Interval kelas

ContohTentukan Kuartil pertama (P25) dari data berikut:

Lokasi Persentil: 10*25/100= 2.5 kelas 3-5P25 = 3 + [(2.5 – 1)/2] * 2

= 4.5

Jumlah f i lm yg diputar

Frekuensi Frekuensi Kumulat if

1 up t o 3 1 1

3 up t o 5 2 3

5 up t o 7 3 6

7 up t o 9 1 7

9 up t o 11 3 10

Jangkauan (Rentang) Interkuartil

48

Rentang interkuartil adalah jarak antara kuartil ketiga Q3 dan kuartil pertama Q1.

Rentang ini akan mencakup nilai tengah 50 persen dari pengamatan.

Rentang Interkuartil= Q3 - Q1

Contoh 6

49

Untuk sekelompok observasi, Q3 adalah 24 dan Q1 adalah 10. Berapa rentang kuartilnya?

Rentang interkuartil: 24 - 10 = 14. Lima puluh persen dari observasi berada antara 10 dan 24.

Others DispersionQuartile Deviation :

Coefficient of Quartile Variation :2

13 QQQ

−=δ

( )

dQ M

QQ

V 213 −

=13

13

QQ

QQVQ +

−=

Data ekstrim (outliers)

51

Data ekstrim: nilai yang tidak konsisten dengan keseluruhan data. Yakni data yang lebih besar dari 1,5 jangkauan interkuartil (Q3-Q1) dan lebih kecil dari Q1 atau lebih besar dari Q3.

Outlier (Ekstrim) kecil: x < Q1 – 1.5 (Q3-Q1)

Outlier (Ekstrim) besar: x > Q3 + 1.5 (Q3-Q1)

Contoh

Berikut ini data total pengeluaran mahasiswa selama 1 bulan (dalam ribuan):

Q1= 175, Q2= 350, Q3= 930, min: 0, Max: 1750

apakah ada outlier dalam data ini?

Outlier (Ekstrim) kecil:

x < 175 – 1.5 (930-175)

x < - 957.5Outlier (Ekstrim) besar:

x > 930 + 1.5 (930-175)

x > 2062.5

Oleh karena data min: 0 & max: 1750, maka tidak ada data outlier.

Box Plots

53

Box plot adalah tampilan grafis, yang didasarkan pada kuartil, yang membantu untuk menggambarkan satu set data.

Ada 5 data yang diperlukan untuk menyusun sebuah box plot:

1. Nilai Minimum,2. Kuartil Pertama, 3. Median, 4. Kuartil Ketiga, 5. Nilai Maksimum.

Contoh 7

54

Berdasarkan sampel dari 20 pengiriman, Buddy's Pizza memperoleh informasi berikut. Waktu pengiriman minimum adalah 13 menit dan maksimal 30 menit. Kuartil pertama adalah 15 menit, median 18 menit, dan kuartil ketiga 22 menit. Susun box plot untuk pengiriman tersebut.

Contoh 7 continued

55

12 14 16 18 20 22 24 26 28 30 32

min max

median

Q1 Q3

top related