per 1 (stat dasar)

50
1-1 Descriptive Statistics Using Statistics Percentiles dan Quartiles Penyajian Data Pengelompokkan Data dan Histogram Measures of Central Tendency (Ukuran Gejala Pusat) Measures of Variability Skewness and Kurtosis Hubungan antara Mean dan Standard Deviation Exploratory Data Analysis 1 1

Upload: faried-latief

Post on 13-Dec-2014

351 views

Category:

Data & Analytics


1 download

DESCRIPTION

statistik dasar broo

TRANSCRIPT

Page 1: Per 1 (stat dasar)

1-1

Descriptive Statistics

Using Statistics Percentiles dan Quartiles Penyajian Data Pengelompokkan Data dan Histogram Measures of Central Tendency (Ukuran Gejala Pusat) Measures of Variability Skewness and Kurtosis Hubungan antara Mean dan Standard Deviation Exploratory Data Analysis

11

Page 2: Per 1 (stat dasar)

1-2

LEARNING OBJECTIVES

Membedakana :qualitative data dan quantitative data. Menjelaskan Skala Pengukuran: nominal, ordinal, interval,

dan ratio . Menjelaskan perbedaan antara : populasi dan sampel. Menghitung dan menginterpretasikan kuantil. Menghitung dan menjelaskan Ukuran Gejala Pusat

(measures of central tendency) Menyajikan data melalui tabel dan grafik. Menggunakan Excel templates untuk menghitung

berbagai ukuran statistik dan membuat grafik.

11

Setelah mempelajari bagian ini diharapkan dapat :Setelah mempelajari bagian ini diharapkan dapat :

Page 3: Per 1 (stat dasar)

1-3

Statistics adalah suatu ilmu yg membantu kita untuk membuat keputusan yg terbaik.

Statistics mengajari kita bagaimana untuk meringkas, menganalisis, dan membuat kesimpulan berdasarkan data sehingga kita dapat membuat keputusan .

WHAT IS STATISTICSWHAT IS STATISTICS??

Page 4: Per 1 (stat dasar)

1-4

Pembagian Statistika

Inferential Statistics Memprediksi dan

meramalkan nilai parameter populasi

Pengujian Hipotesis untuk nilai parameter populasi

Membuat kesimpulan

Descriptive Statistics Mengumpulkan Mengorganisir Meringkas Menyajikan Menganalisis

Page 5: Per 1 (stat dasar)

1-5

Types of Data

Qualitative - Categorical atau Nominal: Contoh:WarnaGenderSuku bangsa

Quantitative - Measurable atau Countable (numerical): Contoh:TemperaturBesar GajiSkor Ujian

Page 6: Per 1 (stat dasar)

1-6

Skala Pengukuran

•Skala Nominal •Skala Ordinal •Skala Interval •Skala Ratio

Page 7: Per 1 (stat dasar)

1-7

Sampel dan Populasi

Populasi berisi suatu set seluruh pengukuran dari karakteristikn yang diteliti

Sample adalah bagian dari pengukuran yang dipilih dari populasinya

Sensus adalah pengamatan terhadap keseluruhan obyek penelitian dalam populasinya tanpa ada yang terlewat

Page 8: Per 1 (stat dasar)

1-8

Populasi (N)Populasi (N) Sampel (Sampel (nn))

Sampel dan Populasi

Page 9: Per 1 (stat dasar)

1-9

Presenting Data in

Tables and Charts

Page 10: Per 1 (stat dasar)

1-10

Organizing Categorical Data: Summary Table

A summary table menunjukkan frekuensi atau jumlah atau persentase dari setiap kategori sehingga dapat dibedakan satu sama lainnya.

How do you spend the holidays? Percent

At home with family 45%

Travel to visit family 38%

Vacation 5%

Catching up on work 5%

Other 7%

Page 11: Per 1 (stat dasar)

1-11

Melalui Bar chart /Diagram Batang frekuensi tiap kategori diperlihatkan berupa tinggi / panjang kurva .

How Do You Spend the Holidays?

45%

38%

5%

5%

7%

0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 50%

At home w ith family

Travel to visit family

Vacation

Catching up on w ork

Other

Page 12: Per 1 (stat dasar)

1-12

The pie chart / diagram lingkaran merupakan penyajian data kategori yang berupa persentase dimana untuk tiap kategorinya telah dikonversi ke sudut

geometris.

How Do You Spend the Holiday's

45%

38%

5%

5%7%

At home with family

Travel to visit family

Vacation

Catching up on work

Other

Page 13: Per 1 (stat dasar)

1-13

Bagaimana penyajian data untuk golongan darah dari 30 orang

berikut ini :O A A B B B A A A AB AB B B B A A A A O O O O AB O AB

AB AB O A O

Page 14: Per 1 (stat dasar)

1-14

Penyajian Data Numerik a. Diskrit b.Kontinu

dalam bentuk Tabel dan Grafik

Page 15: Per 1 (stat dasar)

1-15

1. Diketahui banyaknya karyawan yang tidak masuk kerja perhari di suatu perusahaan selama 20 hari

yang dipilih secara acak 2. Lama waktu yang diperlukan oleh 10 karyawan dalam menit

untuk menyelesaikan suatu pekerjaan

Page 16: Per 1 (stat dasar)

1-16

Catatan dalam Penyajian Data melalui Grafik

Page 17: Per 1 (stat dasar)

1-17

Graphical Errors: No Relative Basis

A’s received by students. A’s received by students.

Bad Presentation

0

200

300

FR SO JR SR

Freq.

10%

30%

FR SO JR SR

FR = Freshmen, SO = Sophomore, JR = Junior, SR = Senior

100

20%

0%

%

Good Presentation

Page 18: Per 1 (stat dasar)

1-18

Graphical Errors: No Zero Point on the Vertical Axis

Monthly Sales

36

39

42

45

J F M A M J

$

Graphing the first six months of sales

Monthly Sales

0

39

42

45

J F M A M J

$

36

Good PresentationsBad Presentation

Page 19: Per 1 (stat dasar)

1-19

Tabel Distribusi Frekuensi

Penyajian Data secara dikelompokkan dalam kelas interval

• Jumlah observasi– N untuk Populasi– n untuk sampel

Kelas midpoint atau Titik Tengah merupakan nilai tengah dari tiap kelas interval

Relative frequency adalah persentase dari tiap frekuensi dari tiap kelas intervalJumlah dari relative frequencies = 1

Page 20: Per 1 (stat dasar)

1-20

x f(x) f(x)/nSpending Class ($) Frequency (number of customers) Relative Frequency

0 to less than 100 30 0.163100 to less than 200 38 0.207200 to less than 300 50 0.272300 to less than 400 31 0.168400 to less than 500 22 0.120500 to less than 600 13 0.070

184 1.000

x f(x) f(x)/nSpending Class ($) Frequency (number of customers) Relative Frequency

0 to less than 100 30 0.163100 to less than 200 38 0.207200 to less than 300 50 0.272300 to less than 400 31 0.168400 to less than 500 22 0.120500 to less than 600 13 0.070

184 1.000

• Example of relative frequency: 30/184 = 0.163 • Sum of relative frequencies = 1

Contoh: Tabel Distribusi Frekuensi

Page 21: Per 1 (stat dasar)

1-21

Frequency Histogram

Contoh Histogram

Page 22: Per 1 (stat dasar)

1-22

Relative Frequency Histogram

Contoh Histogram

Page 23: Per 1 (stat dasar)

1-23

x F(x) F(x)/nSpending Class ($) Cumulative Frequency Cumulative Relative Frequency

Kurang dari 100 30 0.163 Kurang dari 200 68 0.370 Kurang dari 300 118 0.641 Kurang dari 400 149 0.810 Kurang dari 500 171 0.929 Kurang dari 600 184 1.000

x F(x) F(x)/nSpending Class ($) Cumulative Frequency Cumulative Relative Frequency

Kurang dari 100 30 0.163 Kurang dari 200 68 0.370 Kurang dari 300 118 0.641 Kurang dari 400 149 0.810 Kurang dari 500 171 0.929 Kurang dari 600 184 1.000

The cumulative frequency of each group is the sum of the frequencies of that and all preceding groups.

The cumulative frequency of each group is the sum of the frequencies of that and all preceding groups.

Cumulative Frequency Distribution

Page 24: Per 1 (stat dasar)

1-24

Relative Frequency Polygon Ogive

Frequency Polygon and Ogive

50403020100

0.3

0.2

0.1

0.0

Re

lativ

e F

req

ue

ncy

Sales50403020100

1.0

0.5

0.0

Cu

mu

lativ

e R

ela

tive

Fre

qu

en

cy

Sales

(Cumulative frequency or relative frequency graph)

Page 25: Per 1 (stat dasar)

1-25

Langkah-2 Menyajikan Data dalam Dist.Frekuensi:

1. Tentukan Range2. Tentukan banyak kelas Interval k3. Tentukan Panjang Kelas Interval = p = i Tentukan Kelas interval pertama

Page 26: Per 1 (stat dasar)

1-26

Contoh : Data di bawah ini menunjukkan masa hidup dari 30 lampu

pijar yang dipilih secara acak dari pabrik lampu pijar “G” 43 54 51 12 10 36 45 51 4323 24 36 41 45 48 50 61 7678 54 19 21 32 38 40 38 5028 25 36 (dalam puluhan jam)

Sajikan data di atas dalam : Tabel Distribusi Frekuensi - Tabel Distribusi Frekuensi Relatif- Tabel Distribusi Frekuensi Kumulatif – Tabel Distribusi Frekuensi Kumulatif Relatif

Sajikan Pula Dalam Grafik : Histogram – Polygon - OgiveApa yang terlihat pada Diagram Batang Daun ?Berikan interpretasi untuk semua hasil di atas.

Page 27: Per 1 (stat dasar)

1-27

Summary Measures: Population Parameters Sample Statistics

Measures of Variability Range Interquartile range Variance Standard Deviation

Measures of Central Tendency

MedianModusMean

Other summary measures:SkewnessKurtosis

Page 28: Per 1 (stat dasar)

1-28

Measures of Central TendencySummary

Central Tendency

Arithmetic Mean Median Mode Geometric Mean

n

XX

n

ii

1

n/1n21G )XXX(X

Middle value in the

ordered array

Most frequently

observed value

Page 29: Per 1 (stat dasar)

1-29

Contoh:

Misalkan diperoleh data sampel dari 20 mahasiswa , tentang lamanya waktu yg digunakan untuk browsing internet dalam satu bulan (jam) :

16,13,12,6, 16,10,9, 14,14,16,20,19,18,17,17,18, 21, 24,22,15

Buatkan diagram titiknya

Page 30: Per 1 (stat dasar)

1-30

Mean dari satu set observasi adalah nilai dari jumlah observasi dibagi dengan banyaknya observasi.

Population Mean Sample Mean

xNi

N

1 xx

ni

n

1

Arithmetic Mean or Average

Page 31: Per 1 (stat dasar)

1-31

xx

ni

n

1 31720

1585.

WKT 9 6 12 10 13 15 16 14 14 16 17 16 24 21 22 18 19 18 20 17

317

Contoh: – Mean

Page 32: Per 1 (stat dasar)

1-32

. . . . . . : . : : : . . . . . --------------------------------------------------------------- 6 9 10 12 13 14 15 16 17 18 19 20 21 22 24

. . . . . . : . : : : . . . . . --------------------------------------------------------------- 6 9 10 12 13 14 15 16 17 18 19 20 21 22 24

Mode = 16

The mode is the most frequently occurring value. It is the value with the highest frequency.

Contoh: Modus

Page 33: Per 1 (stat dasar)

1-33

. . . . . . : . : : : . . . . . --------------------------------------------------------------- 6 9 10 12 13 14 15 16 17 18 19 20 21 22 24

. . . . . . : . : : : . . . . . --------------------------------------------------------------- 6 9 10 12 13 14 15 16 17 18 19 20 21 22 24

Median and Mode = 16

Mean = 15.85

Mean dan Modus

Page 34: Per 1 (stat dasar)

1-34

Ukuran Variabilitas (Dispersion) Range

Perbedaan antara nilai terbesar dengan nilai terkecil

Interquartile RangePerbedaan antara Quartil atas dengan quartil

bawah (Q3 - Q1) Variance

Rata – rata kuadrat jarak dari data dengan mean Standard Deviation

Akar dari variance

Page 35: Per 1 (stat dasar)

1-35

Contoh: Misalkan diperoleh data tentang jumlah ketidak hadiran karyawan di tiga perusahaan selama delapan bulan sbbPerusahaan:A : 18, 21, 16, 16, 17, 13, 12, 11B : 15, 15, 15, 14, 17, 16, 16, 16C : 11, 11, 12, 11, 20, 20, 20, 19Bandingkan ketidak hadiran karyawan selama 8 bulan tersebut, berdasarkan : Mean, Modus, Median, Range, RAK dan Deviasi Standardnya.

Page 36: Per 1 (stat dasar)

1-36

Variance and Standard Deviation

( )

2

2

1

2

1

2

2

1

( )x

N

xN

N

i

N

i

N xi

N

Population Variance

sx x

n

xx

nn

s s

i

n

i

ni

n

2

2

1

2

1

2

2

1

1

1

( )

Sample Variance

( )

Page 37: Per 1 (stat dasar)

1-37

Skewness dan Kurtosis Skewness

– Measure of asymmetry of a frequency distribution

• Skewed to left• Symmetric or unskewed• Skewed to right

Kurtosis– Measure of flatness or peakedness of a

frequency distribution• Platykurtic (relatively flat)• Mesokurtic (normal)• Leptokurtic (relatively peaked)

Page 38: Per 1 (stat dasar)

1-38

Skewed to left

Skewness

Page 39: Per 1 (stat dasar)

1-39

Skewness

Symmetric

Page 40: Per 1 (stat dasar)

1-40

Skewness

Skewed to right

Page 41: Per 1 (stat dasar)

1-41

Kurtosis

Platykurtic - flat distribution

Page 42: Per 1 (stat dasar)

1-42

Kurtosis

Mesokurtic - not too flat and not too peaked

Page 43: Per 1 (stat dasar)

1-43

Kurtosis

Leptokurtic - peaked distribution

Page 44: Per 1 (stat dasar)

1-44

Hubungan antara Mean dan Standard Deviation

Chebyshev’s TheoremApplies to any distribution, regardless of shapePlaces lower limits on the percentages of

observations within a given number of standard deviations from the mean

Empirical RuleApplies only to roughly mound-shaped and

symmetric distributionsSpecifies approximate percentages of observations

within a given number of standard deviations from the mean

Page 45: Per 1 (stat dasar)

1-45

11

21

14

34

75%

11

31

19

89

89%

11

41

116

1516

94%

2

2

2

Chebyshev’s Theorem

Paling sedikit dari elemen/observasi suatu distribusi berada dalam k standard deviations dari mean

At least

Lie within

Standarddeviationsof the mean

2

3

4

21 1

k

Page 46: Per 1 (stat dasar)

1-46

68% 1 standard deviation of the mean

95% Lie within

2 standard deviations of the mean

All 3 standard deviations of the mean

Empirical Rule

Page 47: Per 1 (stat dasar)

1-47

OSAJJMAMFJDNOSAJJMAMFJDNOSAJJMAMFJ

8.5

7.5

6.5

5.5

Month

Mill

ions

of T

ons

M o nthly S te e l P ro d uc tio n

Time Plot

Page 48: Per 1 (stat dasar)

1-48

1-9 Exploratory Data Analysis - EDA

• Stem-and-Leaf Displays Quick-and-dirty listing of all observations Conveys some of the same information as a histogram

• Box Plots Median Lower and upper quartiles Maximum and minimum

Techniques to determine relationships and trends, identify outliers and influential observations, and quickly describe or summarize data sets.

Techniques to determine relationships and trends, identify outliers and influential observations, and quickly describe or summarize data sets.

Page 49: Per 1 (stat dasar)

1-49

1 122355567 2 0111222346777899 3 012457 4 11257 5 0236 6 02

1 122355567 2 0111222346777899 3 012457 4 11257 5 0236 6 02

Example 1-8: Stem-and-Leaf Display

Figure 1-17: Task Performance Times

Page 50: Per 1 (stat dasar)

1-50

X X *o

MedianQ1 Q3InnerFence

InnerFence

OuterFence

OuterFence

Interquartile Range

Smallest data point not below inner fence

Largest data point not exceeding inner fence

Suspected outlierOutlier

Q1-3(IQR)Q1-1.5(IQR) Q3+1.5(IQR)

Q3+3(IQR)

Elements of a Box PlotElements of a Box Plot

Box Plot