per 1 (stat dasar)
DESCRIPTION
statistik dasar brooTRANSCRIPT
1-1
Descriptive Statistics
Using Statistics Percentiles dan Quartiles Penyajian Data Pengelompokkan Data dan Histogram Measures of Central Tendency (Ukuran Gejala Pusat) Measures of Variability Skewness and Kurtosis Hubungan antara Mean dan Standard Deviation Exploratory Data Analysis
11
1-2
LEARNING OBJECTIVES
Membedakana :qualitative data dan quantitative data. Menjelaskan Skala Pengukuran: nominal, ordinal, interval,
dan ratio . Menjelaskan perbedaan antara : populasi dan sampel. Menghitung dan menginterpretasikan kuantil. Menghitung dan menjelaskan Ukuran Gejala Pusat
(measures of central tendency) Menyajikan data melalui tabel dan grafik. Menggunakan Excel templates untuk menghitung
berbagai ukuran statistik dan membuat grafik.
11
Setelah mempelajari bagian ini diharapkan dapat :Setelah mempelajari bagian ini diharapkan dapat :
1-3
Statistics adalah suatu ilmu yg membantu kita untuk membuat keputusan yg terbaik.
Statistics mengajari kita bagaimana untuk meringkas, menganalisis, dan membuat kesimpulan berdasarkan data sehingga kita dapat membuat keputusan .
WHAT IS STATISTICSWHAT IS STATISTICS??
1-4
Pembagian Statistika
Inferential Statistics Memprediksi dan
meramalkan nilai parameter populasi
Pengujian Hipotesis untuk nilai parameter populasi
Membuat kesimpulan
Descriptive Statistics Mengumpulkan Mengorganisir Meringkas Menyajikan Menganalisis
1-5
Types of Data
Qualitative - Categorical atau Nominal: Contoh:WarnaGenderSuku bangsa
Quantitative - Measurable atau Countable (numerical): Contoh:TemperaturBesar GajiSkor Ujian
1-6
Skala Pengukuran
•Skala Nominal •Skala Ordinal •Skala Interval •Skala Ratio
1-7
Sampel dan Populasi
Populasi berisi suatu set seluruh pengukuran dari karakteristikn yang diteliti
Sample adalah bagian dari pengukuran yang dipilih dari populasinya
Sensus adalah pengamatan terhadap keseluruhan obyek penelitian dalam populasinya tanpa ada yang terlewat
1-8
Populasi (N)Populasi (N) Sampel (Sampel (nn))
Sampel dan Populasi
1-9
Presenting Data in
Tables and Charts
1-10
Organizing Categorical Data: Summary Table
A summary table menunjukkan frekuensi atau jumlah atau persentase dari setiap kategori sehingga dapat dibedakan satu sama lainnya.
How do you spend the holidays? Percent
At home with family 45%
Travel to visit family 38%
Vacation 5%
Catching up on work 5%
Other 7%
1-11
Melalui Bar chart /Diagram Batang frekuensi tiap kategori diperlihatkan berupa tinggi / panjang kurva .
How Do You Spend the Holidays?
45%
38%
5%
5%
7%
0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 50%
At home w ith family
Travel to visit family
Vacation
Catching up on w ork
Other
1-12
The pie chart / diagram lingkaran merupakan penyajian data kategori yang berupa persentase dimana untuk tiap kategorinya telah dikonversi ke sudut
geometris.
How Do You Spend the Holiday's
45%
38%
5%
5%7%
At home with family
Travel to visit family
Vacation
Catching up on work
Other
1-13
Bagaimana penyajian data untuk golongan darah dari 30 orang
berikut ini :O A A B B B A A A AB AB B B B A A A A O O O O AB O AB
AB AB O A O
1-14
Penyajian Data Numerik a. Diskrit b.Kontinu
dalam bentuk Tabel dan Grafik
1-15
1. Diketahui banyaknya karyawan yang tidak masuk kerja perhari di suatu perusahaan selama 20 hari
yang dipilih secara acak 2. Lama waktu yang diperlukan oleh 10 karyawan dalam menit
untuk menyelesaikan suatu pekerjaan
1-16
Catatan dalam Penyajian Data melalui Grafik
1-17
Graphical Errors: No Relative Basis
A’s received by students. A’s received by students.
Bad Presentation
0
200
300
FR SO JR SR
Freq.
10%
30%
FR SO JR SR
FR = Freshmen, SO = Sophomore, JR = Junior, SR = Senior
100
20%
0%
%
Good Presentation
1-18
Graphical Errors: No Zero Point on the Vertical Axis
Monthly Sales
36
39
42
45
J F M A M J
$
Graphing the first six months of sales
Monthly Sales
0
39
42
45
J F M A M J
$
36
Good PresentationsBad Presentation
1-19
Tabel Distribusi Frekuensi
Penyajian Data secara dikelompokkan dalam kelas interval
• Jumlah observasi– N untuk Populasi– n untuk sampel
Kelas midpoint atau Titik Tengah merupakan nilai tengah dari tiap kelas interval
Relative frequency adalah persentase dari tiap frekuensi dari tiap kelas intervalJumlah dari relative frequencies = 1
1-20
x f(x) f(x)/nSpending Class ($) Frequency (number of customers) Relative Frequency
0 to less than 100 30 0.163100 to less than 200 38 0.207200 to less than 300 50 0.272300 to less than 400 31 0.168400 to less than 500 22 0.120500 to less than 600 13 0.070
184 1.000
x f(x) f(x)/nSpending Class ($) Frequency (number of customers) Relative Frequency
0 to less than 100 30 0.163100 to less than 200 38 0.207200 to less than 300 50 0.272300 to less than 400 31 0.168400 to less than 500 22 0.120500 to less than 600 13 0.070
184 1.000
• Example of relative frequency: 30/184 = 0.163 • Sum of relative frequencies = 1
Contoh: Tabel Distribusi Frekuensi
1-21
Frequency Histogram
Contoh Histogram
1-22
Relative Frequency Histogram
Contoh Histogram
1-23
x F(x) F(x)/nSpending Class ($) Cumulative Frequency Cumulative Relative Frequency
Kurang dari 100 30 0.163 Kurang dari 200 68 0.370 Kurang dari 300 118 0.641 Kurang dari 400 149 0.810 Kurang dari 500 171 0.929 Kurang dari 600 184 1.000
x F(x) F(x)/nSpending Class ($) Cumulative Frequency Cumulative Relative Frequency
Kurang dari 100 30 0.163 Kurang dari 200 68 0.370 Kurang dari 300 118 0.641 Kurang dari 400 149 0.810 Kurang dari 500 171 0.929 Kurang dari 600 184 1.000
The cumulative frequency of each group is the sum of the frequencies of that and all preceding groups.
The cumulative frequency of each group is the sum of the frequencies of that and all preceding groups.
Cumulative Frequency Distribution
1-24
Relative Frequency Polygon Ogive
Frequency Polygon and Ogive
50403020100
0.3
0.2
0.1
0.0
Re
lativ
e F
req
ue
ncy
Sales50403020100
1.0
0.5
0.0
Cu
mu
lativ
e R
ela
tive
Fre
qu
en
cy
Sales
(Cumulative frequency or relative frequency graph)
1-25
Langkah-2 Menyajikan Data dalam Dist.Frekuensi:
1. Tentukan Range2. Tentukan banyak kelas Interval k3. Tentukan Panjang Kelas Interval = p = i Tentukan Kelas interval pertama
1-26
Contoh : Data di bawah ini menunjukkan masa hidup dari 30 lampu
pijar yang dipilih secara acak dari pabrik lampu pijar “G” 43 54 51 12 10 36 45 51 4323 24 36 41 45 48 50 61 7678 54 19 21 32 38 40 38 5028 25 36 (dalam puluhan jam)
Sajikan data di atas dalam : Tabel Distribusi Frekuensi - Tabel Distribusi Frekuensi Relatif- Tabel Distribusi Frekuensi Kumulatif – Tabel Distribusi Frekuensi Kumulatif Relatif
Sajikan Pula Dalam Grafik : Histogram – Polygon - OgiveApa yang terlihat pada Diagram Batang Daun ?Berikan interpretasi untuk semua hasil di atas.
1-27
Summary Measures: Population Parameters Sample Statistics
Measures of Variability Range Interquartile range Variance Standard Deviation
Measures of Central Tendency
MedianModusMean
Other summary measures:SkewnessKurtosis
1-28
Measures of Central TendencySummary
Central Tendency
Arithmetic Mean Median Mode Geometric Mean
n
XX
n
ii
1
n/1n21G )XXX(X
Middle value in the
ordered array
Most frequently
observed value
1-29
Contoh:
Misalkan diperoleh data sampel dari 20 mahasiswa , tentang lamanya waktu yg digunakan untuk browsing internet dalam satu bulan (jam) :
16,13,12,6, 16,10,9, 14,14,16,20,19,18,17,17,18, 21, 24,22,15
Buatkan diagram titiknya
1-30
Mean dari satu set observasi adalah nilai dari jumlah observasi dibagi dengan banyaknya observasi.
Population Mean Sample Mean
xNi
N
1 xx
ni
n
1
Arithmetic Mean or Average
1-31
xx
ni
n
1 31720
1585.
WKT 9 6 12 10 13 15 16 14 14 16 17 16 24 21 22 18 19 18 20 17
317
Contoh: – Mean
1-32
. . . . . . : . : : : . . . . . --------------------------------------------------------------- 6 9 10 12 13 14 15 16 17 18 19 20 21 22 24
. . . . . . : . : : : . . . . . --------------------------------------------------------------- 6 9 10 12 13 14 15 16 17 18 19 20 21 22 24
Mode = 16
The mode is the most frequently occurring value. It is the value with the highest frequency.
Contoh: Modus
1-33
. . . . . . : . : : : . . . . . --------------------------------------------------------------- 6 9 10 12 13 14 15 16 17 18 19 20 21 22 24
. . . . . . : . : : : . . . . . --------------------------------------------------------------- 6 9 10 12 13 14 15 16 17 18 19 20 21 22 24
Median and Mode = 16
Mean = 15.85
Mean dan Modus
1-34
Ukuran Variabilitas (Dispersion) Range
Perbedaan antara nilai terbesar dengan nilai terkecil
Interquartile RangePerbedaan antara Quartil atas dengan quartil
bawah (Q3 - Q1) Variance
Rata – rata kuadrat jarak dari data dengan mean Standard Deviation
Akar dari variance
1-35
Contoh: Misalkan diperoleh data tentang jumlah ketidak hadiran karyawan di tiga perusahaan selama delapan bulan sbbPerusahaan:A : 18, 21, 16, 16, 17, 13, 12, 11B : 15, 15, 15, 14, 17, 16, 16, 16C : 11, 11, 12, 11, 20, 20, 20, 19Bandingkan ketidak hadiran karyawan selama 8 bulan tersebut, berdasarkan : Mean, Modus, Median, Range, RAK dan Deviasi Standardnya.
1-36
Variance and Standard Deviation
( )
2
2
1
2
1
2
2
1
( )x
N
xN
N
i
N
i
N xi
N
Population Variance
sx x
n
xx
nn
s s
i
n
i
ni
n
2
2
1
2
1
2
2
1
1
1
( )
Sample Variance
( )
1-37
Skewness dan Kurtosis Skewness
– Measure of asymmetry of a frequency distribution
• Skewed to left• Symmetric or unskewed• Skewed to right
Kurtosis– Measure of flatness or peakedness of a
frequency distribution• Platykurtic (relatively flat)• Mesokurtic (normal)• Leptokurtic (relatively peaked)
1-38
Skewed to left
Skewness
1-39
Skewness
Symmetric
1-40
Skewness
Skewed to right
1-41
Kurtosis
Platykurtic - flat distribution
1-42
Kurtosis
Mesokurtic - not too flat and not too peaked
1-43
Kurtosis
Leptokurtic - peaked distribution
1-44
Hubungan antara Mean dan Standard Deviation
Chebyshev’s TheoremApplies to any distribution, regardless of shapePlaces lower limits on the percentages of
observations within a given number of standard deviations from the mean
Empirical RuleApplies only to roughly mound-shaped and
symmetric distributionsSpecifies approximate percentages of observations
within a given number of standard deviations from the mean
1-45
11
21
14
34
75%
11
31
19
89
89%
11
41
116
1516
94%
2
2
2
Chebyshev’s Theorem
Paling sedikit dari elemen/observasi suatu distribusi berada dalam k standard deviations dari mean
At least
Lie within
Standarddeviationsof the mean
2
3
4
21 1
k
1-46
68% 1 standard deviation of the mean
95% Lie within
2 standard deviations of the mean
All 3 standard deviations of the mean
Empirical Rule
1-47
OSAJJMAMFJDNOSAJJMAMFJDNOSAJJMAMFJ
8.5
7.5
6.5
5.5
Month
Mill
ions
of T
ons
M o nthly S te e l P ro d uc tio n
Time Plot
1-48
1-9 Exploratory Data Analysis - EDA
• Stem-and-Leaf Displays Quick-and-dirty listing of all observations Conveys some of the same information as a histogram
• Box Plots Median Lower and upper quartiles Maximum and minimum
Techniques to determine relationships and trends, identify outliers and influential observations, and quickly describe or summarize data sets.
Techniques to determine relationships and trends, identify outliers and influential observations, and quickly describe or summarize data sets.
1-49
1 122355567 2 0111222346777899 3 012457 4 11257 5 0236 6 02
1 122355567 2 0111222346777899 3 012457 4 11257 5 0236 6 02
Example 1-8: Stem-and-Leaf Display
Figure 1-17: Task Performance Times
1-50
X X *o
MedianQ1 Q3InnerFence
InnerFence
OuterFence
OuterFence
Interquartile Range
Smallest data point not below inner fence
Largest data point not exceeding inner fence
Suspected outlierOutlier
Q1-3(IQR)Q1-1.5(IQR) Q3+1.5(IQR)
Q3+3(IQR)
Elements of a Box PlotElements of a Box Plot
Box Plot