สถิติวิเคราะห 1 (statistical analysis i) ประชากร...
TRANSCRIPT
C2. การวิเคราะหขอมูลดวยสถิติเชิงพรรณนา
- การอธิบายขอมูล (Describing Data)1) Frequency and Graphic : Frequency Tables,
Frequency Distributions, and GraphicPresentation (C2)
2) Displaying and Exploring Data : Stem-and-Leaf Displays , Box Plots, Measures ofPosition, and Skewness and Kurtosis (C4)
3) Numerical Measures : Central Tendencyand Dispersion (C3)
วิชา SC611 001 หรือ 316 203สถิติวิเคราะห 1 (Statistical Analysis I)
ภาคปลายการศึกษา 60
C2. การวิเคราะหขอมูลดวยสถิติเชิงพรรณนา
- การอธิบายขอมูล (Describing Data)1) Frequency and Graphic : Frequency Tables,
Frequency Distributions, and GraphicPresentation (C2)
2) Displaying and Exploring Data : Stem-and-Leaf Displays , Box Plots, Measures ofPosition, and Skewness and Kurtosis (C4)
3) Numerical Measures : Central Tendencyand Dispersion (C3)
- Data Collection
1
C2. การวิเคราะหขอมูลดวยสถิติเชิงพรรณนา
- การอธิบายขอมูล (Describing Data)1) Frequency and Graphic : Frequency Tables,
Frequency Distributions, and GraphicPresentation (C2)
2) Displaying and Exploring Data : Stem-and-Leaf Displays , Box Plots, Measures ofPosition, and Skewness and Kurtosis (C4)
3) Numerical Measures : Central Tendencyand Dispersion (C3)
ChapterChapter22--ChapterChapter44Describing Data
ChapterChapter22--ChapterChapter44Describing Data
• ประชากร (Population) หมายถึง ...
ประชากรอาจจะมีลักษณะ ที่มีจํานวนแนนอน หรือไมแนนอนก็ได(FiniteFinite or Infiniteor Infinite?)?)
A population is finitefinite if it has a definite size, even if its size isunknown.
A population is infiniteinfinite if it is of arbitrarily large size Rule of Thumb: A population may be treated as infinite when
…
Data Collection
• กลุมตัวอยาง (Sample) หมายถึง สวนหนึ่งของประชากรที่นํามาศึกษาซึ่งตองเปนตัวแทนที่ดขีองประชากร การกําหนดขนาดตวัอยางที่เหมาะสม การเลือกตัวอยางหรือการสุมตัวอยาง ซึ่งเปนกระบวนการไดมาซึ่ง
กลุมตัวอยางที่เปนตัวแทนที่ดีของประชากร
ประชากรอาจจะมีลักษณะ ที่มีจํานวนแนนอน หรือไมแนนอนก็ได(FiniteFinite or Infiniteor Infinite?)?)
A population is finitefinite if it has a definite size, even if its size isunknown.
A population is infiniteinfinite if it is of arbitrarily large size Rule of Thumb: A population may be treated as infinite when
…
2
• กลุมตัวอยาง (Sample) หมายถึง สวนหนึ่งของประชากรที่นํามาศึกษาซึ่งตองเปนตัวแทนที่ดขีองประชากร การกําหนดขนาดตวัอยางที่เหมาะสม การเลือกตัวอยางหรือการสุมตัวอยาง ซึ่งเปนกระบวนการไดมาซึ่ง
กลุมตัวอยางที่เปนตัวแทนที่ดีของประชากร
A samplesample involves looking only at some itemsselected from the population.
A censuscensus is an examination of all items in a definedpopulation.
Sample or Census?Sample or Census?Data Collection ((ตอตอ))
A samplesample involves looking only at some itemsselected from the population.
A censuscensus is an examination of all items in a definedpopulation.
การสุมตัวอยางเหมาะกับกรณีการสุมตัวอยางเหมาะกับกรณีเหลานี้เหลานี้
3
Parameters and Statistics?Parameters and Statistics?
• พารามิเตอร (Parameter) หมายถึง ..
• ตัวสถิติ (statistic) คือ ...
StatisticStatistic are computed from a sample of n items,chosen from a population of N items.
Statistic can be used as estimates of parametersparametersfound in the population.
• พารามิเตอร (Parameter) หมายถึง ..
• ตัวสถิติ (statistic) คือ ...
4
StatisticStatistic are computed from a sample of n items,chosen from a population of N items.
Statistic can be used as estimates of parametersparametersfound in the population.
2-4
การอธิบายขอมูล (Describing Data)
- VisualVisual (charts and graphs) :: provides insight intocharacteristics of a data set without using mathematics.
- NumericalNumerical (statistics or tables) :: provides insight intocharacteristics of a data set using mathematics.
Methods of Organizing, Exploring and Summarizing Data Include:
- NumericalNumerical (statistics or tables) :: provides insight intocharacteristics of a data set using mathematics.
CharacteristicCharacteristic InterpretationInterpretation
MeasurementMeasurement •What are the units of measurement?•Are the data integer or continuous?•Any missing observations?•Any concerns with accuracy or sampling methods?
CentralCentralTendencyTendency
•Where are the data values concentrated?•What seem to be typical or middle data values?
5
CentralCentralTendencyTendency
•Where are the data values concentrated?•What seem to be typical or middle data values?
DispersionDispersion •How much variation is there in the data?•How spread out are the data values?•Are there unusual values?
ShapeShape •Are the data values distributed symmetrically?•Skewed? Sharply peaked? Flat? Bimodal?
1. Frequency and Graphic
Frequency Table : A grouping of qualitative data into mutuallyexclusive classes showing the number of observations in eachclass.
Qualitative VariablesTo transform raw or ungrouped datainto a meaningful form.
Frequency Table : A grouping of qualitative data into mutuallyexclusive classes showing the number of observations in eachclass.
แสดงจํานวนรถที่ขายไดในแตละ Location แสดงผลกําไรจากการขายรถ
ในเดือนที่ผานมา
6
FREQUENCY DISTRIBUTION :: A grouping of data into mutuallyexclusive classes showing the number of observations in each class.
Quantitative Variables
1. Frequency and Graphic (ตอ)
7
• Step 1: Decide on the number of classes.A useful recipe to determine the number of classes (k) is the “2 to the krule.” such that 2k > …. หรือ k = ….
• Step 2: Determine the class interval or width.1) หาคาพิสัย2) คํานวณความกวางของช้ัน
1. Frequency and Graphic (ตอ)
การสราง Frequency Table
• Step 1: Decide on the number of classes.A useful recipe to determine the number of classes (k) is the “2 to the krule.” such that 2k > …. หรือ k = ….
• Step 2: Determine the class interval or width.1) หาคาพิสัย2) คํานวณความกวางของช้ัน
• Step 3: Set the individual class limits
• Step 4: Tally the vehicle selling prices into the classes.• Step 5: Count the number of items in each class.
8
• Step 3: Set the individual class limits
• Step 4: Tally the vehicle selling prices into the classes.• Step 5: Count the number of items in each class.
Page30
ขอบเขตลาง
ขอบเขตบน
ขีดจํากดัลาง
ขีดจํากดับน Midpoint ความถี่ ความถี่
สัมพัทธ รอยละCumulative
ความถี่ รอยละ
1 82 11
1. Frequency and Graphic (ตอ)
2 113 234 385 456 327 198 4
180 1 100
โดย i = 1,2,3,…, 8
9
คาก่ึงกลางช้ัน = (ขีดจํากัดลาง+ขดีจํากัดบน)/2= (ขอบเขตลาง+ขอบเขตบน)/2
โดย i = 1,2,3,…, 8
Midpoint
1. Frequency and Graphic (ตอ)
SPSS : Recode
10
1. Frequency and Graphic (ตอ)SPSS : Frequency Histogram
RDATA1
8.07.06.05.04.03.02.01.0
RDATA1
Freq
uen
cy
50
40
30
20
10
0
Std. Dev = 1.63
Mean = 4.6
N = 180.00
RDATA1
8.07.06.05.04.03.02.01.0
RDATA1
Freq
uen
cy
50
40
30
20
10
0
Std. Dev = 1.63
Mean = 4.6
N = 180.00
RDATA1
8 4.4 4.4 4.411 6.1 6.1 10.623 12.8 12.8 23.338 21.1 21.1 44.445 25.0 25.0 69.432 17.8 17.8 87.219 10.6 10.6 97.84 2.2 2.2 100.0
180 100.0 100.0
1.002.003.004.005.006.007.008.00Total
ValidFrequency Percent Valid Percent
CumulativePercent
11
RDATA1
8.07.06.05.04.03.02.01.0
RDATA1
Freq
uen
cy
50
40
30
20
10
0
Std. Dev = 1.63
Mean = 4.6
N = 180.00
RDATA1
8.07.06.05.04.03.02.01.0
RDATA1
Freq
uen
cy
50
40
30
20
10
0
Std. Dev = 1.63
Mean = 4.6
N = 180.00
RDATA1
8 4.4 4.4 4.411 6.1 6.1 10.623 12.8 12.8 23.338 21.1 21.1 44.445 25.0 25.0 69.432 17.8 17.8 87.219 10.6 10.6 97.84 2.2 2.2 100.0
180 100.0 100.0
1.002.003.004.005.006.007.008.00Total
ValidFrequency Percent Valid Percent
CumulativePercent
ฮิสโตแกรม (Histogram) เปนการนําขอมูลจากตารางแจกแจงความถี่มาแสดงเปนภาพ โดยประกอบดวยแทงส่ีเหล่ียมผืนผา ในแกนนอนแบงออกเปนชวงๆ ความกวางของแตละชวงเทากับความกวางของชั้น จุดกึ่งกลางของแทงส่ีเหล่ียมแตละแทงเปนจุดกึ่งกลางของแตละชั้นความสูงของแทงส่ีเหล่ียมแตละแทงจะเปนความถี่ของแตละชั้น
1. Frequency and Graphic (ตอ)
data1
3200.0
3000.0
2800.0
2600.0
2400.0
2200.0
2000.0
1800.0
1600.0
1400.0
1200.0
1000.0
800.0
600.0
400.0
200.0
Histogram
Frequ
ency
30
20
10
0
Std. Dev = 643.63
Mean = 1843.2
N = 180.00
data1
3200.0
3000.0
2800.0
2600.0
2400.0
2200.0
2000.0
1800.0
1600.0
1400.0
1200.0
1000.0
800.0
600.0
400.0
200.0
Histogram
Frequ
ency
30
20
10
0
Std. Dev = 643.63
Mean = 1843.2
N = 180.00
12data1
3200.0
3000.0
2800.0
2600.0
2400.0
2200.0
2000.0
1800.0
1600.0
1400.0
1200.0
1000.0
800.0
600.0
400.0
200.0
Histogram
Frequ
ency
30
20
10
0
Std. Dev = 643.63
Mean = 1843.2
N = 180.00
data1
3200.0
3000.0
2800.0
2600.0
2400.0
2200.0
2000.0
1800.0
1600.0
1400.0
1200.0
1000.0
800.0
600.0
400.0
200.0
Histogram
Frequ
ency
30
20
10
0
Std. Dev = 643.63
Mean = 1843.2
N = 180.00
1. Frequency and Graphic (ตอ)SPSS : Explore Plot
data1
3200.0
3000.0
2800.0
2600.0
2400.0
2200.0
2000.0
1800.0
1600.0
1400.0
1200.0
1000.0
800.0
600.0
400.0
200.0
Histogram
Freq
uenc
y
30
20
10
0
Std. Dev = 643.63
Mean = 1843.2
N = 180.00
data1
3200.0
3000.0
2800.0
2600.0
2400.0
2200.0
2000.0
1800.0
1600.0
1400.0
1200.0
1000.0
800.0
600.0
400.0
200.0
Histogram
Freq
uenc
y
30
20
10
0
Std. Dev = 643.63
Mean = 1843.2
N = 180.00
13data1
3200.0
3000.0
2800.0
2600.0
2400.0
2200.0
2000.0
1800.0
1600.0
1400.0
1200.0
1000.0
800.0
600.0
400.0
200.0
Histogram
Freq
uenc
y
30
20
10
0
Std. Dev = 643.63
Mean = 1843.2
N = 180.00
data1
3200.0
3000.0
2800.0
2600.0
2400.0
2200.0
2000.0
1800.0
1600.0
1400.0
1200.0
1000.0
800.0
600.0
400.0
200.0
Histogram
Freq
uenc
y
30
20
10
0
Std. Dev = 643.63
Mean = 1843.2
N = 180.00
Descriptives
1843.167 47.973181748.501
1937.832
1856.1601882.500414256.6643.6277
294.003292.002998.00
860.0000-.243 .181-.217 .360
MeanLower BoundUpper Bound
95% ConfidenceInterval for Mean
5% Trimmed MeanMedianVarianceStd. DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosis
data1Statistic Std. Error
1. Frequency and Graphic (ตอ)Descriptives
1843.167 47.973181748.501
1937.832
1856.1601882.500414256.6643.6277
294.003292.002998.00
860.0000-.243 .181-.217 .360
MeanLower BoundUpper Bound
95% ConfidenceInterval for Mean
5% Trimmed MeanMedianVarianceStd. DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosis
data1Statistic Std. Error
180N =
data1
4000
3000
2000
1000
0
14180N =
data1
4000
3000
2000
1000
0
1. Frequency and Graphic (ตอ)
SPSS : Graphs Histogram
DATA
3200.0
3000.0
2800.0
2600.0
2400.0
2200.0
2000.0
1800.0
1600.0
1400.0
1200.0
1000.0
800.0
600.0
400.0
200.0
30
20
10
0
Std. Dev = 643.63
Mean = 1843.2
N = 180.00
15
DATA
3200.0
3000.0
2800.0
2600.0
2400.0
2200.0
2000.0
1800.0
1600.0
1400.0
1200.0
1000.0
800.0
600.0
400.0
200.0
30
20
10
0
Std. Dev = 643.63
Mean = 1843.2
N = 180.00
1) แผนภูมิแทง ( Bar Chart )- แผนภูมิแทงเชิงเดี่ยว (Simple Bar Chart )- แผนภูมิแทงเชิงซอน (Multiple Bar Chart )
2) แผนภูมิวงกลม( Pie Chart )
3) ฮิสโตแกรม (Histogram)
4) กราฟเสน- กราฟเสนเชิงเดี่ยว ( Simple Line Chart )- กราฟเสนเชิงซอน ( Multiple Line Chart )- รูปหลายเหล่ียมแหงความถี่ (Frequency Polygon)- กราฟความถี่สะสม(cumulative Frequency หรือ Ogive Curve)- กราฟเสนโคง (Smooth Curve หรอื Frequency Curve )
กราฟและแผนภูมิแบบตางๆ
1. Frequency and Graphic (ตอ)
1) แผนภูมิแทง ( Bar Chart )- แผนภูมิแทงเชิงเดี่ยว (Simple Bar Chart )- แผนภูมิแทงเชิงซอน (Multiple Bar Chart )
2) แผนภูมิวงกลม( Pie Chart )
3) ฮิสโตแกรม (Histogram)
4) กราฟเสน- กราฟเสนเชิงเดี่ยว ( Simple Line Chart )- กราฟเสนเชิงซอน ( Multiple Line Chart )- รูปหลายเหล่ียมแหงความถี่ (Frequency Polygon)- กราฟความถี่สะสม(cumulative Frequency หรือ Ogive Curve)- กราฟเสนโคง (Smooth Curve หรอื Frequency Curve )
16
1) แผนภูมิแทง ( Bar Chart )- แผนภูมิแทงเชิงเดี่ยว (Simple Bar Chart )- แผนภูมิแทงเชิงซอน (Multiple Bar Chart )
2) แผนภูมิวงกลม( Pie Chart )
3) ฮิสโตแกรม (Histogram)
4) กราฟเสน- กราฟเสนเชิงเดี่ยว ( Simple Line Chart )- กราฟเสนเชิงซอน ( Multiple Line Chart )- รูปหลายเหล่ียมแหงความถี่ (Frequency Polygon)- กราฟความถี่สะสม(cumulative Frequency หรือ Ogive Curve)- กราฟเสนโคง (Smooth Curve หรอื Frequency Curve )
BAR CHART : A graph that shows qualitative classes on thehorizontal axis and the class frequencies on the vertical axis. Theclass frequencies are proportional to the heights of the bars.
1. Frequency and Graphic (ตอ)
17
PIE CHART : A chart that shows the proportion or percentagethat each class represents of the total number of frequencies.
1. Frequency and Graphic (ตอ)
18
THE LINE GRAPH is a powerful visual tool for marketing,finance, and other areas. It is also useful in research involvinga correlation between two variable.
1. Frequency and Graphic (ตอ)
จํานวนของเสียใน 1 week
19
Frequency polygon
Cumulative frequencyหรือ Ogive curve
1. Frequency and Graphic (ตอ)
20
1. Frequency and Graphic (ตอ)
21
สรุปผลขอมูลโดยแสดงผลในรูปแบบของแผนที่ (Map)
1. Frequency and Graphic (ตอ)
22
2. Displaying and Exploring Data
STEM-AND-LEAF DISPLAY: A statistical technique to present aset of data.• Each numerical value is divided into two parts.• The leading digit(s) becomes the stem and the trailing digit the leaf.• The stems are located along the vertical axis, and the leaf values are
stacked against each other along the horizontal axis.
STEM-AND-LEAF DISPLAY: A statistical technique to present aset of data.• Each numerical value is divided into two parts.• The leading digit(s) becomes the stem and the trailing digit the leaf.• The stems are located along the vertical axis, and the leaf values are
stacked against each other along the horizontal axis.
23
ตําแหนงของ Me = [N+1]/2
ตําแหนงของ hinge = (ตําแหนง Me+1)/2
2. Displaying and Exploring DataA BOX PLOT is a graphical display, based on quartiles, that helps us picture a setof data. To construct a box plot, we need only five statistics: the minimum value,Q (the first quartile), the median, Q (the third quartile), and the maximum value.
* oo *
24
ฮินจ : Hinge ลาง Hinge บน
H-Spread = ฮินจบน - ฮินจลาง
Outer Fence
2. Displaying and Exploring Data
Inner Fence
25
Hinge ลาง Hinge บน
1 2 3 4 5 6 7 8 9 10 1120.1 20.3 22.1 22.2 23.4 23.9 27.1 27.1 31.1 31.1 36.7
12 13 14 15 16 17 18 19 20 21 2239.0 39.8 39.9 40.8 40.9 41.2 41.8 43.3 44.2 46.7 49.7
ตัวอยาง มีขอมูล 22 คา เรียงลําดับจากนอยไปหามาก
2. Displaying and Exploring Data
39.0 39.8 39.9 40.8 40.9 41.2 41.8 43.3 44.2 46.7 49.7
1. แบงขอมูลออกเปน 2 สวน (Med , Q2)
2. หาจุดกึ่งกลางของขอมูลทั้ง 2 สวน
26
4. หาแนวช้ันใน :
แนวช้ันนอก :
3. หา Q1 และ Q3 Q3-Q1=IQR= H-spread
1 2 3 4 5 6 7 8 9 10 1120.1 20.3 22.1 22.2 23.4 23.9 27.1 27.1 31.1 31.1 36.7
12 13 14 15 16 17 18 19 20 21 2239.0 39.8 39.9 40.8 40.9 41.2 41.8 43.3 44.2 46.7 49.7
27
28
3. Numerical Measures
1) การวัดตําแหนงการเปรียบเทียบ
เปอรเซนตไตล (Percentiles ) เปนการแบงขอมูลออกเปน 100 สวนเทาๆ กันเมื่อเรียงขอมูลตามลําดับจากคานอยไปหามาก หรือจากคามากไปหานอย มีจุดแบงอยู 99 จุด คือ P1, P2, P3, …,P99
P60 (เปอรเซ็นไทลที่ 0) หมายความวา มีขอมูลจํานวน 60% ของขอมูลทั้งหมดที่มีคาตํ่ากวา P60 และมีจํานวนขอมูลที่เหลืออีก 40% ของขอมูลทั้งหมดที่มีคามากกวา P60
P60 (เปอรเซ็นไทลที่ 0) หมายความวา มีขอมูลจํานวน 60% ของขอมูลทั้งหมดที่มีคาตํ่ากวา P60 และมีจํานวนขอมูลที่เหลืออีก 40% ของขอมูลทั้งหมดที่มีคามากกวา P60
9 9 9 10 12 12 12 15 17 18 20 23 50 50
29
ki100
p1nPosition
ทราบ p เชน ตองการทราบวา นร. ที่มี P60 มีคา GPA เปนเทาใดจาก นร. 200 คน
3. Numerical Measures (ตอ)
ki100
p1nPosition
ทราบ ขอมูล เชน นร. คนหนึ่งตองการทราบวา GPA ของตนนั้น มีคาPercentile เปนเทาใด จาก นร. 200 คน
30
100
p1nPosition
1. เรียงขอมูลหรือคาคะแนนจากนอยไปมาก
2. กําหนดคา Percentiles ที่ตองการหา เชน ตองการหา P65 p = 65จากนั้นระบุตําแหนงของขอมูลที่ตองการจากสูตร
ทราบ Percentiles ตองการคํานวณหาคาขอมูล
n= 10
ตัวอยาง 1 2 3 4 5 6 7 811 15 18 19 21 21 25 28
3. Numerical Measures (ตอ)
2. กําหนดคา Percentiles ที่ตองการหา เชน ตองการหา P65 p = 65จากนั้นระบุตําแหนงของขอมูลที่ตองการจากสูตร
31
3. จากขอมูลที่เรียงแลวในขอ 1. ใหดูวาตําแหนงที่ไดจากสูตร...ตรงกับขอมูลใด
3. Numerical Measures (ตอ)
32
• Quartiles (Q) เปนการแบงคาขอมูลออกเปน 4 สวนเทาๆ กัน
• Deciles (D) เปนการแบงขอมูลออกเปน 10 สวนเทาๆ กัน
Example :บริษัทรถยนต AA จําหนายรถยนตย่ีหอหนึ่ง ตองการใหเงินสมนาคุณแกพนักงานขาย 1 คนจาก 3 คน ที่มียอดขายรวม 5 ป อยูในระดบัแนวหนา ที่มีรายละเอียดในแตละป ตามตารางดานลาง ถาบริษัทจะใหเงินสมนาคุณแกพนักงานที่มียอดขายคงเสนคงวามากที่สุด จงหาวาพนักงานคนใดควรจะไดรับเงินสมนาคุณ
3. Numerical Measures
Example :บริษัทรถยนต AA จําหนายรถยนตย่ีหอหนึ่ง ตองการใหเงินสมนาคุณแกพนักงานขาย 1 คนจาก 3 คน ที่มียอดขายรวม 5 ป อยูในระดบัแนวหนา ที่มีรายละเอียดในแตละป ตามตารางดานลาง ถาบริษัทจะใหเงินสมนาคุณแกพนักงานที่มียอดขายคงเสนคงวามากที่สุด จงหาวาพนักงานคนใดควรจะไดรับเงินสมนาคุณ
Year Emp.1 Emp.2 Emp.31 74 80 772 80 75 793 72 69 724 75 75 765 78 80 75
ตัวอยางความแปรปรวน (Variance)
33
5 78 80 75
Mean 75.80 75.80 75.80ประชากร
Standardized Data andCoefficient of variation (CV)
Standardized Data andCoefficient of variation (CV)
Full Score 100 50Name Math Eng
AA 68.84 32.23
1. How do you thing about Score ofMath and Eng Subject?
2. How do you thing about studentname BB?
3. Numerical Measures (ตอ)
AA 68.84 32.23BB 75.56 41.54CC 69.24 49.22DD 79.74 46.61EE 80.87 23.74FF 60.38 39.80
MEAN 72.44 38.86S.D. 7.78 9.47
34
S.D. 7.78 9.47
คะแนนมาตรฐาน (Z)
สัมประสิทธิ์แหงการกระจายCoefficient of variation (CV)
ประชากร ตัวอยาง
2) Central Tendency
3. Numerical Measures (ตอ)
กรณีทีต่องการคาเพียงคาเดียว เพ่ือใชอธิบายขอมูลทั้งชุด สําหรับคากลางที่เปนตัวแทนของขอมูลทัง้ชุด ที่นิยมใช คือ
• คาเฉล่ียเลขคณติ (Mean)• มัธยฐาน (Median)• ฐานนิยม(Mode)
กรณีทีต่องการคาเพียงคาเดียว เพ่ือใชอธิบายขอมูลทั้งชุด สําหรับคากลางที่เปนตัวแทนของขอมูลทัง้ชุด ที่นิยมใช คือ
• คาเฉล่ียเลขคณติ (Mean)• มัธยฐาน (Median)• ฐานนิยม(Mode)
คาเฉล่ียเลขคณติ (Mean)
ประชากร 0XX
n
ii
n
ii MedX
คุณสมบัติของคาเฉล่ีย
35
ตัวอยาง
n
ii aX 2
aXY ii
ii aXY
ขีดจํากดัลาง
ขีดจํากดับน
ความถี่(f)
MidPoint(x) fx fx2
1 200-599 8
2 600-999 11
3 1000-1399 23
กรณีขอมูลจัดเปนหมวดหมู3. Numerical Measures (ตอ)
4 1400-1799 38
5 1800-2199 45
6 2200-2599 32
7 2600-2999 19
8 3000-3399 4รวม 180
โดย i = 1,2,3,…, 8
36
สวนเบ่ียงเบนมาตราฐาน (Standard Deviation)
คือ รากที่ 2 ของคาความแปรปรวน
3. Numerical Measures (ตอ)
3) การวัดการกระจาย (Measures of Dispersion)
ความแปรปรวน (Variance)
คือ รากที่ 2 ของคาความแปรปรวน
สวนเบ่ียงเบนควอไทล (Inter Quartile Range: IQR)
สัมประสิทธิ์ความแปรผัน (CV)
37
สวนเบ่ียงเบนควอไทล (Inter Quartile Range: IQR)
สวนเบ่ียงเบน Quartile
พิสัย (Range) =
คาเฉล่ียถวงน้ําหนัก (Weighted mean)
กรณีที่สนใจใหน้ําหนักกับแตละหนวยแตกตางกนั
ตัวอยาง การคํานวณ GPA
3. Numerical Measures (ตอ)
2) คากลางแบบ อ่ืนๆ
iiw
n
1iiXiw
ตัวอยาง การคํานวณ GPA
ไดเกรดXi
หนวยกิตWi
Wi*Xi
วิชาที่ 1 A =4 3
วิชาที่ 2 B=3 2
วิชาที่ 3 D=1 3
38
วิชาที่ 3 D=1 3
รวม 8
มัธยฐาน (Median)
• เปนคาที่อยูในตําแหนงที่แบงขอมูลออกเปนสองสวนเทาๆ กัน ซ่ึงจะเปนคาในตําแหนงก่ึงกลางของการแจกแจง หรือเปนคา P50 หรือ Q2
• นั่นคือ มีขอมูลมากกวามัธยฐาน 50% มีขอมูลนอยกวามัธยฐาน 50%• ดังนั้นเมื่อเรียงลําดับขอมูลแลวคาฐาน จะอยู ณ ตําแหนงที่ (n+1)/2 ในกรณีที่จํานวนขอมูลเปนเลขค่ี มัธยฐานคือคาของขอมูลที่อยูก่ึงกลาง แตถาจํานวนขอมูลเปนเลขคู มัธยฐานจะเทากับคาเฉลี่ยของ 2 จํานวนที่อยูตรง
กลาง
3. Numerical Measures (ตอ)
ตัวอยาง จากการสํารวจพบวาราคาขาวพันธุ A และ B บาทตอกิโลกรัม ที่ขายอยูตามรานคาตางๆ ในทองตลาดเปนดังนี้
• เปนคาที่อยูในตําแหนงที่แบงขอมูลออกเปนสองสวนเทาๆ กัน ซ่ึงจะเปนคาในตําแหนงก่ึงกลางของการแจกแจง หรือเปนคา P50 หรือ Q2
• นั่นคือ มีขอมูลมากกวามัธยฐาน 50% มีขอมูลนอยกวามัธยฐาน 50%• ดังนั้นเมื่อเรียงลําดับขอมูลแลวคาฐาน จะอยู ณ ตําแหนงที่ (n+1)/2 ในกรณีที่จํานวนขอมูลเปนเลขค่ี มัธยฐานคือคาของขอมูลที่อยูก่ึงกลาง แตถาจํานวนขอมูลเปนเลขคู มัธยฐานจะเทากับคาเฉลี่ยของ 2 จํานวนที่อยูตรง
กลาง
รานคา 1 2 3 4 5 6 7พันธุ A 11 11 12 13 15 15 30
39
พันธุ A 11 11 12 13 15 15 30
พันธุ B 9 16 18 19 20 22
บาทตอกิโลกรัม
ฐานนิยม (Mode)
คือ คาของขอมูลที่มีความถี่สูงสุดในชุดนั้น หรืออคาที่เกดิขึน้บอยที่สุดในจํานวนชุดของขอมูลทั้งหมด
ตัวอยาง ราคาขาวพันธุ AA ที่ขายอยูตามรานคาตางๆ ในทองตลาดราคาตอกิโลกรัมเทากับ 12 10 11 13 12 13 12
3. Numerical Measures (ตอ)
ตัวอยาง ราคาขาวพันธุ AA ที่ขายอยูตามรานคาตางๆ ในทองตลาดราคาตอกิโลกรัมเทากับ 12 10 11 13 12 13 12
ความสัมพันธระหวาง Mean Mode และ Median
40
คาเฉลี่ยเลขคณิต ควรใชเม่ือใด1. ขอมูลอยูในระดับมาตรอันตรภาคหรอืมาตรอัตราสวน ขอมูลมีการ
กระจายไมมากนัก2. การแจกแจงของขอมูลมีลักษณะสมมาตร3. คาเฉล่ียจะไมใชคากลางที่ดี ถามีคาผิดปกติไปมาก (คาที่สูงเกินไปมากๆ
หรือคาที่ต่าํเกินไปมากๆ
3. Numerical Measures (ตอ)
มัธยฐาน ควรใชเม่ือใด1.ขอมูลอยูในระดับมาตรอันตรภาคหรอืสูงกวา2.คามัธยฐานจะไมถูกกระทบกระเทือน หากมีขอมูลที่มีคาสูงหรอืต่ําผิดปกติ3. เม่ือขอมูลมีลักษณะไมสมมาตร เชน ขอมูลเบซายหรือเบขวา
ฐานนิยม ควรใชเม่ือใด1. สามารถใชไดกับขอมูลเชิงคุณภาพและเชิงปริมาณ2. วัตถุประสงคของการรวบรวมขอมูลนั้น ตองการทราบคาตัวแทนของขอมูล
อยางรวดเร็วและตองการผลเพียงคราวๆ3. ขอมูลบางชุดอาจมีฐานนิยมมากกวา 1 คา โดยที่ฐานนิยมนั้นอาจแตกตาง
กันมาก4. ฐานนิยมจะไมถูกกระทบกระเทือนหากมีขอมูลที่มีคาสูงหรอืต่ําผิดปกติ
คาเฉลี่ยเลขคณิต ควรใชเม่ือใด1. ขอมูลอยูในระดับมาตรอันตรภาคหรอืมาตรอัตราสวน ขอมูลมีการ
กระจายไมมากนัก2. การแจกแจงของขอมูลมีลักษณะสมมาตร3. คาเฉล่ียจะไมใชคากลางที่ดี ถามีคาผิดปกติไปมาก (คาที่สูงเกินไปมากๆ
หรือคาที่ต่าํเกินไปมากๆ
41
มัธยฐาน ควรใชเม่ือใด1.ขอมูลอยูในระดับมาตรอันตรภาคหรอืสูงกวา2.คามัธยฐานจะไมถูกกระทบกระเทือน หากมีขอมูลที่มีคาสูงหรอืต่ําผิดปกติ3. เม่ือขอมูลมีลักษณะไมสมมาตร เชน ขอมูลเบซายหรือเบขวา
ฐานนิยม ควรใชเม่ือใด1. สามารถใชไดกับขอมูลเชิงคุณภาพและเชิงปริมาณ2. วัตถุประสงคของการรวบรวมขอมูลนั้น ตองการทราบคาตัวแทนของขอมูล
อยางรวดเร็วและตองการผลเพียงคราวๆ3. ขอมูลบางชุดอาจมีฐานนิยมมากกวา 1 คา โดยที่ฐานนิยมนั้นอาจแตกตาง
กันมาก4. ฐานนิยมจะไมถูกกระทบกระเทือนหากมีขอมูลที่มีคาสูงหรอืต่ําผิดปกติ
มัชฌิมฮารโมนิค (Harmonic Mean)
• ในกรณีที่กลุมตัวอยางแตละกลุมมีจํานวนไมเทากัน
• นอกจากนี้ยังใชในการคํานวณหาความเรว็เฉล่ีย เม่ือระยะทางในการเปล่ียนความเร็วมีชวงเทา ๆ กัน
3. Numerical Measures (ตอ)
มัชฌิมเรขาคณติ (Geometric Mean)
• ในกรณีที่กลุมตัวอยางแตละกลุมมีจํานวนไมเทากัน
• นอกจากนี้ยังใชในการคํานวณหาความเรว็เฉล่ีย เม่ือระยะทางในการเปล่ียนความเร็วมีชวงเทา ๆ กัน
• ขอมูลที่อยูในรูปของอนุกรมที่เปล่ียนแปลงไปในอัตราที่กําหนด
• อัตราสวนหรอืเลขดัชนีทางเศรษฐศาสตร
Ex. ความเรว็ของรถในการเดินทาง , ราคาส่ิงของในแตละเดือน ตองการหาคาเฉล่ีย
42
• ขอมูลที่อยูในรูปของอนุกรมที่เปล่ียนแปลงไปในอัตราที่กําหนด
• อัตราสวนหรอืเลขดัชนีทางเศรษฐศาสตร
Ex. อัตราเงินเฟอในแตละป มีคาเปนรอยละ และตองการหาคาเฉล่ีย
สัดสวน /รอยละกรณีทีข่อมูลเปนขอมูลเชิงคุณภาพหรือขอมูลทีมี่คําตอบที่เปนไปไดเพียง 2 ทางหรือจัดกลุมคําตอบออกเปน 2 กลุมที่สนใจ
ตัวอยาง ในการสํารวจความเห็นของนักศึกษาป 1 วา เห็นดวยกับกิจกรรมการรับนองใหมหรือไม โดยมีคาํตอบมีเพียง 2 ทางเลือก คือ ไมเห็นดวย กับเห็นดวย
3. Numerical Measures (ตอ)
ตัวอยาง ในการสํารวจความเห็นของนักศึกษาป 1 วา เห็นดวยกับกิจกรรมการรับนองใหมหรือไม โดยมีคาํตอบมีเพียง 2 ทางเลือก คือ ไมเห็นดวย กับเห็นดวย
ตัวอยาง เจาของโรงงานผลิตคุกกี้แหงหนึ่ง ตองการทราบวา เม่ือลงทุนโฆษณาคุกกี้ของตนใน จ .ขอนแกน แลวผลเปนอยางไร มีคนรูจักมากเพียงใด
ถาเก็บหนวยตัวอยางมา 300 คนมี นศ.ที่เห็นดวยจํานวน 230 คน
43
เจาของโรงงานผลิตคุกกี้แหงหนึ่ง ตองการทราบวา เม่ือลงทุนโฆษณาคุกกี้ของตนใน จ .ขอนแกน แลวผลเปนอยางไร มีคนรูจักมากเพียงใด
ถาเก็บหนวยตัวอยางมา 380 คน มีคนรูจักและซือ้คุกกี้ย้ีหอนี้จํานวน 200 คน