สถิติวิเคราะห 1 (statistical analysis i) ประชากร...

43
วิชา SC611 001 หรือ 316 203 สถิติวิเคราะห 1 (Statistical Analysis I) ภาคปลายการศึกษา 60 C2. การวิเคราะหขอมูลดวยสถิติเชิงพรรณนา - อธิบายขอมูล (Describing Data) 1) Frequency and Graphic : Frequency Tables, Frequency Distributions, and Graphic Presentation (C2) 2) Displaying and Exploring Data : Stem-and- - Data Collection 1 2) Displaying and Exploring Data : Stem-and- Leaf Displays , Box Plots, Measures of Position, and Skewness and Kurtosis (C4) 3) Numerical Measures : Central Tendency and Dispersion (C3) Chapter Chapter2-Chapter Chapter4 Describing Data

Upload: lamkhue

Post on 29-Mar-2018

228 views

Category:

Documents


7 download

TRANSCRIPT

Page 1: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

C2. การวิเคราะหขอมูลดวยสถิติเชิงพรรณนา

- การอธิบายขอมูล (Describing Data)1) Frequency and Graphic : Frequency Tables,

Frequency Distributions, and GraphicPresentation (C2)

2) Displaying and Exploring Data : Stem-and-Leaf Displays , Box Plots, Measures ofPosition, and Skewness and Kurtosis (C4)

3) Numerical Measures : Central Tendencyand Dispersion (C3)

วิชา SC611 001 หรือ 316 203สถิติวิเคราะห 1 (Statistical Analysis I)

ภาคปลายการศึกษา 60

C2. การวิเคราะหขอมูลดวยสถิติเชิงพรรณนา

- การอธิบายขอมูล (Describing Data)1) Frequency and Graphic : Frequency Tables,

Frequency Distributions, and GraphicPresentation (C2)

2) Displaying and Exploring Data : Stem-and-Leaf Displays , Box Plots, Measures ofPosition, and Skewness and Kurtosis (C4)

3) Numerical Measures : Central Tendencyand Dispersion (C3)

- Data Collection

1

C2. การวิเคราะหขอมูลดวยสถิติเชิงพรรณนา

- การอธิบายขอมูล (Describing Data)1) Frequency and Graphic : Frequency Tables,

Frequency Distributions, and GraphicPresentation (C2)

2) Displaying and Exploring Data : Stem-and-Leaf Displays , Box Plots, Measures ofPosition, and Skewness and Kurtosis (C4)

3) Numerical Measures : Central Tendencyand Dispersion (C3)

ChapterChapter22--ChapterChapter44Describing Data

ChapterChapter22--ChapterChapter44Describing Data

Page 2: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

• ประชากร (Population) หมายถึง ...

ประชากรอาจจะมีลักษณะ ที่มีจํานวนแนนอน หรือไมแนนอนก็ได(FiniteFinite or Infiniteor Infinite?)?)

A population is finitefinite if it has a definite size, even if its size isunknown.

A population is infiniteinfinite if it is of arbitrarily large size Rule of Thumb: A population may be treated as infinite when

Data Collection

• กลุมตัวอยาง (Sample) หมายถึง สวนหนึ่งของประชากรที่นํามาศึกษาซึ่งตองเปนตัวแทนที่ดขีองประชากร การกําหนดขนาดตวัอยางที่เหมาะสม การเลือกตัวอยางหรือการสุมตัวอยาง ซึ่งเปนกระบวนการไดมาซึ่ง

กลุมตัวอยางที่เปนตัวแทนที่ดีของประชากร

ประชากรอาจจะมีลักษณะ ที่มีจํานวนแนนอน หรือไมแนนอนก็ได(FiniteFinite or Infiniteor Infinite?)?)

A population is finitefinite if it has a definite size, even if its size isunknown.

A population is infiniteinfinite if it is of arbitrarily large size Rule of Thumb: A population may be treated as infinite when

2

• กลุมตัวอยาง (Sample) หมายถึง สวนหนึ่งของประชากรที่นํามาศึกษาซึ่งตองเปนตัวแทนที่ดขีองประชากร การกําหนดขนาดตวัอยางที่เหมาะสม การเลือกตัวอยางหรือการสุมตัวอยาง ซึ่งเปนกระบวนการไดมาซึ่ง

กลุมตัวอยางที่เปนตัวแทนที่ดีของประชากร

Page 3: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

A samplesample involves looking only at some itemsselected from the population.

A censuscensus is an examination of all items in a definedpopulation.

Sample or Census?Sample or Census?Data Collection ((ตอตอ))

A samplesample involves looking only at some itemsselected from the population.

A censuscensus is an examination of all items in a definedpopulation.

การสุมตัวอยางเหมาะกับกรณีการสุมตัวอยางเหมาะกับกรณีเหลานี้เหลานี้

3

Page 4: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

Parameters and Statistics?Parameters and Statistics?

• พารามิเตอร (Parameter) หมายถึง ..

• ตัวสถิติ (statistic) คือ ...

StatisticStatistic are computed from a sample of n items,chosen from a population of N items.

Statistic can be used as estimates of parametersparametersfound in the population.

• พารามิเตอร (Parameter) หมายถึง ..

• ตัวสถิติ (statistic) คือ ...

4

StatisticStatistic are computed from a sample of n items,chosen from a population of N items.

Statistic can be used as estimates of parametersparametersfound in the population.

2-4

Page 5: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

การอธิบายขอมูล (Describing Data)

- VisualVisual (charts and graphs) :: provides insight intocharacteristics of a data set without using mathematics.

- NumericalNumerical (statistics or tables) :: provides insight intocharacteristics of a data set using mathematics.

Methods of Organizing, Exploring and Summarizing Data Include:

- NumericalNumerical (statistics or tables) :: provides insight intocharacteristics of a data set using mathematics.

CharacteristicCharacteristic InterpretationInterpretation

MeasurementMeasurement •What are the units of measurement?•Are the data integer or continuous?•Any missing observations?•Any concerns with accuracy or sampling methods?

CentralCentralTendencyTendency

•Where are the data values concentrated?•What seem to be typical or middle data values?

5

CentralCentralTendencyTendency

•Where are the data values concentrated?•What seem to be typical or middle data values?

DispersionDispersion •How much variation is there in the data?•How spread out are the data values?•Are there unusual values?

ShapeShape •Are the data values distributed symmetrically?•Skewed? Sharply peaked? Flat? Bimodal?

Page 6: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

1. Frequency and Graphic

Frequency Table : A grouping of qualitative data into mutuallyexclusive classes showing the number of observations in eachclass.

Qualitative VariablesTo transform raw or ungrouped datainto a meaningful form.

Frequency Table : A grouping of qualitative data into mutuallyexclusive classes showing the number of observations in eachclass.

แสดงจํานวนรถที่ขายไดในแตละ Location แสดงผลกําไรจากการขายรถ

ในเดือนที่ผานมา

6

Page 7: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

FREQUENCY DISTRIBUTION :: A grouping of data into mutuallyexclusive classes showing the number of observations in each class.

Quantitative Variables

1. Frequency and Graphic (ตอ)

7

Page 8: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

• Step 1: Decide on the number of classes.A useful recipe to determine the number of classes (k) is the “2 to the krule.” such that 2k > …. หรือ k = ….

• Step 2: Determine the class interval or width.1) หาคาพิสัย2) คํานวณความกวางของช้ัน

1. Frequency and Graphic (ตอ)

การสราง Frequency Table

• Step 1: Decide on the number of classes.A useful recipe to determine the number of classes (k) is the “2 to the krule.” such that 2k > …. หรือ k = ….

• Step 2: Determine the class interval or width.1) หาคาพิสัย2) คํานวณความกวางของช้ัน

• Step 3: Set the individual class limits

• Step 4: Tally the vehicle selling prices into the classes.• Step 5: Count the number of items in each class.

8

• Step 3: Set the individual class limits

• Step 4: Tally the vehicle selling prices into the classes.• Step 5: Count the number of items in each class.

Page30

Page 9: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

ขอบเขตลาง

ขอบเขตบน

ขีดจํากดัลาง

ขีดจํากดับน Midpoint ความถี่ ความถี่

สัมพัทธ รอยละCumulative

ความถี่ รอยละ

1 82 11

1. Frequency and Graphic (ตอ)

2 113 234 385 456 327 198 4

180 1 100

โดย i = 1,2,3,…, 8

9

คาก่ึงกลางช้ัน = (ขีดจํากัดลาง+ขดีจํากัดบน)/2= (ขอบเขตลาง+ขอบเขตบน)/2

โดย i = 1,2,3,…, 8

Midpoint

Page 10: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

1. Frequency and Graphic (ตอ)

SPSS : Recode

10

Page 11: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

1. Frequency and Graphic (ตอ)SPSS : Frequency Histogram

RDATA1

8.07.06.05.04.03.02.01.0

RDATA1

Freq

uen

cy

50

40

30

20

10

0

Std. Dev = 1.63

Mean = 4.6

N = 180.00

RDATA1

8.07.06.05.04.03.02.01.0

RDATA1

Freq

uen

cy

50

40

30

20

10

0

Std. Dev = 1.63

Mean = 4.6

N = 180.00

RDATA1

8 4.4 4.4 4.411 6.1 6.1 10.623 12.8 12.8 23.338 21.1 21.1 44.445 25.0 25.0 69.432 17.8 17.8 87.219 10.6 10.6 97.84 2.2 2.2 100.0

180 100.0 100.0

1.002.003.004.005.006.007.008.00Total

ValidFrequency Percent Valid Percent

CumulativePercent

11

RDATA1

8.07.06.05.04.03.02.01.0

RDATA1

Freq

uen

cy

50

40

30

20

10

0

Std. Dev = 1.63

Mean = 4.6

N = 180.00

RDATA1

8.07.06.05.04.03.02.01.0

RDATA1

Freq

uen

cy

50

40

30

20

10

0

Std. Dev = 1.63

Mean = 4.6

N = 180.00

RDATA1

8 4.4 4.4 4.411 6.1 6.1 10.623 12.8 12.8 23.338 21.1 21.1 44.445 25.0 25.0 69.432 17.8 17.8 87.219 10.6 10.6 97.84 2.2 2.2 100.0

180 100.0 100.0

1.002.003.004.005.006.007.008.00Total

ValidFrequency Percent Valid Percent

CumulativePercent

Page 12: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

ฮิสโตแกรม (Histogram) เปนการนําขอมูลจากตารางแจกแจงความถี่มาแสดงเปนภาพ โดยประกอบดวยแทงส่ีเหล่ียมผืนผา ในแกนนอนแบงออกเปนชวงๆ ความกวางของแตละชวงเทากับความกวางของชั้น จุดกึ่งกลางของแทงส่ีเหล่ียมแตละแทงเปนจุดกึ่งกลางของแตละชั้นความสูงของแทงส่ีเหล่ียมแตละแทงจะเปนความถี่ของแตละชั้น

1. Frequency and Graphic (ตอ)

data1

3200.0

3000.0

2800.0

2600.0

2400.0

2200.0

2000.0

1800.0

1600.0

1400.0

1200.0

1000.0

800.0

600.0

400.0

200.0

Histogram

Frequ

ency

30

20

10

0

Std. Dev = 643.63

Mean = 1843.2

N = 180.00

data1

3200.0

3000.0

2800.0

2600.0

2400.0

2200.0

2000.0

1800.0

1600.0

1400.0

1200.0

1000.0

800.0

600.0

400.0

200.0

Histogram

Frequ

ency

30

20

10

0

Std. Dev = 643.63

Mean = 1843.2

N = 180.00

12data1

3200.0

3000.0

2800.0

2600.0

2400.0

2200.0

2000.0

1800.0

1600.0

1400.0

1200.0

1000.0

800.0

600.0

400.0

200.0

Histogram

Frequ

ency

30

20

10

0

Std. Dev = 643.63

Mean = 1843.2

N = 180.00

data1

3200.0

3000.0

2800.0

2600.0

2400.0

2200.0

2000.0

1800.0

1600.0

1400.0

1200.0

1000.0

800.0

600.0

400.0

200.0

Histogram

Frequ

ency

30

20

10

0

Std. Dev = 643.63

Mean = 1843.2

N = 180.00

Page 13: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

1. Frequency and Graphic (ตอ)SPSS : Explore Plot

data1

3200.0

3000.0

2800.0

2600.0

2400.0

2200.0

2000.0

1800.0

1600.0

1400.0

1200.0

1000.0

800.0

600.0

400.0

200.0

Histogram

Freq

uenc

y

30

20

10

0

Std. Dev = 643.63

Mean = 1843.2

N = 180.00

data1

3200.0

3000.0

2800.0

2600.0

2400.0

2200.0

2000.0

1800.0

1600.0

1400.0

1200.0

1000.0

800.0

600.0

400.0

200.0

Histogram

Freq

uenc

y

30

20

10

0

Std. Dev = 643.63

Mean = 1843.2

N = 180.00

13data1

3200.0

3000.0

2800.0

2600.0

2400.0

2200.0

2000.0

1800.0

1600.0

1400.0

1200.0

1000.0

800.0

600.0

400.0

200.0

Histogram

Freq

uenc

y

30

20

10

0

Std. Dev = 643.63

Mean = 1843.2

N = 180.00

data1

3200.0

3000.0

2800.0

2600.0

2400.0

2200.0

2000.0

1800.0

1600.0

1400.0

1200.0

1000.0

800.0

600.0

400.0

200.0

Histogram

Freq

uenc

y

30

20

10

0

Std. Dev = 643.63

Mean = 1843.2

N = 180.00

Page 14: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

Descriptives

1843.167 47.973181748.501

1937.832

1856.1601882.500414256.6643.6277

294.003292.002998.00

860.0000-.243 .181-.217 .360

MeanLower BoundUpper Bound

95% ConfidenceInterval for Mean

5% Trimmed MeanMedianVarianceStd. DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosis

data1Statistic Std. Error

1. Frequency and Graphic (ตอ)Descriptives

1843.167 47.973181748.501

1937.832

1856.1601882.500414256.6643.6277

294.003292.002998.00

860.0000-.243 .181-.217 .360

MeanLower BoundUpper Bound

95% ConfidenceInterval for Mean

5% Trimmed MeanMedianVarianceStd. DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosis

data1Statistic Std. Error

180N =

data1

4000

3000

2000

1000

0

14180N =

data1

4000

3000

2000

1000

0

Page 15: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

1. Frequency and Graphic (ตอ)

SPSS : Graphs Histogram

DATA

3200.0

3000.0

2800.0

2600.0

2400.0

2200.0

2000.0

1800.0

1600.0

1400.0

1200.0

1000.0

800.0

600.0

400.0

200.0

30

20

10

0

Std. Dev = 643.63

Mean = 1843.2

N = 180.00

15

DATA

3200.0

3000.0

2800.0

2600.0

2400.0

2200.0

2000.0

1800.0

1600.0

1400.0

1200.0

1000.0

800.0

600.0

400.0

200.0

30

20

10

0

Std. Dev = 643.63

Mean = 1843.2

N = 180.00

Page 16: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

1) แผนภูมิแทง ( Bar Chart )- แผนภูมิแทงเชิงเดี่ยว (Simple Bar Chart )- แผนภูมิแทงเชิงซอน (Multiple Bar Chart )

2) แผนภูมิวงกลม( Pie Chart )

3) ฮิสโตแกรม (Histogram)

4) กราฟเสน- กราฟเสนเชิงเดี่ยว ( Simple Line Chart )- กราฟเสนเชิงซอน ( Multiple Line Chart )- รูปหลายเหล่ียมแหงความถี่ (Frequency Polygon)- กราฟความถี่สะสม(cumulative Frequency หรือ Ogive Curve)- กราฟเสนโคง (Smooth Curve หรอื Frequency Curve )

กราฟและแผนภูมิแบบตางๆ

1. Frequency and Graphic (ตอ)

1) แผนภูมิแทง ( Bar Chart )- แผนภูมิแทงเชิงเดี่ยว (Simple Bar Chart )- แผนภูมิแทงเชิงซอน (Multiple Bar Chart )

2) แผนภูมิวงกลม( Pie Chart )

3) ฮิสโตแกรม (Histogram)

4) กราฟเสน- กราฟเสนเชิงเดี่ยว ( Simple Line Chart )- กราฟเสนเชิงซอน ( Multiple Line Chart )- รูปหลายเหล่ียมแหงความถี่ (Frequency Polygon)- กราฟความถี่สะสม(cumulative Frequency หรือ Ogive Curve)- กราฟเสนโคง (Smooth Curve หรอื Frequency Curve )

16

1) แผนภูมิแทง ( Bar Chart )- แผนภูมิแทงเชิงเดี่ยว (Simple Bar Chart )- แผนภูมิแทงเชิงซอน (Multiple Bar Chart )

2) แผนภูมิวงกลม( Pie Chart )

3) ฮิสโตแกรม (Histogram)

4) กราฟเสน- กราฟเสนเชิงเดี่ยว ( Simple Line Chart )- กราฟเสนเชิงซอน ( Multiple Line Chart )- รูปหลายเหล่ียมแหงความถี่ (Frequency Polygon)- กราฟความถี่สะสม(cumulative Frequency หรือ Ogive Curve)- กราฟเสนโคง (Smooth Curve หรอื Frequency Curve )

Page 17: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

BAR CHART : A graph that shows qualitative classes on thehorizontal axis and the class frequencies on the vertical axis. Theclass frequencies are proportional to the heights of the bars.

1. Frequency and Graphic (ตอ)

17

Page 18: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

PIE CHART : A chart that shows the proportion or percentagethat each class represents of the total number of frequencies.

1. Frequency and Graphic (ตอ)

18

Page 19: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

THE LINE GRAPH is a powerful visual tool for marketing,finance, and other areas. It is also useful in research involvinga correlation between two variable.

1. Frequency and Graphic (ตอ)

จํานวนของเสียใน 1 week

19

Page 20: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

Frequency polygon

Cumulative frequencyหรือ Ogive curve

1. Frequency and Graphic (ตอ)

20

Page 21: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

1. Frequency and Graphic (ตอ)

21

Page 22: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

สรุปผลขอมูลโดยแสดงผลในรูปแบบของแผนที่ (Map)

1. Frequency and Graphic (ตอ)

22

Page 23: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

2. Displaying and Exploring Data

STEM-AND-LEAF DISPLAY: A statistical technique to present aset of data.• Each numerical value is divided into two parts.• The leading digit(s) becomes the stem and the trailing digit the leaf.• The stems are located along the vertical axis, and the leaf values are

stacked against each other along the horizontal axis.

STEM-AND-LEAF DISPLAY: A statistical technique to present aset of data.• Each numerical value is divided into two parts.• The leading digit(s) becomes the stem and the trailing digit the leaf.• The stems are located along the vertical axis, and the leaf values are

stacked against each other along the horizontal axis.

23

Page 24: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

ตําแหนงของ Me = [N+1]/2

ตําแหนงของ hinge = (ตําแหนง Me+1)/2

2. Displaying and Exploring DataA BOX PLOT is a graphical display, based on quartiles, that helps us picture a setof data. To construct a box plot, we need only five statistics: the minimum value,Q (the first quartile), the median, Q (the third quartile), and the maximum value.

* oo *

24

ฮินจ : Hinge ลาง Hinge บน

H-Spread = ฮินจบน - ฮินจลาง

Page 25: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

Outer Fence

2. Displaying and Exploring Data

Inner Fence

25

Hinge ลาง Hinge บน

Page 26: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

1 2 3 4 5 6 7 8 9 10 1120.1 20.3 22.1 22.2 23.4 23.9 27.1 27.1 31.1 31.1 36.7

12 13 14 15 16 17 18 19 20 21 2239.0 39.8 39.9 40.8 40.9 41.2 41.8 43.3 44.2 46.7 49.7

ตัวอยาง มีขอมูล 22 คา เรียงลําดับจากนอยไปหามาก

2. Displaying and Exploring Data

39.0 39.8 39.9 40.8 40.9 41.2 41.8 43.3 44.2 46.7 49.7

1. แบงขอมูลออกเปน 2 สวน (Med , Q2)

2. หาจุดกึ่งกลางของขอมูลทั้ง 2 สวน

26

4. หาแนวช้ันใน :

แนวช้ันนอก :

3. หา Q1 และ Q3 Q3-Q1=IQR= H-spread

Page 27: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

1 2 3 4 5 6 7 8 9 10 1120.1 20.3 22.1 22.2 23.4 23.9 27.1 27.1 31.1 31.1 36.7

12 13 14 15 16 17 18 19 20 21 2239.0 39.8 39.9 40.8 40.9 41.2 41.8 43.3 44.2 46.7 49.7

27

Page 28: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

28

Page 29: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

3. Numerical Measures

1) การวัดตําแหนงการเปรียบเทียบ

เปอรเซนตไตล (Percentiles ) เปนการแบงขอมูลออกเปน 100 สวนเทาๆ กันเมื่อเรียงขอมูลตามลําดับจากคานอยไปหามาก หรือจากคามากไปหานอย มีจุดแบงอยู 99 จุด คือ P1, P2, P3, …,P99

P60 (เปอรเซ็นไทลที่ 0) หมายความวา มีขอมูลจํานวน 60% ของขอมูลทั้งหมดที่มีคาตํ่ากวา P60 และมีจํานวนขอมูลที่เหลืออีก 40% ของขอมูลทั้งหมดที่มีคามากกวา P60

P60 (เปอรเซ็นไทลที่ 0) หมายความวา มีขอมูลจํานวน 60% ของขอมูลทั้งหมดที่มีคาตํ่ากวา P60 และมีจํานวนขอมูลที่เหลืออีก 40% ของขอมูลทั้งหมดที่มีคามากกวา P60

9 9 9 10 12 12 12 15 17 18 20 23 50 50

29

Page 30: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

ki100

p1nPosition

ทราบ p เชน ตองการทราบวา นร. ที่มี P60 มีคา GPA เปนเทาใดจาก นร. 200 คน

3. Numerical Measures (ตอ)

ki100

p1nPosition

ทราบ ขอมูล เชน นร. คนหนึ่งตองการทราบวา GPA ของตนนั้น มีคาPercentile เปนเทาใด จาก นร. 200 คน

30

100

p1nPosition

Page 31: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

1. เรียงขอมูลหรือคาคะแนนจากนอยไปมาก

2. กําหนดคา Percentiles ที่ตองการหา เชน ตองการหา P65 p = 65จากนั้นระบุตําแหนงของขอมูลที่ตองการจากสูตร

ทราบ Percentiles ตองการคํานวณหาคาขอมูล

n= 10

ตัวอยาง 1 2 3 4 5 6 7 811 15 18 19 21 21 25 28

3. Numerical Measures (ตอ)

2. กําหนดคา Percentiles ที่ตองการหา เชน ตองการหา P65 p = 65จากนั้นระบุตําแหนงของขอมูลที่ตองการจากสูตร

31

3. จากขอมูลที่เรียงแลวในขอ 1. ใหดูวาตําแหนงที่ไดจากสูตร...ตรงกับขอมูลใด

Page 32: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

3. Numerical Measures (ตอ)

32

• Quartiles (Q) เปนการแบงคาขอมูลออกเปน 4 สวนเทาๆ กัน

• Deciles (D) เปนการแบงขอมูลออกเปน 10 สวนเทาๆ กัน

Page 33: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

Example :บริษัทรถยนต AA จําหนายรถยนตย่ีหอหนึ่ง ตองการใหเงินสมนาคุณแกพนักงานขาย 1 คนจาก 3 คน ที่มียอดขายรวม 5 ป อยูในระดบัแนวหนา ที่มีรายละเอียดในแตละป ตามตารางดานลาง ถาบริษัทจะใหเงินสมนาคุณแกพนักงานที่มียอดขายคงเสนคงวามากที่สุด จงหาวาพนักงานคนใดควรจะไดรับเงินสมนาคุณ

3. Numerical Measures

Example :บริษัทรถยนต AA จําหนายรถยนตย่ีหอหนึ่ง ตองการใหเงินสมนาคุณแกพนักงานขาย 1 คนจาก 3 คน ที่มียอดขายรวม 5 ป อยูในระดบัแนวหนา ที่มีรายละเอียดในแตละป ตามตารางดานลาง ถาบริษัทจะใหเงินสมนาคุณแกพนักงานที่มียอดขายคงเสนคงวามากที่สุด จงหาวาพนักงานคนใดควรจะไดรับเงินสมนาคุณ

Year Emp.1 Emp.2 Emp.31 74 80 772 80 75 793 72 69 724 75 75 765 78 80 75

ตัวอยางความแปรปรวน (Variance)

33

5 78 80 75

Mean 75.80 75.80 75.80ประชากร

Page 34: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

Standardized Data andCoefficient of variation (CV)

Standardized Data andCoefficient of variation (CV)

Full Score 100 50Name Math Eng

AA 68.84 32.23

1. How do you thing about Score ofMath and Eng Subject?

2. How do you thing about studentname BB?

3. Numerical Measures (ตอ)

AA 68.84 32.23BB 75.56 41.54CC 69.24 49.22DD 79.74 46.61EE 80.87 23.74FF 60.38 39.80

MEAN 72.44 38.86S.D. 7.78 9.47

34

S.D. 7.78 9.47

คะแนนมาตรฐาน (Z)

สัมประสิทธิ์แหงการกระจายCoefficient of variation (CV)

ประชากร ตัวอยาง

Page 35: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

2) Central Tendency

3. Numerical Measures (ตอ)

กรณีทีต่องการคาเพียงคาเดียว เพ่ือใชอธิบายขอมูลทั้งชุด สําหรับคากลางที่เปนตัวแทนของขอมูลทัง้ชุด ที่นิยมใช คือ

• คาเฉล่ียเลขคณติ (Mean)• มัธยฐาน (Median)• ฐานนิยม(Mode)

กรณีทีต่องการคาเพียงคาเดียว เพ่ือใชอธิบายขอมูลทั้งชุด สําหรับคากลางที่เปนตัวแทนของขอมูลทัง้ชุด ที่นิยมใช คือ

• คาเฉล่ียเลขคณติ (Mean)• มัธยฐาน (Median)• ฐานนิยม(Mode)

คาเฉล่ียเลขคณติ (Mean)

ประชากร 0XX

n

ii

n

ii MedX

คุณสมบัติของคาเฉล่ีย

35

ตัวอยาง

n

ii aX 2

aXY ii

ii aXY

Page 36: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

ขีดจํากดัลาง

ขีดจํากดับน

ความถี่(f)

MidPoint(x) fx fx2

1 200-599 8

2 600-999 11

3 1000-1399 23

กรณีขอมูลจัดเปนหมวดหมู3. Numerical Measures (ตอ)

4 1400-1799 38

5 1800-2199 45

6 2200-2599 32

7 2600-2999 19

8 3000-3399 4รวม 180

โดย i = 1,2,3,…, 8

36

Page 37: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

สวนเบ่ียงเบนมาตราฐาน (Standard Deviation)

คือ รากที่ 2 ของคาความแปรปรวน

3. Numerical Measures (ตอ)

3) การวัดการกระจาย (Measures of Dispersion)

ความแปรปรวน (Variance)

คือ รากที่ 2 ของคาความแปรปรวน

สวนเบ่ียงเบนควอไทล (Inter Quartile Range: IQR)

สัมประสิทธิ์ความแปรผัน (CV)

37

สวนเบ่ียงเบนควอไทล (Inter Quartile Range: IQR)

สวนเบ่ียงเบน Quartile

พิสัย (Range) =

Page 38: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

คาเฉล่ียถวงน้ําหนัก (Weighted mean)

กรณีที่สนใจใหน้ําหนักกับแตละหนวยแตกตางกนั

ตัวอยาง การคํานวณ GPA

3. Numerical Measures (ตอ)

2) คากลางแบบ อ่ืนๆ

iiw

n

1iiXiw

ตัวอยาง การคํานวณ GPA

ไดเกรดXi

หนวยกิตWi

Wi*Xi

วิชาที่ 1 A =4 3

วิชาที่ 2 B=3 2

วิชาที่ 3 D=1 3

38

วิชาที่ 3 D=1 3

รวม 8

Page 39: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

มัธยฐาน (Median)

• เปนคาที่อยูในตําแหนงที่แบงขอมูลออกเปนสองสวนเทาๆ กัน ซ่ึงจะเปนคาในตําแหนงก่ึงกลางของการแจกแจง หรือเปนคา P50 หรือ Q2

• นั่นคือ มีขอมูลมากกวามัธยฐาน 50% มีขอมูลนอยกวามัธยฐาน 50%• ดังนั้นเมื่อเรียงลําดับขอมูลแลวคาฐาน จะอยู ณ ตําแหนงที่ (n+1)/2 ในกรณีที่จํานวนขอมูลเปนเลขค่ี มัธยฐานคือคาของขอมูลที่อยูก่ึงกลาง แตถาจํานวนขอมูลเปนเลขคู มัธยฐานจะเทากับคาเฉลี่ยของ 2 จํานวนที่อยูตรง

กลาง

3. Numerical Measures (ตอ)

ตัวอยาง จากการสํารวจพบวาราคาขาวพันธุ A และ B บาทตอกิโลกรัม ที่ขายอยูตามรานคาตางๆ ในทองตลาดเปนดังนี้

• เปนคาที่อยูในตําแหนงที่แบงขอมูลออกเปนสองสวนเทาๆ กัน ซ่ึงจะเปนคาในตําแหนงก่ึงกลางของการแจกแจง หรือเปนคา P50 หรือ Q2

• นั่นคือ มีขอมูลมากกวามัธยฐาน 50% มีขอมูลนอยกวามัธยฐาน 50%• ดังนั้นเมื่อเรียงลําดับขอมูลแลวคาฐาน จะอยู ณ ตําแหนงที่ (n+1)/2 ในกรณีที่จํานวนขอมูลเปนเลขค่ี มัธยฐานคือคาของขอมูลที่อยูก่ึงกลาง แตถาจํานวนขอมูลเปนเลขคู มัธยฐานจะเทากับคาเฉลี่ยของ 2 จํานวนที่อยูตรง

กลาง

รานคา 1 2 3 4 5 6 7พันธุ A 11 11 12 13 15 15 30

39

พันธุ A 11 11 12 13 15 15 30

พันธุ B 9 16 18 19 20 22

บาทตอกิโลกรัม

Page 40: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

ฐานนิยม (Mode)

คือ คาของขอมูลที่มีความถี่สูงสุดในชุดนั้น หรืออคาที่เกดิขึน้บอยที่สุดในจํานวนชุดของขอมูลทั้งหมด

ตัวอยาง ราคาขาวพันธุ AA ที่ขายอยูตามรานคาตางๆ ในทองตลาดราคาตอกิโลกรัมเทากับ 12 10 11 13 12 13 12

3. Numerical Measures (ตอ)

ตัวอยาง ราคาขาวพันธุ AA ที่ขายอยูตามรานคาตางๆ ในทองตลาดราคาตอกิโลกรัมเทากับ 12 10 11 13 12 13 12

ความสัมพันธระหวาง Mean Mode และ Median

40

Page 41: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

คาเฉลี่ยเลขคณิต ควรใชเม่ือใด1. ขอมูลอยูในระดับมาตรอันตรภาคหรอืมาตรอัตราสวน ขอมูลมีการ

กระจายไมมากนัก2. การแจกแจงของขอมูลมีลักษณะสมมาตร3. คาเฉล่ียจะไมใชคากลางที่ดี ถามีคาผิดปกติไปมาก (คาที่สูงเกินไปมากๆ

หรือคาที่ต่าํเกินไปมากๆ

3. Numerical Measures (ตอ)

มัธยฐาน ควรใชเม่ือใด1.ขอมูลอยูในระดับมาตรอันตรภาคหรอืสูงกวา2.คามัธยฐานจะไมถูกกระทบกระเทือน หากมีขอมูลที่มีคาสูงหรอืต่ําผิดปกติ3. เม่ือขอมูลมีลักษณะไมสมมาตร เชน ขอมูลเบซายหรือเบขวา

ฐานนิยม ควรใชเม่ือใด1. สามารถใชไดกับขอมูลเชิงคุณภาพและเชิงปริมาณ2. วัตถุประสงคของการรวบรวมขอมูลนั้น ตองการทราบคาตัวแทนของขอมูล

อยางรวดเร็วและตองการผลเพียงคราวๆ3. ขอมูลบางชุดอาจมีฐานนิยมมากกวา 1 คา โดยที่ฐานนิยมนั้นอาจแตกตาง

กันมาก4. ฐานนิยมจะไมถูกกระทบกระเทือนหากมีขอมูลที่มีคาสูงหรอืต่ําผิดปกติ

คาเฉลี่ยเลขคณิต ควรใชเม่ือใด1. ขอมูลอยูในระดับมาตรอันตรภาคหรอืมาตรอัตราสวน ขอมูลมีการ

กระจายไมมากนัก2. การแจกแจงของขอมูลมีลักษณะสมมาตร3. คาเฉล่ียจะไมใชคากลางที่ดี ถามีคาผิดปกติไปมาก (คาที่สูงเกินไปมากๆ

หรือคาที่ต่าํเกินไปมากๆ

41

มัธยฐาน ควรใชเม่ือใด1.ขอมูลอยูในระดับมาตรอันตรภาคหรอืสูงกวา2.คามัธยฐานจะไมถูกกระทบกระเทือน หากมีขอมูลที่มีคาสูงหรอืต่ําผิดปกติ3. เม่ือขอมูลมีลักษณะไมสมมาตร เชน ขอมูลเบซายหรือเบขวา

ฐานนิยม ควรใชเม่ือใด1. สามารถใชไดกับขอมูลเชิงคุณภาพและเชิงปริมาณ2. วัตถุประสงคของการรวบรวมขอมูลนั้น ตองการทราบคาตัวแทนของขอมูล

อยางรวดเร็วและตองการผลเพียงคราวๆ3. ขอมูลบางชุดอาจมีฐานนิยมมากกวา 1 คา โดยที่ฐานนิยมนั้นอาจแตกตาง

กันมาก4. ฐานนิยมจะไมถูกกระทบกระเทือนหากมีขอมูลที่มีคาสูงหรอืต่ําผิดปกติ

Page 42: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

มัชฌิมฮารโมนิค (Harmonic Mean)

• ในกรณีที่กลุมตัวอยางแตละกลุมมีจํานวนไมเทากัน

• นอกจากนี้ยังใชในการคํานวณหาความเรว็เฉล่ีย เม่ือระยะทางในการเปล่ียนความเร็วมีชวงเทา ๆ กัน

3. Numerical Measures (ตอ)

มัชฌิมเรขาคณติ (Geometric Mean)

• ในกรณีที่กลุมตัวอยางแตละกลุมมีจํานวนไมเทากัน

• นอกจากนี้ยังใชในการคํานวณหาความเรว็เฉล่ีย เม่ือระยะทางในการเปล่ียนความเร็วมีชวงเทา ๆ กัน

• ขอมูลที่อยูในรูปของอนุกรมที่เปล่ียนแปลงไปในอัตราที่กําหนด

• อัตราสวนหรอืเลขดัชนีทางเศรษฐศาสตร

Ex. ความเรว็ของรถในการเดินทาง , ราคาส่ิงของในแตละเดือน ตองการหาคาเฉล่ีย

42

• ขอมูลที่อยูในรูปของอนุกรมที่เปล่ียนแปลงไปในอัตราที่กําหนด

• อัตราสวนหรอืเลขดัชนีทางเศรษฐศาสตร

Ex. อัตราเงินเฟอในแตละป มีคาเปนรอยละ และตองการหาคาเฉล่ีย

Page 43: สถิติวิเคราะห 1 (Statistical Analysis I) ประชากร (Population) หมายถึง... ประชากรอาจจะมีลักษณ

สัดสวน /รอยละกรณีทีข่อมูลเปนขอมูลเชิงคุณภาพหรือขอมูลทีมี่คําตอบที่เปนไปไดเพียง 2 ทางหรือจัดกลุมคําตอบออกเปน 2 กลุมที่สนใจ

ตัวอยาง ในการสํารวจความเห็นของนักศึกษาป 1 วา เห็นดวยกับกิจกรรมการรับนองใหมหรือไม โดยมีคาํตอบมีเพียง 2 ทางเลือก คือ ไมเห็นดวย กับเห็นดวย

3. Numerical Measures (ตอ)

ตัวอยาง ในการสํารวจความเห็นของนักศึกษาป 1 วา เห็นดวยกับกิจกรรมการรับนองใหมหรือไม โดยมีคาํตอบมีเพียง 2 ทางเลือก คือ ไมเห็นดวย กับเห็นดวย

ตัวอยาง เจาของโรงงานผลิตคุกกี้แหงหนึ่ง ตองการทราบวา เม่ือลงทุนโฆษณาคุกกี้ของตนใน จ .ขอนแกน แลวผลเปนอยางไร มีคนรูจักมากเพียงใด

ถาเก็บหนวยตัวอยางมา 300 คนมี นศ.ที่เห็นดวยจํานวน 230 คน

43

เจาของโรงงานผลิตคุกกี้แหงหนึ่ง ตองการทราบวา เม่ือลงทุนโฆษณาคุกกี้ของตนใน จ .ขอนแกน แลวผลเปนอยางไร มีคนรูจักมากเพียงใด

ถาเก็บหนวยตัวอยางมา 380 คน มีคนรูจักและซือ้คุกกี้ย้ีหอนี้จํานวน 200 คน