2 distribucion de frecuencias

Post on 27-Jan-2016

280 Views

Category:

Documents

6 Downloads

Preview:

Click to see full reader

DESCRIPTION

estadistica inferencial

TRANSCRIPT

1-1

DESCRIPCIÓN DE LOS DATOS

DISTRIBUCIONES DE

FRECUENCIAS,

REPRESENTACIONES GRÁFICAS,

MEDIDAS DE UBICACIÓN Y

MEDIDAS DE DISPERSIÓN

PATRICIO ORTEGA

1-1

OBJETIVOS

Organizar los datos en una distribución de frecuencias. Presentar datos mediante gráficos de líneas, de barras y circulares. Calcular e interpretar la amplitud de variación, la desviación

media, la variancia, y la desviación estándar de los datos originales.

Calcular y entender el coeficiente de variación.

Distribución de frecuencias

Distribución de frecuencias: agrupamiento de datos en categorías que muestran el número de observaciones en cada categoría mutuamente excluyente.

2-2

31302928272625

4

3

2

1

0

NOTAS /50

Frec

uenc

ia

Histograma de NOTAS /50

Distribución de frecuencias Marca de clase (punto medio): punto que divide a la

clase en dos partes iguales. Es el promedio entre los límites superior e inferior de la clase.

Intervalo de clase: para una distribución de frecuencias que tiene clases del mismo tamaño, el intervalo de clase se obtiene restando el límite inferior de una clase del límite inferior de la siguiente.

2-4

EJEMPLO

Dr. Tillman es el director de la escuela de administración y desea determinar cuánto estudian los alumnos en ella.

Selecciona una muestra aleatoria de 30 estudiantes y determina el número de horas por semana que estudia cada uno:

15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6.

2-5

EJEMPLO

Horas de estudio Frecuencia, f 8-12 1 13-17 12 18-22 10 23-27 5 28-32 1 33-37 1

2-6

Organice los datos en una distribución de frecuencias.

Considere las clases 8-12 y 13-17. Las marcas de clase son 10 y 15.

El intervalo de clase es 5 (13 - 8).

Sugerencias para elaborar una distribución de frecuencias

Los intervalos de clase usados en la distribución de frecuencias deben ser iguales.

Determine un intervalo de clase sugerido con la fórmula:

i = (valor más alto - valor más bajo)/número de clases.

2-7

Sugerencias para elaboraruna distribución de frecuencias Use el intervalo de clase calculado sugerido para

construir la distribución de frecuencias.

Nota: este es un intervalo de clase sugerido; si el intervalo de clase calculado es 97, puede ser mejor usar 100.

Cuente el número de valores en cada clase.

2-8

Distribución de frecuencia relativa

La frecuencia relativa de una clase se obtiene dividiendo la frecuencia de clase entre la frecuencia total.

2-9

Frecuencia,f

Frecuenciarelativa

8-12 1 1/30=.0333

13-17 12 12/30=.400

18-22 10 10/30=.333

23-27 5 5/30=.1667

28-32 1 1/30=.0333

33-37 1 1/30=.0333

TOTAL 30 30/30=1

T

Horas

Presentación gráfica de una distribución de frecuencias

Las tres formas de gráficas más usadas son histogramas, polígonos de frecuencia y distribuciones de frecuencias acumuladas (ojiva).

Histograma: gráfica donde las clases se marcan en el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias de clase se representan por las alturas de las barras y éstas se trazan adyacentes entre sí.

2-12

Presentación gráfica de una distribución de frecuencias Un polígono de frecuencias consiste en segmentos

de línea que conectan los puntos formados por el punto medio de la clase y la frecuencia de clase.

Una distribución de frecuencias acumulada (ojiva) se usa para determinar cuántos o qué proporción de los valores de los datos es menor o mayor que cierto valor.

2-13

Histograma para las horas de estudio

0

2

4

6

8

10

12

14

10 15 20 25 30 35

Horas de estudio

Fre

cu

en

cia

2-14

Polígono de frecuencias para las horas de estudio

0

2

4

6

8

10

12

14

10 15 20 25 30 35

Horas de estudio

Fre

cu

en

cia

2-15

Distribución de frecuencias acumuladas menor que para las horas de estudio

0

5

10

15

20

25

30

35

10 15 20 25 30 35

Horas de estudio

Fre

cuen

cia

2-16

Gráfica de barras para los datos de desempleados

7300

5400

6700

89008200

8900

0

2000

4000

6000

8000

10000

1 2 3 4 5 6

Ciudades

# d

esem

ple

ado

s/10

0 00

0AtlantaBostonChicagoLos AngelesNew YorkWashington

2-19

Gráfica cicular para tipos de zapatos

Nike

Adidas

ReebokAsics

Otros

Nike

Adidas

ReebokAsics

Otros

2-22

Media de la población Para datos no agrupados, la media de la población es

la suma de todos los valores en ella dividida entre el total de valores en la población:

donde µ representa la media de la población. N es el número total de elementos en la población. X representa cualquier valor en particular. indica la operación de sumar.

X N/

3-2

EJEMPLO

Parámetro: una característica de una población.

La familia Kiers posee cuatro carros. Los datos son las millas recorridas por cada uno:56 000, 23 000, 42 000 y 73 000. Encuentre el promedio de millas de los cuatro carros.

Esto es (56 000 + 23 000 + 42 000 + 73 000)/4 = 48 500

3-3

Media de una muestra

Para datos no agrupados, la media de una muestra es la suma de todos los valores divididos entre el número total de los mismos:

donde X denota la media muestral. n es el número total de valores en la muestra.

X X n /

3-4

EJEMPLO

Una muestra de cinco ejecutivos recibió la siguiente cantidad en bonos el año pasado: $14 000, $15 000, $17 000, $16 000 y $15 000.

Encuentre el promedio en bonos para los cinco ejecutivos.

Como estos valores representan la muestra de 5 ejecutivos, la media de la muestra es:

(14 000 + 15 000 + 17 000 + 16 000 + 15 000) / 5 = $15 400.

3-5

Propiedades de la media aritmética Todo conjunto de datos de nivel de intervalo y de

nivel de razón tiene un valor medio. Al evaluar la media se incluyen todos los valores. Un conjunto de valores sólo tiene una media. La cantidad de datos a evaluar rara vez afecta la

media. La media es la única medida de ubicación donde la

suma de las desviaciones de cada valor con respecto a la media, siempre es cero.

3-6

Media ponderada

La media ponderada de un conjunto de números X1, X2, ..., Xn, con las ponderaciones correspondientes w1, w2, ...,wn, se calcula con la fórmula:

wXwXw

wwwXwXwXwXw nnn

/)*(

).../()...( 212211

3-8

EJEMPLO

Durante un periodo de una hora en una tarde calurosa de un sábado, el cantinero Chris sirvió cincuenta bebidas.

Calcule la media ponderada de los precios de las bebidas. (Precio ($), cantidad vendida):

($0.50, 5), ($0.75, 15), ($0.90, 15), ($1.10, 15).

La media ponderada es: $(.50 x 5 + .75 x 15 + .90 x 15 + 1.10 x 15) / (5 + 15 + 15 + 15) = $43.75/50 = $0.875

3-9

Mediana

Mediana: es el punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. La misma cantidad de valores se encuentra por arriba de la mediana que por debajo de ella.

Nota: para un conjunto con un número par de números, la mediana será el promedio aritmético de los dos números medios.

3-10

EJEMPLO

Calcule la mediana para los siguientes datos. La edad de una muestra de cinco estudiantes es: 21,

25, 19, 20 y 22.

Al ordenar los datos de manera ascendente quedan: 19, 20, 21, 22, 25.

La mediana es 21. La altura, en pulgadas, de cuatro jugadores de

basquetbol es 76, 73, 80 y 75.

Al ordenar los datos de manera ascendente quedan: 73, 75, 76, 80.

La mediana es 75.5.

3-11

Propiedades de la mediana

La mediana es única para cada conjunto de datos. No se ve afectada por valores muy grandes o muy

pequeños, y por lo tanto es una medida valiosa de tendencia central cuando ocurren.

Puede obtenerse para datos de nivel de razón, de intervalo y ordinal.

Puede calcularse para una distribución de frecuencias con una clase de extremo abierto, si la mediana no se encuentra en una de estas clases.

3-12

Moda

La moda es el valor de la observación que aparece con más frecuencia.

EJEMPLO: las calificaciones de un examen de diez estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75, 81, 87. Como la calificación 81 es la que más ocurre, la calificación modal es 81.

EJEMPLO: Talla de calzado

EJEMPLO: Color de ojos

3-13

Desviación media

Desviación media: media aritmética de los valores absolutos de las desviaciones respecto a la media aritmética.

MDX X

n

4-3

EJEMPLO

Los pesos de una muestra de cajas con libros en una librería son (en lb) 103, 97, 101, 106 y 103.

X = 510/5 = 102 lb

= 1 + 5 + 1 + 4 + 1 = 12

MD = 12/5 = 2.4

Por lo común los pesos de las cajas están a 2.4 lb del peso medio de 102 lb.

4-4

Variancia de la población

La varianza de la población para datos no agrupados es la media aritmética de las desviaciones cuadráticas respecto a la media de la población.

2

2

( )X

N

4-5

EJEMPLO

Las edades de la familia Dunn son 2, 18, 34, y 42 años. ¿Cuál es la variancia de la población?

X N/ /96 4 24

2 2 944 4 236 ( ) / /X N

4-6

Variancia poblacional

Una fórmula alternativa para la variancia poblacional es:

22

2 X

N

X

N( )

4-7

Desviación estándar poblacional

La desviación estándar poblacional () es la raíz cuadrada de la variancia de la población.

Para el EJEMPLO 2, la desviación estándar poblacional es 15.19 (raíz cuadrada de 230.81).

4-8

Variancia muestral

4-9

La variancia muestral estima la variancia de la población.

1

)Σ(Σ

= = operativa Fórmula

1)(Σ

== conceptual Fórmula

22

2

22

nnX

XS

nXX

S

Interpretación y usos de la deviación estándar Regla empírica: para una distribución de frecuencias

simétrica de campana:

Cerca de 68% de las observaciones estará dentro de ±1 de la media ().

Cerca de 95% de las observaciones estará dentro de ±2 de la media ().

Alrededor de 99.7% estará dentro de ±3 de la media ().

4-15

3 m

Curva en forma de campana que muestra la relación entre y

2 1 +1 +2 +3

Dispersión relativa

El coeficiente de variación es la razón de la desviación estándar a la media aritmética, expresada como porcentaje:

CVs

X (100%)

4-17

top related