medidas estadisticas

22
Dra. Teresa Ortiz Távara Curso de Estadística Educacional MEDIDAS ESTADÍSTICAS Cuando tenemos un conjunto de datos agrupados, se requieren de medidas representativas que son: a) Medidas de Tendencia Central b) Medidas de variabilidad o dispersión que indica cuan variable son los datos A) MEDIDAS DE TENDENCIA CENTRAL: PROMEDIOS Los investigadores, en muchos campos, han utilizado el término “Promedio” para hacer preguntas tales como: ¿ Cuál es el ingreso promedio que reciben los bachilleres y los profesionales?, ¿Cuál es el promedio de calificaciones de los universitarios? En promedio, ¿Cuántos accidentes automovilísticos ocurren como resultados directo de alcohol o drogas? Una manera útil de describir a un grupo en su totalidad es encontrar un número único que represente lo “Promedio” de ese conjunto de puntajes. En la investigación, ese valor se conoce como Medida de Tendencia Central, ya que está generalmente localizada hacia el medio o centro de una distribución en donde la mayoría de los puntajes tienden a concentrarse. 26

Upload: francisrodrigo

Post on 10-Dec-2015

5 views

Category:

Documents


0 download

DESCRIPTION

Temas del compendio de estadística.

TRANSCRIPT

Page 1: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

MEDIDAS ESTADÍSTICAS

Cuando tenemos un conjunto de datos agrupados, se requieren de medidas

representativas que son:

a) Medidas de Tendencia Central

b) Medidas de variabilidad o dispersión que indica cuan variable son los

datos

A) MEDIDAS DE TENDENCIA CENTRAL: PROMEDIOS

Los investigadores, en muchos campos, han utilizado el término “Promedio” para

hacer preguntas tales como: ¿ Cuál es el ingreso promedio que reciben los bachilleres y

los profesionales?, ¿Cuál es el promedio de calificaciones de los universitarios? En

promedio, ¿Cuántos accidentes automovilísticos ocurren como resultados directo de

alcohol o drogas?

Una manera útil de describir a un grupo en su totalidad es encontrar un número único

que represente lo “Promedio” de ese conjunto de puntajes. En la investigación, ese valor

se conoce como Medida de Tendencia Central, ya que está generalmente localizada

hacia el medio o centro de una distribución en donde la mayoría de los puntajes tienden a

concentrarse.

26

Page 2: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

Trataremos tres medidas de tendencia central más

conocidas, como: Media, Mediana y Moda.

1) MEDIA ARITMÉTICA:

a) Media aritmética para datos simples:

La media aritmética muestral ( ) se calcula mediante la siguiente fórmula:

Ejemplo Nº 1: Aplicando la fórmula arriba expuesta, encontramos que la media

del coeficiente intelectual de los 8 entrevistados listados en la tabla.

TABLA Nº 1: Coeficiente intelectual de 8 entrevistados.

ENTREVISTADOCOEFICIENTE

INTELECTUAL(C .I )Leticia 125

Francisco 92Sara 72

Miguel 126Rebeca 120Rocío 99Juan 130Pablo 100

27

PROMEDIOS

MEDIA

MODA

MEDIANA

GeométricaArmónica

Aritmética

Muestral

Poblacional

Ponderada

SimpleDatos agrupados

Datos no agrupados

Datos agrupadosDatos no agrupados

Datos simplesDatos agrupados

Cuartiles Deciles Percentiles

Donde: n: es el número de datos xi: es un dato de la muestra

Page 3: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

Ejemplo Nª 2: Calcule el promedio de notas de los alumnos de educación inicial-UNT

TABLA Nº 2: Notas de Estadística de los alumnos

de la Escuela Educación. Inicial de la UNT en 2014

Fuente: Datos supuestos

b) Media Aritmética para datos agrupados:

Tabla 03: Calificativos obtenidos por alumnos del Club

Los Intelectuales en el test de lectura veloz

PUNTAJES fi xi xifi

00-04

04-08

08-12

12-16

16-20

12

16

23

17

11

Notas f08 12

10 10

11 20

12 10

13 5

total

28

Page 4: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

TOTAL

Fuente: Datos supuestos.

La fórmula es:

Sustituyendo los datos del cuadro anterior, se obtiene

Ejemplo Nº 3: Complete y encuentre la media para la siguiente frecuencia

agrupada:

EDADES fi xi xifi

12-15

15-18

18-21

21-24

2

5

8

5

TOTAL 20

Ejemplo Nº 4:

Se pidió a 31 niños matriculados en 1º grado del curso de matemática que

indicaran el número de hermanos(as) que viven en su hogar. Cuál es el número

promedio de hermanos. Los datos resultantes se forman en la siguiente

distribución de frecuencia

Nº DE HER-MANOS

fi fixi

5

4

3

2

1

6

7

9

5

4

TOTAL 31

29

Page 5: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

2) MEDIANA (Med):

Representa el valor intermedio de los datos de una serie ordenada en forma

ascendente o descendente. Es decir el 50 % de datos aproximadamente estarán

debajo de la mediana o tendrán valores menores o iguales que la mediana o el

50% tendrán valores mayores o iguales de la mediana.

a) Mediana para datos simples

Ejemplo Nº 5: Halle la mediana de los datos

a. 4, 8, 3, 2, 10

b. 3, 8, 10, 7, 3, 5

c. 10,12,14,8,6,7,10,10

d. 3,3,4,3,1,6,5,6,6,4

Solución:

a) Se ordena los datos en forma creciente:

2, 3, 4, 8, 10

Luego: Med = 4

b) Ordenando: 3, 3, 5, 7, 8, 10

Tenemos: Med =

c) Ordena la serie: ...................................................

Luego, aplique:

30

Page 6: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

d) Ordene en forma creciente: ......................................

Entonces, Med =

REGLAS:

Si la serie es impar, la mediana ocupa el lugar central.

Si la serie es par, la mediana se halla por la semi suma de los valores

centrales.

Si la serie es par o impar, el lugar que ocupa la medina es siempre:

Ejemplo Nº 6: Del ejemplo Nº 4, halle la mediana aplicando su respectiva

fórmula.

Nº DE HER-MANOS

f

1

2

3

4

5

6

7

9

5

4

TOTAL 31

b) Mediana para datos agrupados:

Para datos agrupados la mediana se halla utilizando una fórmula. Utilizaremos el

ejemplo de las calificaciones de los 100 estudiantes dados en la página 14

PUNTAJES f F30-39

40-49

50-59

60-69

70-79

80-89

90-99

12

12

16

23

17

11

09

12

24

40

63

80

91

100

TOTAL 100

31

Page 7: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

FÓRMULA:

La interpretación del valor de Med = 63,84 es que el 50% de estudiantes

tienen un puntaje por encima de 63.,84 y el 50 % restante un puntaje por debajo

de 63,84.

Ejemplo Nº 7: Con los datos de la tabla siguiente, hallar la mediana

PUNTAJES f F

15-24

25-34

35-44)

45-54

55-64

65-74

12

16

25

10

07

02

12

28

53

63

70

72

TOTAL 72

32

Donde:Md: Mediana

Li : Limite real inferior de la clase medina

C: Amplitud de la clase

n : Número de clase

Nj : Frecuencia acumulada absoluta de la clase mediana

Page 8: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

Ejemplo Nº 8: Con los datos de la tabla del ejemplo Nº 3; halle la mediana

EDADES fi xiF

i

12-15

15-18

18-21

21-24

2

5

8

5

TOTAL 20

3) MODA (Mo):

La moda de una serie de números es aquel valor que se presenta con la mayor

frecuencia, es decir, es el valor más común. La moda puede no existir, incluso si

existe puede no ser única.

Ejemplo Nº 9

A) El sistema: 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18; tiene moda 9

B) El sistema: 3, 5, 8, 10, 12, 15, 16; no tiene moda

C) El sistema: 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tiene dos modas: 4 y7; se llama

bimodal y

D) Una distribución que tiene una sola moda se llama unimodal

Representaciones Graficas De Distribuciones Unimodales Y Bimodales:

33

Frecuencia

Unimodal

Frecuencia

Bimodal

Page 9: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

En el caso de datos agrupados donde se ha construido una curva de frecuencias

para ajustar los datos, la moda será el valor (o valores) de x correspondientes al

máximo( o máximos) de la curva. Este valor de x se representa a veces por Mo

Ejemplo Nº 10:

El cuadro siguiente muestra los datos de las calificaciones de 43 estudiantes.

Halle la moda.

CALIFICACIONES f Fi

01-04

05-08

09-12

13-16

17-20

4

8

10

15

6

4

12

22

37

43

TOTAL 43

Se asume la probabilidad que la muestra se encuentra en la clase de más

frecuencia

a = 15-10 = 5; a = f4-f3

b = 15-6 = 9; b = f4-f5

Ejemplo Nº 11: Se tiene los datos de las estaturas de 57 alumnos de la Facultad

de Ingeniería de la U. N. T. Si se extrae un alumno al azar; calcular:

34

Donde:

Mo: Moda

Li : Frontera inferior(límite inferior) de la clase modal, es decir la

clase que contiene la moda

a: Exceso de la frecuencia modal sobre la frecuencia de clase contigua

inferior 1 = fj-fj-1

b: Exceso de la frecuencia modal sobre frecuencia de la clase contigua

Page 10: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

a) ¿Cuál es la talla esperada?

b) ¿Cuál es la talla más frecuente? Y

c) ¿Sobre que talla se encuentra el 50% de alumnos?

Solución:

a. La talla más esperada es la talla promedio

esto es, si tomamos un alumno al azar, esperamos que su talla sea

1.72m

b. La talla más frecuente es la talla modal

la talla más frecuente.

c.

TALLA f Fi xi

1.60-1.64

1.65-1.69

1.70-1.74

1.75-1.79

1.80-1.84

6

12

20

15

4

6

18

38

53

57

1.62

1.67

1.72

1.77

1.82

TOTAL 57

35

Li : 1.6951: 20-12 = 82: 20-15 = 5c: 0.05

Page 11: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

Clase Mediana:

Clase Mediana: 1.70-1.74

esto es, el 50% de los alumnos tienen una talla mayor o igual a

1.72m y el 50% de alumnos tienen una talla menor o igual a 1.72m

B) MEDIDAS DE VARIABILIDAD O

DISPERSIÓN

Supongamos que se ha encontrado que los ladrones y los profesores de

secundaria, en una ciudad determinada, tienen el mismo ingreso anual medio de

S/. 8000 ¿Indicaría necesariamente, este descubrimiento, que las dos

distribuciones de ingresos son iguales?. Por lo contrario, podría encontrarse que

difieren marcadamente en otro aspecto importante o sea, que los ingresos de los

profesores se agrupan estrechamente alrededor de los S/. 8000, mientras que

los ingresos de los ladrones son mucho más irregulares, reflejando mayores

oportunidades de encarcelamiento, de desempleo y pobreza, así como de una

riqueza poco usual.

Se puede ver que, además de una medida de tendencia central, necesitamos

un índice de cómo están diseminados los puntajes alrededor del centro de la

distribución. En una palabra, necesitamos una medida de lo que se conoce

comúnmente como dispersión o variabilidad. Podemos decir que la distribución

de ingresos entre profesores tiene menor variabilidad que la distribución de

ingresos de los ladrones. En esta ocasión trataremos las medidas de dispersión o

variabilidad más conocidas: el rango, desviación estándar y varianza.

1) EL RANGO (R):

Es la diferencia entre el puntaje más alto y el más bajo de la distribución.

Fórmula:

36

Li = 1.695n = Fa = 18Fme = 20c =0.05

R = VM _ Vm R: rangoVM: valor mayorVm: menor

Page 12: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

Ejemplo Nº 14: Halla el rango de los siguientes valores:

14, 19, 17, 18, 19, 02, 14, 11, 13, 14

Solución:

1º Buscamos el valor mayor (VM): 19

2º Identificamos el valor menor (Vm): 02

3º Reemplazamos en la formula dada (R = VM _ Vm)

R = 19-02

R = 17

La ventaja de esta medida es su cálculo rápido y fácil pero como desventaja

diremos que el rango depende totalmente de solo dos valores de puntajes así en

el ejemplo anterior el cambio de un valor de un dato puede variar en muchas

cifras al rango.

Ejemplo Nº 15: Si cambiamos el 02 por 11 tendremos:

14, 19, 17, 18, 19, 11, 14, 11, 13, 14

Solución:

El valor mayor sigue siendo 19, pero el valor menor es 11 lo que hace que

obtengamos el rango:

R = 19-11 ; R = 08

Ejemplo Nº 16: Halla el rango de los siguientes valores:

1, 6, 6, 3, 7, 4, 10

Solución:

1º Buscamos el valor mayor (VM): ........................

2º Identificamos el valor menor (Vm):....................

3º Reemplazamos en la formula dada (R = VM _ Vm)

37

Page 13: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

R =....................

R =....................

2) DESVIACIÓN ESTANDAR (S):

a. Desviación estándar para datos simples:

Es el valor que expresa el grado de dispersión de los datos alrededor de la

media aritmética. La dispersión se refiere a la diferencia existente entre cada

valor observado y la media aritmética

fórmula:

Ejemplo Nº 19: Frecuencia de hijos por familias

Nº DE HIJAS POR

FAMILIA(X)

F

5

4

3

2

1

2

1

3

2

1

38

Donde:

S: desviación estándar

: suma de los puntajes elevados al cuadrado

n: número total de datos

: media aritmética elevada al cuadrado

Page 14: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

Solución:

Agregamos f(x) y f(x)2 en la tabla

Obtenemos la media aritmética. ( )

Reemplazando:

Reemplazamos valores en la fórmula de la desviación estándar:

El grado de dispersión en que se encuentra los datos respecto a la media

es 2.04

Ejemplo Nº 20: Halle la desviación estándar de la distribución de

frecuencia de puntajes.

PUNTAJES(X) F9

8

7

6

2

5

8

7

Nº DE HIJAS POR

FAMILIA(X)

F f(x) f(x)2

7

6

5

4

3

2

1

2

1

3

2

1

4

2

14

06

15

08

03

08

02

98

36

75

32

09

16

02

TOTAL n=15 fx =56 fx2 =268

39

Page 15: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

5 4

Solución:

Agregamos f(x) y f(x)2 en la tabla

Obtenemos la media aritmética. ( )

Reemplazando:

Reemplazamos valores en la fórmula de la desviación estándar:

PUNTAJES(X) f f(x) f(x)2

10

9

8

7

6

5

2

5

8

7

4

3

TOTAL n= fx = fx2 =

40

Page 16: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

El grado de dispersión en que se encuentra los datos respecto a la media

es 2.04

b. Desviación estándar para datos agrupados:

Para datos agrupados se trabaja con la marca de clase (x i) de cada intervalo y se

procede de la misma como se trabajó para datos simples

Ejemplo Nº 21:

Veamos el procedimiento de este ejemplo sobre los calificativos de un grupo de

alumnos:

INTERVALOS f00-04

04-08

08-12

12-16

16-20

2

3

4

5

2

Datos Supuestos

Solución:

a. Agregamos las columnas que necesitamos en el cuadro:

INTERVALOS Xi f fXi fXi2

00-04

04-08

08-12

12-16

16-20

02

06

10

14

18

2

3

4

5

2

04

18

40

70

36

08

108

400

980

648

TOTAL n=16 168 2144

41

Page 17: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

B

. Obtenemos la media aritmética. (x)

Reemplazando:

b. Aplicamos la fórmula de la desviación estándar.

Apreciamos que los datos se encuentran más dispersos (en 4.87 unidades) de

la media aritmética.

3) VARIANZA (V):

Nos indica el grado de dispersión de las observaciones respecto a la media

aritmética considerándolas unidades elevadas al cuadrado.

Fórmula:

Es decir:

Ejemplo Nº 19: En el ejemplo presentamos anteriormente, siendo la desviación

estándar(S) igual a 4.87. Calcular la varianza:

Solución:

Si Reemplazando:

Ejercicio.

Hallar la varianza si se sabe que la S = 9

42

Donde:V: varianzaS: desviación estándar

Page 18: MEDIDAS ESTADISTICAS

Dra. Teresa Ortiz Távara Curso de Estadística Educacional

Hallar la desviación estándar si V= 9

43