medidas estadisticas
DESCRIPTION
Temas del compendio de estadística.TRANSCRIPT
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
MEDIDAS ESTADÍSTICAS
Cuando tenemos un conjunto de datos agrupados, se requieren de medidas
representativas que son:
a) Medidas de Tendencia Central
b) Medidas de variabilidad o dispersión que indica cuan variable son los
datos
A) MEDIDAS DE TENDENCIA CENTRAL: PROMEDIOS
Los investigadores, en muchos campos, han utilizado el término “Promedio” para
hacer preguntas tales como: ¿ Cuál es el ingreso promedio que reciben los bachilleres y
los profesionales?, ¿Cuál es el promedio de calificaciones de los universitarios? En
promedio, ¿Cuántos accidentes automovilísticos ocurren como resultados directo de
alcohol o drogas?
Una manera útil de describir a un grupo en su totalidad es encontrar un número único
que represente lo “Promedio” de ese conjunto de puntajes. En la investigación, ese valor
se conoce como Medida de Tendencia Central, ya que está generalmente localizada
hacia el medio o centro de una distribución en donde la mayoría de los puntajes tienden a
concentrarse.
26
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
Trataremos tres medidas de tendencia central más
conocidas, como: Media, Mediana y Moda.
1) MEDIA ARITMÉTICA:
a) Media aritmética para datos simples:
La media aritmética muestral ( ) se calcula mediante la siguiente fórmula:
Ejemplo Nº 1: Aplicando la fórmula arriba expuesta, encontramos que la media
del coeficiente intelectual de los 8 entrevistados listados en la tabla.
TABLA Nº 1: Coeficiente intelectual de 8 entrevistados.
ENTREVISTADOCOEFICIENTE
INTELECTUAL(C .I )Leticia 125
Francisco 92Sara 72
Miguel 126Rebeca 120Rocío 99Juan 130Pablo 100
27
PROMEDIOS
MEDIA
MODA
MEDIANA
GeométricaArmónica
Aritmética
Muestral
Poblacional
Ponderada
SimpleDatos agrupados
Datos no agrupados
Datos agrupadosDatos no agrupados
Datos simplesDatos agrupados
Cuartiles Deciles Percentiles
Donde: n: es el número de datos xi: es un dato de la muestra
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
Ejemplo Nª 2: Calcule el promedio de notas de los alumnos de educación inicial-UNT
TABLA Nº 2: Notas de Estadística de los alumnos
de la Escuela Educación. Inicial de la UNT en 2014
Fuente: Datos supuestos
b) Media Aritmética para datos agrupados:
Tabla 03: Calificativos obtenidos por alumnos del Club
Los Intelectuales en el test de lectura veloz
PUNTAJES fi xi xifi
00-04
04-08
08-12
12-16
16-20
12
16
23
17
11
Notas f08 12
10 10
11 20
12 10
13 5
total
28
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
TOTAL
Fuente: Datos supuestos.
La fórmula es:
Sustituyendo los datos del cuadro anterior, se obtiene
Ejemplo Nº 3: Complete y encuentre la media para la siguiente frecuencia
agrupada:
EDADES fi xi xifi
12-15
15-18
18-21
21-24
2
5
8
5
TOTAL 20
Ejemplo Nº 4:
Se pidió a 31 niños matriculados en 1º grado del curso de matemática que
indicaran el número de hermanos(as) que viven en su hogar. Cuál es el número
promedio de hermanos. Los datos resultantes se forman en la siguiente
distribución de frecuencia
Nº DE HER-MANOS
fi fixi
5
4
3
2
1
6
7
9
5
4
TOTAL 31
29
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
2) MEDIANA (Med):
Representa el valor intermedio de los datos de una serie ordenada en forma
ascendente o descendente. Es decir el 50 % de datos aproximadamente estarán
debajo de la mediana o tendrán valores menores o iguales que la mediana o el
50% tendrán valores mayores o iguales de la mediana.
a) Mediana para datos simples
Ejemplo Nº 5: Halle la mediana de los datos
a. 4, 8, 3, 2, 10
b. 3, 8, 10, 7, 3, 5
c. 10,12,14,8,6,7,10,10
d. 3,3,4,3,1,6,5,6,6,4
Solución:
a) Se ordena los datos en forma creciente:
2, 3, 4, 8, 10
Luego: Med = 4
b) Ordenando: 3, 3, 5, 7, 8, 10
Tenemos: Med =
c) Ordena la serie: ...................................................
Luego, aplique:
30
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
d) Ordene en forma creciente: ......................................
Entonces, Med =
REGLAS:
Si la serie es impar, la mediana ocupa el lugar central.
Si la serie es par, la mediana se halla por la semi suma de los valores
centrales.
Si la serie es par o impar, el lugar que ocupa la medina es siempre:
Ejemplo Nº 6: Del ejemplo Nº 4, halle la mediana aplicando su respectiva
fórmula.
Nº DE HER-MANOS
f
1
2
3
4
5
6
7
9
5
4
TOTAL 31
b) Mediana para datos agrupados:
Para datos agrupados la mediana se halla utilizando una fórmula. Utilizaremos el
ejemplo de las calificaciones de los 100 estudiantes dados en la página 14
PUNTAJES f F30-39
40-49
50-59
60-69
70-79
80-89
90-99
12
12
16
23
17
11
09
12
24
40
63
80
91
100
TOTAL 100
31
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
FÓRMULA:
La interpretación del valor de Med = 63,84 es que el 50% de estudiantes
tienen un puntaje por encima de 63.,84 y el 50 % restante un puntaje por debajo
de 63,84.
Ejemplo Nº 7: Con los datos de la tabla siguiente, hallar la mediana
PUNTAJES f F
15-24
25-34
35-44)
45-54
55-64
65-74
12
16
25
10
07
02
12
28
53
63
70
72
TOTAL 72
32
Donde:Md: Mediana
Li : Limite real inferior de la clase medina
C: Amplitud de la clase
n : Número de clase
Nj : Frecuencia acumulada absoluta de la clase mediana
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
Ejemplo Nº 8: Con los datos de la tabla del ejemplo Nº 3; halle la mediana
EDADES fi xiF
i
12-15
15-18
18-21
21-24
2
5
8
5
TOTAL 20
3) MODA (Mo):
La moda de una serie de números es aquel valor que se presenta con la mayor
frecuencia, es decir, es el valor más común. La moda puede no existir, incluso si
existe puede no ser única.
Ejemplo Nº 9
A) El sistema: 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18; tiene moda 9
B) El sistema: 3, 5, 8, 10, 12, 15, 16; no tiene moda
C) El sistema: 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tiene dos modas: 4 y7; se llama
bimodal y
D) Una distribución que tiene una sola moda se llama unimodal
Representaciones Graficas De Distribuciones Unimodales Y Bimodales:
33
Frecuencia
Unimodal
Frecuencia
Bimodal
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
En el caso de datos agrupados donde se ha construido una curva de frecuencias
para ajustar los datos, la moda será el valor (o valores) de x correspondientes al
máximo( o máximos) de la curva. Este valor de x se representa a veces por Mo
Ejemplo Nº 10:
El cuadro siguiente muestra los datos de las calificaciones de 43 estudiantes.
Halle la moda.
CALIFICACIONES f Fi
01-04
05-08
09-12
13-16
17-20
4
8
10
15
6
4
12
22
37
43
TOTAL 43
Se asume la probabilidad que la muestra se encuentra en la clase de más
frecuencia
a = 15-10 = 5; a = f4-f3
b = 15-6 = 9; b = f4-f5
Ejemplo Nº 11: Se tiene los datos de las estaturas de 57 alumnos de la Facultad
de Ingeniería de la U. N. T. Si se extrae un alumno al azar; calcular:
34
Donde:
Mo: Moda
Li : Frontera inferior(límite inferior) de la clase modal, es decir la
clase que contiene la moda
a: Exceso de la frecuencia modal sobre la frecuencia de clase contigua
inferior 1 = fj-fj-1
b: Exceso de la frecuencia modal sobre frecuencia de la clase contigua
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
a) ¿Cuál es la talla esperada?
b) ¿Cuál es la talla más frecuente? Y
c) ¿Sobre que talla se encuentra el 50% de alumnos?
Solución:
a. La talla más esperada es la talla promedio
esto es, si tomamos un alumno al azar, esperamos que su talla sea
1.72m
b. La talla más frecuente es la talla modal
la talla más frecuente.
c.
TALLA f Fi xi
1.60-1.64
1.65-1.69
1.70-1.74
1.75-1.79
1.80-1.84
6
12
20
15
4
6
18
38
53
57
1.62
1.67
1.72
1.77
1.82
TOTAL 57
35
Li : 1.6951: 20-12 = 82: 20-15 = 5c: 0.05
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
Clase Mediana:
Clase Mediana: 1.70-1.74
esto es, el 50% de los alumnos tienen una talla mayor o igual a
1.72m y el 50% de alumnos tienen una talla menor o igual a 1.72m
B) MEDIDAS DE VARIABILIDAD O
DISPERSIÓN
Supongamos que se ha encontrado que los ladrones y los profesores de
secundaria, en una ciudad determinada, tienen el mismo ingreso anual medio de
S/. 8000 ¿Indicaría necesariamente, este descubrimiento, que las dos
distribuciones de ingresos son iguales?. Por lo contrario, podría encontrarse que
difieren marcadamente en otro aspecto importante o sea, que los ingresos de los
profesores se agrupan estrechamente alrededor de los S/. 8000, mientras que
los ingresos de los ladrones son mucho más irregulares, reflejando mayores
oportunidades de encarcelamiento, de desempleo y pobreza, así como de una
riqueza poco usual.
Se puede ver que, además de una medida de tendencia central, necesitamos
un índice de cómo están diseminados los puntajes alrededor del centro de la
distribución. En una palabra, necesitamos una medida de lo que se conoce
comúnmente como dispersión o variabilidad. Podemos decir que la distribución
de ingresos entre profesores tiene menor variabilidad que la distribución de
ingresos de los ladrones. En esta ocasión trataremos las medidas de dispersión o
variabilidad más conocidas: el rango, desviación estándar y varianza.
1) EL RANGO (R):
Es la diferencia entre el puntaje más alto y el más bajo de la distribución.
Fórmula:
36
Li = 1.695n = Fa = 18Fme = 20c =0.05
R = VM _ Vm R: rangoVM: valor mayorVm: menor
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
Ejemplo Nº 14: Halla el rango de los siguientes valores:
14, 19, 17, 18, 19, 02, 14, 11, 13, 14
Solución:
1º Buscamos el valor mayor (VM): 19
2º Identificamos el valor menor (Vm): 02
3º Reemplazamos en la formula dada (R = VM _ Vm)
R = 19-02
R = 17
La ventaja de esta medida es su cálculo rápido y fácil pero como desventaja
diremos que el rango depende totalmente de solo dos valores de puntajes así en
el ejemplo anterior el cambio de un valor de un dato puede variar en muchas
cifras al rango.
Ejemplo Nº 15: Si cambiamos el 02 por 11 tendremos:
14, 19, 17, 18, 19, 11, 14, 11, 13, 14
Solución:
El valor mayor sigue siendo 19, pero el valor menor es 11 lo que hace que
obtengamos el rango:
R = 19-11 ; R = 08
Ejemplo Nº 16: Halla el rango de los siguientes valores:
1, 6, 6, 3, 7, 4, 10
Solución:
1º Buscamos el valor mayor (VM): ........................
2º Identificamos el valor menor (Vm):....................
3º Reemplazamos en la formula dada (R = VM _ Vm)
37
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
R =....................
R =....................
2) DESVIACIÓN ESTANDAR (S):
a. Desviación estándar para datos simples:
Es el valor que expresa el grado de dispersión de los datos alrededor de la
media aritmética. La dispersión se refiere a la diferencia existente entre cada
valor observado y la media aritmética
fórmula:
Ejemplo Nº 19: Frecuencia de hijos por familias
Nº DE HIJAS POR
FAMILIA(X)
F
5
4
3
2
1
2
1
3
2
1
38
Donde:
S: desviación estándar
: suma de los puntajes elevados al cuadrado
n: número total de datos
: media aritmética elevada al cuadrado
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
Solución:
Agregamos f(x) y f(x)2 en la tabla
Obtenemos la media aritmética. ( )
Reemplazando:
Reemplazamos valores en la fórmula de la desviación estándar:
El grado de dispersión en que se encuentra los datos respecto a la media
es 2.04
Ejemplo Nº 20: Halle la desviación estándar de la distribución de
frecuencia de puntajes.
PUNTAJES(X) F9
8
7
6
2
5
8
7
Nº DE HIJAS POR
FAMILIA(X)
F f(x) f(x)2
7
6
5
4
3
2
1
2
1
3
2
1
4
2
14
06
15
08
03
08
02
98
36
75
32
09
16
02
TOTAL n=15 fx =56 fx2 =268
39
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
5 4
Solución:
Agregamos f(x) y f(x)2 en la tabla
Obtenemos la media aritmética. ( )
Reemplazando:
Reemplazamos valores en la fórmula de la desviación estándar:
PUNTAJES(X) f f(x) f(x)2
10
9
8
7
6
5
2
5
8
7
4
3
TOTAL n= fx = fx2 =
40
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
El grado de dispersión en que se encuentra los datos respecto a la media
es 2.04
b. Desviación estándar para datos agrupados:
Para datos agrupados se trabaja con la marca de clase (x i) de cada intervalo y se
procede de la misma como se trabajó para datos simples
Ejemplo Nº 21:
Veamos el procedimiento de este ejemplo sobre los calificativos de un grupo de
alumnos:
INTERVALOS f00-04
04-08
08-12
12-16
16-20
2
3
4
5
2
Datos Supuestos
Solución:
a. Agregamos las columnas que necesitamos en el cuadro:
INTERVALOS Xi f fXi fXi2
00-04
04-08
08-12
12-16
16-20
02
06
10
14
18
2
3
4
5
2
04
18
40
70
36
08
108
400
980
648
TOTAL n=16 168 2144
41
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
B
. Obtenemos la media aritmética. (x)
Reemplazando:
b. Aplicamos la fórmula de la desviación estándar.
Apreciamos que los datos se encuentran más dispersos (en 4.87 unidades) de
la media aritmética.
3) VARIANZA (V):
Nos indica el grado de dispersión de las observaciones respecto a la media
aritmética considerándolas unidades elevadas al cuadrado.
Fórmula:
Es decir:
Ejemplo Nº 19: En el ejemplo presentamos anteriormente, siendo la desviación
estándar(S) igual a 4.87. Calcular la varianza:
Solución:
Si Reemplazando:
Ejercicio.
Hallar la varianza si se sabe que la S = 9
42
Donde:V: varianzaS: desviación estándar
Dra. Teresa Ortiz Távara Curso de Estadística Educacional
Hallar la desviación estándar si V= 9
43