medidas de dispersion
DESCRIPTION
Clase UDP EstadísticaTRANSCRIPT
-
Descriptores que cuantifican cuan variables, desparramadoso dispersos (o cuan concentrados) son los valores en una distribucin de frecuencias
Medidas de dispersin
0
1
2
3
4
5
6
7
8
9
1,55-1,60
1,61-1,65
1,65-1,70
1,71-1,75
1,75-1,80
1,81-1,85
1,85-1,90
1,91-1,95
Grupo 1Grupo 2
-
Medidas de Variabilidad (dispersin): Por que son tiles?
0
5
10
1 2 3 4 5 6 7
0
5
10
1 2 3 4 5 6 7
C1 C2
4 2
4 3
4 3
4 4
4 4
4 4
4 4
4 5
4 5
4 6
Prom. 4 4
Moda 4 4
Mediana 4 4
Curso 1
Curso 2
Notas
Dos conjuntos de datos pueden tener iguales medidas de posicin, pero la variabilidad (o desparramiento) de los datos puede ser diferente
-
Las medidas de dispersin ms usuales son:
Amplitud o rango Varianza Desviacin estndar Coeficiente de
Variacin
-
Amplitud, Rango o Recorrido (A, Re)
Diferencia entre el valor ms alto (mximo) y el ms bajo (mnimo) de una variable
C1 C2
4 2
4 3
4 3
4 4
4 4
4 4
4 4
4 5
4 5
4 6
0
5
10
1 2 3 4 5 6 7
0
5
10
1 2 3 4 5 6 7
Curso 1 Curso 2
A = 4 4 A = 0
A = 6 2 A = 4
Notas A = VMax VMin
*Tambin existe el Recorrido Intercuartlico = Q3 Q1
-
Varianza (s2, 2) Promedio de las desviaciones cuadrticas
N
xn
ii
=
= 1
2
2)(
1
)(1
2
2
==
n
xxs
n
ii
Varianza poblacional: Varianza muestral:
1)(...)()()( 223
22
212
++++
=n
xxxxxxxxs n
-
Ejemplo
s2 = (2-4)2 + (3-4)2+ (3-4)2 + (4-4)2 + (44)2 + (4-4)2 + (5-4)2 +(5-4)2 + (6-4)2
s2 = 1.333 9
Curso 1 s2 = (4-4)2 + (4-4)2+ (4-4)2 + (4-4)2 + (44)2 + (4-4)2 + (4-4)2 +(4-4)2 + (4-4)2
9 s2 = 0
Curso 2
C1: 4, 4, 4, 4, 4, 4, 4, 4, 4, 4 C2: 2, 3, 3, 4, 4, 4, 4, 5, 5, 6
-
Desviacin estndar o Desviacin tpica (s, )
Raz cuadrada positiva de la varianza. A diferencia de la varianza, sus unidades son las mismas de la variable
s = 0 = 0 s = 1.333 = 1.155
0
5
10
1 2 3 4 5 6 7
0
5
10
1 2 3 4 5 6 7
Curso 1 Curso 2
2ss =
-
Coeficiente de variacin (CV) Es la desviacin estndar dividida por el promedio. Representa el nmero de veces que la desviacin tpica contiene a la media aritmtica
CV = (s / x)
0
5
10
1 2 3 4 5 6 7
0
5
10
1 2 3 4 5 6 7
Curso 1 Curso 2
CV= (0/4) = 0 CV= (1.155/4) = 0.289
* Algunas veces, el CV se expresa como porcentaje
-
Cuando usar cada una de las medidas de dispersin?
Varianza y desviacin estndar son las ms comunes
Si se dispone de muy pocos datos, se puede usar el rango
Si se desea comparar dos grupos cuyas magnitudes son muy distintas, se puede usar el CV
El CV tambin es til para comparar la dispersin de dos variables de distinta naturaleza
-
Formas de una distribucin de frecuencias
Es posible caracterizar la forma que tiene una distribucin de frecuencias. La distribucin normal es una referencia
Dos conjuntos de datos pueden tener iguales medidas de posicin, pero la variabilidad de los datos puede ser diferente
-
Simetra Es simtrica aquella distribucin en que media, mediana y moda, coinciden. De otro modo, la distribucin es asimtrica
-
Apuntamiento o Curtosis Dependiendo de la frecuencia de valores que se agrupan en torno a la moda se pueden describir tres tipos de distribuciones
Medidas de dispersinMedidas de Variabilidad (dispersin): Por que son tiles?Las medidas de dispersin ms usuales son:Amplitud, Rango o Recorrido (A, Re)Varianza (s2, s2)EjemploDesviacin estndar o Desviacin tpica (s, s)Coeficiente de variacin (CV)Cuando usar cada una de las medidas de dispersin? Formas de una distribucin de frecuenciasSimetraApuntamiento o Curtosis