estadistica general
DESCRIPTION
estadística generalTRANSCRIPT
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
ESTADISTICA GENERAL
AUTOR.
Lic. MARTIN SATZ TOL
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
OBJETIVOS GENERALES
Al finalizar el curso, el estudiante de la universidad estar en la capacidad de:
1. Valorar la importancia de la estadstica, por su aplicabilidad, en todos los
aspectos de la vida.
2. Emplear tcnicas de estudio y de investigacin en trabajos especficos,
promoviendo as la investigacin cientfica con base en la estadstica.
3. Utilizar los principios y conocimientos estadsticos en la solucin de problemas
comerciales y cientficos.
4. Generar soluciones creativas para los distintos problemas nacionales que se le
presenten.
OBJETIVOS ESPECFICOS
Al finalizar el curso el estudiante estar en la capacidad de:
1. Aplicar las etapas de la investigacin estadstica en la solucin de problemas
cotidianos.
2. Tabular con eficiencia una serie de datos simples y agrupados.
3. Elaborar e interpretar con eficiencia cualquier grfica que se le solicite.
4. Calcular e interpretar cualquier medida de tendencia central y des dispersin en
datos agrupados y sin agrupar.
5. Diferenciar una curva de otra, por su grado de agudez.
6. Utilizar el concepto de correlacin, su uso y resolver problemas mediante la
regresin,
7. Conocer, analizar y resolver problemas relativos a la teora de probabilidades.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
PROGRAMA DE ESTUDIOS
UNVIERSIDAD GALILEO
FACULTAD DE EDUCACIN
ZARAGOZA, CHIMALTENANGO
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL
JUSTIFICACIN
Es importante reconocer el valioso aporte que la estadstica fundamental ofrece a
la investigacin cientfica, es por ello que el estudiante de cualquier carrera universitaria
debe incluir el inicio de su formacin profesional el estudio de los principios de la
estadstica fundamental. Durante el proceso de Aprendizaje-Enseanza de estadstica
descriptiva, el/la estudiante desarrollar la capacidad para plantear y resolver
problemas relacionados con la estadstica as como la interpretacin adecuada de los
enunciados y los resultados de los conceptos mas importantes por lo que se hace
nfasis en el manejo de la tecnologa a travs de paquetes estadsticos y su aplicacin
en investigaciones relacionados con el campo de la educacin
DESCRIPCION DEL CURSO
Este curso se apoya en la matemtica y es parte del lgebra con el fin de que
los y las estudiantes valoren el papel de la estadstica descriptiva reconociendo su
naturaleza multidisciplinaria y social, as como su utilidad en la labor docente.
Se orienta hacia la utilizacin de tcnicas elementales de recoleccin y
ordenamiento de datos para obtener informacin sobre fenmenos y situaciones de su
entorno, representarlos en forma grfica as como el anlisis de las distribuciones de
frecuencias y las medidas asociadas de tendencia central, dispersin, sesgo y curtosis.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
COMPETENCIA INDICADORES DE LOGRO CONTENIDOS
1 Utiliza la informacin obtenida por medio de la aplicacin de diferentes procedimientos estadsticos descriptivos en la toma de decisiones.
1.1 Aplica los conceptos bsicos de la estadstica para tomar decisiones respecto a la recoleccin de informacin en su contexto o entorno. 1.2 Interpreta distintos tipos de grficos, cuadros y tablas
1.1.1 Definicin de estadstica, conceptos bsicos, poblacin, muestra, variables, censo, etc 1.1.2 Identificacin de conceptos bsicos en situaciones donde se aplica la estadstica (encuestas, peridicos, tesis, investigaciones, etc). 1.1.3 Identificacin de procedimientos adecuados para la recoleccin de informacin: Encuesta, entrevista, observacin, cuestionario, entre otras. 1.1.4 Elaboracin de instrumentos para recoleccin de informacin. 1.1.5 Recoleccin de informacin por medio de un instrumento. 1.2.1 Tabulacin de los resultados: distribucin de frecuencias para datos no agrupados y datos agrupados. 1.2.2 Elaboracin de tablas y cuadros para la presentacin de resultados estadsticos.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
1.3 Aplica las medidas de tendencia central, dispersin y posicin, con la intencin de analizar un fenmeno estudiado para la interpretacin completa y de mayor validez.
1.2.3 Elaboracin de grficas: Barras, circular, columnas lineales, polgonos etc. 1.2.4 Elaboracin de diagramas, rbol de problemas etc. 1.2.5 Construccin de histogramas para frecuencia simple y frecuencias acumulada. 1.3.1 Seleccin de los procedimientos adecuados para la solucin de los diferentes problemas estadsticos. 1.3.2 Clculo de las diferentes medidas de tendencia central: MEDIA, MEDIANA, MODA,. 1.3.3 Clculo de las diferentes medidas de dispersin, rango, varianza y DESVIACIN ESTANDAR. 1.3.4 Clculo de las diferentes medidas e posicin, cuartil, decil y percentil. 1.3.5 Demostracin de tica y responsabilidad en el manejo de la informacin estadstica.
2. Interpreta la informacin estadstica de diferentes fuentes.
2.1 Utiliza diferentes mtodos para la interpretacin de resultados estadsticos.
2.1.1 Anlisis de los resultados de estadstica descriptiva.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
2.2 Utiliza la informacin estadstica de diferentes fuentes para enriquecer su labor docente
2.1.2 Interpretacin de medidas de asimetra: sesgo de una distribucin, a la derecha y a la izquierda. 2.2.1 Lectura de cuadros, tablas, base o consolidados y censos elaborados por distintas entidades, INE, ONGS, MINEDUC ETC. 2.2.2 Anlisis crtico de la informacin estadstico de diferentes fuentes.
3. Utiliza la tecnologa existente en el anlisis estadstico
3.1 Selecciona la tecnologa adecuada para la elaboracin de estadsticas
3.1.1 Uso de Software para la elaboracin de cuadros, diagramas, grficos y tablas. 3.1.2 Elaboracin de estadstica descriptiva usando la tecnologa
EVALUACIN
4 Tareas a 5 puntos c/u 20 puntos
2 Parciales de 20 pts c/u 40 puntos
1 trabajo de investigacin comparativa 20 pts
Evaluacin final 20 puntos
TOTAL 100 PUNTOS
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
BIBLIOGRAFIA SUGERIDA
BERENSON, MARK Estadistica para la Administracin, editorial Prentice Hall.
LEVIN JACK. Fundamentos de estadstica en la investigacin social, edit Harla,
S.A, Mxico DF 1979.
DANIEL WAYNE W. Estadstica con aplicaciones a las ciencias sociales y la
Educacin, Mxico, Mc. Graw Hill, 1984
GUILFOD, JP FRUTCHER B. Estadstica aplicada. Edit Mc Graw Hill, Mxico DF 1984
BERNARDO OSTLE. Estadstica aplicada, tcnicas de la estadstica moderna cuando
y donde aplicarlas, centro regional de ayuda tcnica, AID Mxico 1965.
WALPOLE, RONAL E. Y MYERS RAYMOND H. Probabilidad y estadstica. Mxico D.F
Editorial McGraw/Interamericana de Mxico.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
CRONOGRAMA DE ACTIVIDADES
Entrega de trabajos y evaluaciones
TAREAS ENERO FEBRERO MARZO ABRIL MAYO JUNIO
FECHAS DE ENTREGA
16 23
30 6 13 20 27 6 13 20 27 3 10 17 24 1 8 15 22 29 5 12
CLASE
INAUGURAL
TAREA 1
TAREA 2
TAREA 3
PARCIAL 1
TAREA 4
PARCIAL 2
ENTREGA DE
INVESTIGACI
N
PRUEBA
FINAL
Nota: no se aceptan trabajos fuera de tiempo ya que para eso, todo esta
calendarizado.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
TEMATICA GENERAL DEL CURSO
Temtica I
1. Introduccin, generalidades, conceptualizacin bsica. 2. Razones por las que el investigador social emplea la estadstica. 3. Naturaleza de la investigacin educativa. 4. Por qu probar hiptesis. 5. las Etapas de una investigacin social o educativa. 6. Funciones de la estadstica 7. El uso de series nmeros en la investigacin
Temtica II
1 Organizacin de datos 2 Distribucin de frecuencias nominales 3 Comparacin de las distribuciones 4 Distribucin de frecuencias agrupadas de datos por intervalos 5 Distribuciones acumuladas 6 Rango percentil
Temtica III
1. Grficas de sectores 2. grfica de barras 3. polgono de frecuencia 4. construccin de barra y polgonos de frecuencia 5. la forma de una distribucin de frecuencia
Temtica IV
1 Medidas de tendencia central 2 Media Aritmtica 3 Mediana 4 Moda 5 Comparaciones entre ellas y la media de una distribucin de frecuencia
agrupada.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
Temtica V
1. Medidas de dispersin o variabilidad
2. Rango
3. La desviacin media
4. La distribucin Estndar
Comparacin entre el rango, la desviacin media y la desviacin estndar
Clculo de rango.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
1
Evolucin, concepto y aplicacin de la
estadstica
1.1 EVOLUCIN HISTRICA
La primera etapa de la estadstica nace, por la necesidad de hacer ciertos recuentos
de las riquezas que se posean o de los hombres que se tenan a la mano para
cualquier actividad de conquista o conservacin de los bienes.
Desde los comienzos de la civilizacin han existido formas sencillas de estadstica,
pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos
de madera y paredes de cuevas para contar el nmero de personas, animales o cosas.
Hacia el ao 3000 a.C. los babilonios usaban pequeas tablillas de arcilla para recopilar
datos sobre la produccin agrcola y sobre los gneros vendidos o cambiados mediante
trueque. En el siglo XXXI a.C., mucho antes de construir las pirmides, los egipcios
analizaban los datos de la poblacin y la renta del pas. Los libros bblicos de Nmeros
y Crnicas incluyen, en algunas partes, trabajos de estadstica. El primero contiene dos
censos de la poblacin de Israel y el segundo describe el bienestar material de las
diversas tribus judas. En China existan registros numricos similares con anterioridad
al ao 2000 a.C. Los griegos clsicos realizaban censos cuya informacin se utilizaba
hacia el 594 a.C. para cobrar impuestos.
El Imperio romano fue el primer gobierno que recopil una gran cantidad de datos
sobre la poblacin, superficie y renta de todos los territorios bajo su control. Durante la
edad media slo se realizaron algunos censos exhaustivos en Europa.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
Los reyes caloringios Pipino el Breve y Carlomagno ordenaron hacer estudios
minuciosos de las propiedades de la Iglesia en los aos 758 y 762 respectivamente.
Despus de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de
Inglaterra encarg la realizacin de un censo. La informacin obtenida con este censo,
llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y
defunciones comenz en Inglaterra a principios del siglo XVI, y en 1662 apareci el
primer estudio estadstico notable de poblacin, titulado Observations on the London
Bills of Mortality (Comentarios sobre las partidas de defuncin en Londres).
Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania,
realizado en 1691, fue utilizado por el astrnomo ingls Edmund Halley como base para
la primera tabla de mortalidad. En el siglo XIX, con la generalizacin del mtodo
cientfico para estudiar todos los fenmenos de las ciencias naturales y sociales, los
investigadores aceptaron la necesidad de reducir la informacin a valores numricos
para evitar la ambigedad de las descripciones verbales.
En nuestros das, la estadstica se ha convertido en un mtodo efectivo para
describir con exactitud los valores de datos econmicos, polticos, sociales,
psicolgicos, biolgicos o fsicos, y sirve como herramienta para relacionar y analizar
dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir y tabular
los datos, sino sobre todo en el proceso de interpretacin de esa informacin.
1.2 LA ESTADISTICA EN GUATEMALA
El nico testimonio de actividad estadstica que se encuentra Registrado en
Guatemala es el censo levantado por las autoridades eclesisticas en 1778, quienes lo
hicieron fue con fines religiosos y tributarios.
A partir de la independencia como consecuencia de ideas liberales procedentes
de Europa, Jos Cecilio del Valle, aparece como el primer intelectual preocupado por la
estructuracin de la estadstica en el istmo. Se nota primordialmente al publicar sus
escritos y uno de ellos el Semanario El amigo de la patria 1820 22 bajo el ttulo, La
estadstica Plataforma del enaltecimiento Social.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
Pero el 15 de noviembre de 1823, se promulgo una ley sobre la manera de
formar la estadstica de las provincias unidas de Centroamrica.
EL 19 de mayo de 1824, se emiti el primer decreto que ordenaba los censos de
poblacin y al amparo de esta ley se ordena el levantamiento por decreto, los censos
de poblacin. Y el 13 de julio de 1825 se emite el acuerdo designando la primera
comisin nacional de estadstica.
En 1879, durante la administracin del General Justo Rufino Barrios, se fund la
primera seccin de estadstica (1880) que tuvo a su cargo el levantamiento del primer
censo oficial de poblacin de la repblica (segundo cronolgicamente).
En agosto de 1886 la seccin de estadstica se eleva a categora de Direccin
General de estadstica, quin en 1893 levant el tercer censo de poblacin general.
El 16 de marzo de 1936, por decreto No 1797, la Direccin General de
estadstica es adscrita al Ministerio de Hacienda y Crdito pblico, donde el 18 de mayo
del mismo ao, se promulg una ley de estadstica que estuvo en vigencia hasta 1955.
En diciembre de 1944 la Direccin General de Estadstica pas a la jurisdiccin
del Ministerio de Economa y Trabajo, creado por la junta Revolucionaria de Gobierno.
A partir de 1985, la Direccin General de Estadstica se convierte en el Instituto
Nacional de Estadstica (INE) . Mediante el decreto legislativo No. 385 ley de
estadstica, de fecha 15 de enero de 1985.1
1.3 CONCEPTO Y DEFINICIN
CONCEPTO: del latn STATUS que significa estado.
DEFINICIONES
Estadstica, rama de las matemticas que se ocupa de reunir, organizar y analizar datos numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones.
Es una ciencia que tiene por objeto la recoleccin, clasificacin y presentacin de los hechos, sujetos a una apreciacin numrica, con el fin de describir, explicar y comparar un fenmeno.
Es una ciencia que estudia los fenmenos colectivos, mediante la observacin numrica, el anlisis matemtico y la interpretacin lgica, investigando especialmente sus causas y sus leyes.
1 Fuente consultada para historia de la estadstica en Guatemala, los apuntes de Lic. Ren Arturo Orellana, (INE)
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
Es la metodologa para la recoleccin, anlisis, interpretacin, y extraccin de conclusiones de la informacin numrica.
Es la ciencia de la recopilacin, clasificacin, procesamiento, presentacin e interpretacin de datos.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
2
CONCEPTOS BSICOS
1 tarea individual
investigar los siguientes conceptos. Valor 3 puntos
Poblacin
Muestra
Clases de muestra
Caractersticas de una muestra
Variables
Atributo.
Hiptesis
Tipos de hiptesis
Razones
Mtodo
Tcnica
Valor cualitativo
Valor cuantitativo.
Mtodo estadstico
2.1 POBLACIN
Se le da este nombre al conjunto de elementos con caractersticas comunes que
se incluyen en el estudio estadstico. Los elementos pueden ser personas, animales,
plantas u objetos. Las caractersticas pueden ser la edad, el sexo, la produccin, la
resistencia al calor, la reproduccin, adaptacin a un lugar, hbitos alimenticios, etc.
2.2 MUESTRA:
Se le denomina as a la seleccin de la variacin de una caracterstica
determinada en funcin de la muestra escogida. Estas pueden ser aleatorias o no
aleatorias
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
CLASES DE MUESTRAS
a) Muestra sacada al azar.
b) Muestra estratificada.
c) Muestra sacada intencionalmente.
CARACTERISTICAS DE UNA MUESTRAS
a) Que sea representativa.
b) Que tenga un tamao idneo.
c) Que intervenga al azar.
EJEMPLOS:
1. Si se fabrican 80,000 unidades de un producto Y
a) La poblacin, la constituyen las 80,000 unidades.
b) Una muestra mnima sera una cantidad de 350 unidades, que
deben ser tomadas al azar.
2. Varias veces al da un Ingeniero industrial, de control de calidad, en
una fabrica de textiles, selecciona diferentes muestras de yardas
cuadradas de tela, las examina y registra el nmero de imperfecciones
que encuentra.
a) La poblacin es: el total de yardas cuadradas producidas por la
fbrica de textiles en un da.
b) La muestra es: el total de yardas empleadas en la inspeccin.
c) La unidad de observacin es: cada una de las yardas
seleccionadas para la observacin.
d) La medicin es: Cuantitativa.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
2.3 FENMENOS QUE ESTUDIA LA ESTADSTICA
El crecimiento de la poblacin
Edad promedio de vida de los seres segn condiciones.
Muertes a causa de enfermedades.
Probabilidad se supervivencia en los seres.
Problemas econmicos de una nacin, institucin o empresa.
Porcentaje de ventas por trabajadores.
Cantidad de poblacin atendida en educacin.
Condiciones habitacionales.
Aceptacin que puede tener un producto en el mercado.
TAREA INDIVIDUAL 2
Instrucciones:
Con lo expuesto anteriormente elabore un perfil de investigacin tomando en cuenta los
pasos sugeridos para investigar, (seleccin del tema a investigar, seleccin de la
muestra, tipo de mtodo a utilizar, tcnicas a utilizar y recursos a utilizar, no se le olvide
elaborar su cronograma de investigacin
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
3
ESTADISTICA DESCRIPTIVA Y ESTADISTICA
INFERENCIAL
3.1 ESTADISTICA DESCRIPTIVA
Llamada tambin DEDUCTIVA, es la parte de la estadstica qu analiza, estudia
y describe a la totalidad de individuos de una poblacin.
Su finalidad es obtener informacin, analizarla, elaborarla y simplificarla lo
necesario para que pueda ser interpretada cmoda y rpidamente y, por tanto, pueda
utilizarse eficazmente para el fin que se desee.
El proceso que sigue la estadstica descriptiva para el estudio de una cierta
poblacin consta de los siguientes pasos:
Seleccin de caracteres dignos de ser estudiados.
Mediante encuesta o medicin, se obtiene el valor de cada individuo en los caracteres
seleccionados.
Elaboracin de tablas de frecuencias, mediante la adecuada clasificacin de los
individuos dentro de cada carcter.
Representacin grfica de los resultados (elaboracin de grficas estadsticas).
Obtencin de parmetros estadsticos, nmeros que sintetizan los aspectos ms
relevantes de una distribucin estadstica.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
3.2 ESTADISTICA INFERENCIAL
Llamada tambin estadstica INDUCTIVA es la parte de los mtodos estadsticos
que ayuda a conocer algn aspecto de la poblacin mediante el conocimiento de ciertos
aspectos de la muestra.
La estadstica descriptiva trabaja con todos los individuos de la poblacin. La
estadstica inferencial, sin embargo, trabaja con muestras, subconjuntos formados por
algunos individuos de la poblacin. A partir del estudio de la muestra se pretende inferir
aspectos relevantes de toda la poblacin. Cmo se selecciona la muestra, cmo se
realiza la inferencia, y qu grado de confianza se puede tener en ella son aspectos
fundamentales de la estadstica inferencial, para cuyo estudio se requiere un alto nivel
de conocimientos de estadstica, probabilidad y matemticas.
Los aspectos que generalmente deseamos conocer de una poblacin son: la
estimacin de un promedio o de un porcentaje, o la prueba de hiptesis. La estimacin
y la prueba de hiptesis son dos partes importantes de la estadstica inferencial. Los
procedimientos o porcentajes, que se desean conocer de una poblacin se llaman
parmetros; estos se calcularn con los datos de la muestra y se llaman estadsticos.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
4
MTODO ESTADISTICO
mtodo. (Del lat. methdus, y este del griego. ). Camino a seguir m.
Modo de decir o hacer con orden algo.
El objetivo de la estadstica es hacer inferencias (predicciones, decisiones),
acerca de una poblacin, sobre la base de la informacin obtenida de una muestra.
En una investigacin estadstica, podemos definir las siguientes etapas:
1. PLANIFICACION
Nos vamos a plantear QU ES LO QUE VA A HACERSE, lo que nos conducir a
la investigacin o reafirmacin del problema que nos interesa. Si sabemos
claramente, qu es lo que vamos a hacer, tenemos que saber EL POR QU LO
VAMOS HACER? Esto debe estar de acuerdo con el equipo humano y recursos
materiales que tengamos disponibles. Debemos definir el DNDE, CUNDO,
QUINES Y CUNDO se har la INVESTIGACIN.
2. SELECCIN DE LA MUESTRA
El segundo elemento de un problema estadstico es decir cmo se va a
seleccionar la muestra, a esto se le conoce tambin con el nombre de diseo del
experimento o procedimiento de muestreo.
3. OBTENCIN DE LA INFORMACIN
La obtencin de la informacin, debe ser lo ms significativa posible, y debe ser
sobre lo que realmente investigamos. Para ello podemos utilizar: Cuestionarios,
censos, entrevistas, encuestas.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
TAREA NUMERO 3
INVESTIGAR valor 3 puntos
1 Qu es el cuestionario? Sus caractersticas y tipos.
2. Qu es el censo
3. Qu es la encuesta.
4. Qu es una entrevista, tipos, ventajas y desventajas, caractersticas
4. ANLISIS O DEPURACIN DE LOS DATOS
Se debe revisar las boletas obtenidas en la investigacin para determinar si los
datos que se han obtenido se ajustan a la verdad y a la exactitud
5. ORDENACIN, CLASIFICACIN, TABULACIN Y REPRESENTACIN DE
LOS DATOS.
Despus de depurar los datos se procede a ordenarlos y clasificarlos, segn
determinadas caractersticas (sexo, edad, sueldo) enseguida se tabulan los
datos y despus se presentan, por medio de cuadros y grficas (barras, sectores,
polgonos, histogramas, pictogramas etc.)
6. CLCULO ESTADISTICO
Se deben hallar los valores o medidas que representan el conjunto de datos
obtenidos del fenmeno investigado (media, mediana, moda )
7. INFERENCIA ESTADISTICA
Este elemento debe responder a cun buena es la inferencia? para ilustrar.
cunta confianza puede usted poner en esta estimacin?
8. INTERPRETACIN DE LOS RESULTADOS
Esto debe hacerlo un especialista en forma especial el que haya cursado la
ESTADISTICA INFERENCIAL.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
EJERCICIO NUMERO 4
MATEMTICA BSICA PARA LA ESTADISTICA
a) Redondeo de datos.
1) 98.6 aproximar a unidades.
2) 175.56 aproximar a dcimas.
3) 3,468 aproximar a centenas.
4) 4,6007 aproximar a unidades.
5) 68,967 aproximar a centsimas
b) Expresar en potencia de 10
1) 0.00869.
2) 0.000896.
3) 9678.96
4) 6897654
5) 0.8976
c) Pasar al sistema decimal
1) 4.56 x 10
2) 3.0456 x 10
3) 1.345 x 10 5
4) 8.67 x 10 -4.678 x 10
5) (5.8 x 10) / (4.8 x 10)
6) (4.63 x 10) (8.9 X 10)
5.467 x 10
d) Resuelve las siguiente operaciones
1) 45.5 + ( 45 -34)9 7
2) 67.5 + (456 + 4 98) 30 8
e) Represente grficamente las siguientes funciones
1) F(x) = x + 2
2) F(x) = 3x -1
3) F(x) = 3 + x
4) F(x) = x
5) F(x) = x + 2
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
5
EL PROCESO ESTADISTICO
Siendo la estadstica la ciencia que estudia los fenmenos colectivos con la
ayuda numrica, necesita por ello emplear mtodos, tcnicas y procedimientos que
garantice la confiabilidad y cientificidad de lo investigado.
DISTRIBUCIN DE FRECUENCIAS
Una distribucin o tabla de frecuencias es una forma que el estadgrafo usa para
organizar y resumir sus datos. Por lo que podemos construir una tabla de frecuencias
con datos cualitativos o cuantitativos, pero ambos estarn agrupados en varias clases a
saber:
CRONOLGICA
CUALITATIVA
GEOGRFICA
CUANTITATIVA
EJEMPLOS:
Cronolgica
AOS INGRESOS
2005 12,000
2006 15,000
2007 25,000
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
Cualitativa
Estado Civil No de mujeres
solteras 54
casadas 80
divorciadas 20
Viudas 05
Clasificacin geogrfica
pas Ubicacin
El Salvador Centro Amrica
Argentina Sur Amrica
Espaa Europa
Israel Medio Oriente
Cuantitativa
Salarios No. De Empleados
2,000 a 2,500 08
2.500 a 3,000 10
3,000 a 3,500 20
3,500 a 4,000 05
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
AMPLITUD O INTERVALO DE CLASE
Cada clase o intervalo, debe poseer un tamao o amplitud. Para esto debemos
identificar las mediciones mayores o menores, encontrar su diferencia y dividirla entre el
nmero de clases que consideramos podemos tener.
FORMULA: AMPLITUD = (Xs Xi)
Nmero de clase deseado
No existe regla que determine la cantidad de intervalo que deben formar una serie de
datos, pero se aconseja que no pase de 20 ni sea menor de 5)
Ejemplo: Construir una tabla de frecuencias para los datos sobre las velocidades en
Km/h de varios ciclistas
TABLA 1
Lo primero que debemos hacer es identificar la cantidad mayor y la menor
Amplitud= 110 60 = 10
5
La distribucin de nuestros datos quedar de la siguiente manera:
Invervalo de clase (X)
Conteo (utilizar tarjado)
Frecuencia (f)
60 69 70 79 80 89 90 99
100 109 110 119
///// //////
////////////// ////////
/ /
5 6 14 8 1 1
90 62 85 92 75 80 82 95 85 84 70 80 60 90 91 76 88 94 95 70 80 85 60 76 68 95 82 110 74 88 64 100 82 80 85
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
OBSERVACIONES A TOMAR EN CUENTA
Cada clase esta determinado por dos nmeros llamados lmites aparentes el
menor 60 y el aparente superior 69
La distancia entre los lmites siempre debe ser la misma.
Existe lmites reales estos son del inferior 59.5 y el superior 69.5 y as
sucesivamente para cada intervalo.
NOTA: si aumenta el acho del intervalo, disminuye el nmero de intervalos, o
si disminuye el ancho de los intervalos, aumenta el nmero de los intervalos.
EJERCICIO NUMERO 4
Ejercicio Elabore la distribucin segn lo aprendido de los siguientes datos:
TABLA 2
TABLA 3
TABLA 4
61 55 60 58 62 64 66 68 70 75 76 70 51 55 60 65 70 73 80 75 78 66 68 70 75 76 78 80 79 68 53 54 56 58 60 64 68 70 75 80
16 20 30 25 35 55 62 64 84 96 26 74 26 35 97 87 28 34 35 46 76 86 26 28 38 45 56 66 76 96
65 70 62 63 71 70 75 73 74 75 70 78 80 84 85 71 70 75 70 73 81 82 83 85 68 70 75 77 80 84 85 85 85 87 86 85 81 84 40 87 90 90 50 50 99
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
6
DISTRIBUCIN DE FRECUENCIAS
Un conjunto de datos lo podemos organizar de diferentes maneras. La forma
que se elegir depender de la naturaleza de los datos, la cantidad de datos o el
aspecto que se desea describir.
6.1 DISTRIBUCIN DE FRECUENCIA SIMPLE
Una distribucin de frecuencia simple es la que nos va a indicar la frecuencia
con que aparecen los nmeros, desde el menor del conjunto de los datos hasta el
mayor de ese conjunto o viceversa. Ejemplo.
TABLA 5
valores tarjado frecuencias
90 89 85 84 81 80 76 75 72 71 70 55
/ // / / / // // / / //
//// //// /
1 2 1 1 1 2 2 1 1 2 9 1
90 80 70 70 70 70 85 75 70 70 55 70 89 84 70 70 71 76 80 76 71 72 81 89
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
EJERCICIO NUMERO 5
ELABORE LA DISTRIBUCIN SIMPLE DE LA TABLA 3
6.2 DISTRIBUCIN DE FRECUENCIA ACUMULADA
En una distribucin de frecuencias acumuladas (fa), escribiremos al principio de cada
posibilidad (x), el total de frecuencias correspondientes a esta x ms todas las
correspondientes a las x menores.
Ejemplo:
valores f fa
90 89 85 84 81 80 76 75 72 71 70 55
1 2 1 1 1 2 2 1 1 2 9 1
1 3 4 5 6 8
10 11 12 14 23 24
= 24
6.3 DISTRIBUCIN DE FRECUENCIAS DE VALORES AGRUPADOS EN
INTERVALOS DE AMPLITUD CONSTANTE.
Para calcular el nmero de filas a utilizar se aplican distintos criterios, muchos
investigadores se conforman con decir que no deben ser muy pocos (menos de cuatro)
o que no deben ser muchos (ms de doce) la regla mas aplicada es la de Sturges, que
hemos visto con anterioridad. VER FORMULA DE AMPLITUD.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
Ejemplo: Hacer la distribucin de los siguientes datos agrupados en intervalos,
calculando su amplitud.
A= (Xs Xi)/N?
A= 110 60/ 5 (filas)= Amplitud = 10
X f
60 69 70 79 80 89 90 99
100 110
5 6
14 8 2
= 35
90 62 85 92 75 80 82 95 85 84 70 80 60 90 91 76 88 94 95 70 80 85 60 76 68 95 82 110 74 88 64 100 82 80 85
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
7
REPRESENTACIN GRAFICA
La representacin grfica nos permite presentar datos en na forma ms
esquemtica, ms directa, haciendo resaltar a simple vista y en forma rpida las
relaciones o cambios de la informacin
El trmino grfico se deriva de la voz griega (GRAPHIKOS) que significa
presentar todo por medio de dibujo.
Las grficas nos permiten hacer nuevas relaciones y su utilidad puede resumirse
en:
a) Sirven para realizar una sntesis.
b) Destacar caractersticas.
c) Mantener el control
d) Hacer comparaciones, confrontaciones etc.
Para la construccin de las grficas, en forma especial las de BARRAS Y LOS
POLIGONOS, debemos valernos del SISTEMA DE COORDENADAS CARTESIANAS.
Este sistema consiste en dos rectas perpendiculares que se cruzan en un punto
llamado origen, de las cuales la horizontal se llama EJE DE LAS ABSCISAS (o eje de
las X-equis) y la vertical EJE DE LAS ORDENADAS ( o de las Y-yes), a partir del origen
se miden hacia la derecha VALORES POSITIVOS y hacia la izquierda VALORES
NEGATIVOS . el sistema tiene 4 cuadrantes que se enumeran en sentido inverso a las
manecillas del reloj, a partir del cuadrante de arriba a la derecha.
NOTA: conviene hacer la aclaracin que actualmente conviene conocer este
sistema aunque actualmente para la elaboracin de las grficas se hace a base de la
computadora y en especial utilizando el programa de MICROSOFT EXCEL, en
cualquiera de sus versiones.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
EJERCICIO NUMERO 6
3. Encontrar en un sistema de coordenadas rectangulares los puntos de
coordenadas siguientes:
a) (3,2) b) ( -1,2) c) (0.3)
d) (2,-1) e) (-2,-3) f) (-2.0)
g) (0,-2) h) (3,0) i) (-1,-4)
eje de las ordenadas
Y
2o. C (-X,Y)
1er C (X,Y)
x '
X
Eje de las abscisas
3er C (-X, Y)
4o C (X, -Y)
Y '
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
4. Representar la ecuacin Y = X + 2, para X = -3, -2, -1, 0, 1, 2, 3
Solucin:
a) Encontramos los valores de Y correspondientes a los valores de X.
X -4 -3 -2 -1 0 1 2 3
Y -2 -1 0 1 2 3 4 5
TRAZAR LOS PUNTOS EN EL PLANO DE COORDENADAS.
5. Representar la ecuacin Y = x2 1, para X = -2, -1, 0, 1, 2.
a) Encontrar los valores de X
X
Y
TRAZAR LOS PUNTOS EN EL PLANO DE COORDENADAS.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
CONSTRUCCIN DE LAS GRFICAS
Para hacer las grficas debemos tener en cuenta ciertas reglas:
a) El eje vertical que representar las frecuencias debe empezar en cero.
b) La parte ms alta de la grfica deber ser aproximadamente tres cuartos de su
ancho total. O sea que la altura debe ser menor que la base ( la altura debe tener
una longitud entre el 60 y 75% de la longitud de la base.
c) Todas las barras deben tener el mismo ancho.
1. GRAFICA O DIAGRAMA DE BARRAS.
Este tipo de grfica regularmente se construye en base al sistema de
coordenadas cartesianas. Dado que los valores siempre son positivos se usa el primer
cuadrante de este sistema.
0
10
20
30
40
50
60
70
80
1 2 3 4 5
Series1
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
2. POLGONO DE FRECUENCIAS
Un polgono de frecuencias es un grfico de lneas trazado sobre las marcas de
clase. Para construirlo, se marca cada clase de frecuencia correspondiente en el
punto medio de su clase. Los puntos marcados se unen despus por una serie de
segmentos rectilneos.
3. HISTOGRAMA
Es una representacin grfica de una tabla de frecuencias, que os muestra
datos cuantitativos. Tiene la caracterstica de que la superficie que comprenden las
barras es representativa de la cantidad de casos, o de la importancia relativa,
correspondiente a cada tramo o clase de valores medidos sobre el eje de las X. se
debe tener cuidado en que las clases tengan el mismo tamao
0
10
20
30
40
50
60
70
80
90
100
1 2 3 4 5 6
Series1
0
1
2
3
4
5
6
Categora 1 Categora 2 Categora 3 Categora 4
Serie 1
Serie 2
Serie 3
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
4. PICTOGRAMAS
Los pictogramas o pictgrafas (tipo de diagrama de figuras) son utilizados a
menudo para representar datos estadsticos en una forma que llame la tencin a
todo el pblico. Este es un tipo de grfica muy llamativo, debido al uso de figuras en
su estructura. Con dichas figuras se le da el aspecto pictrico.
5. DIAGRAMA DE SECTORES O GRAFICAS CIRCULARES
La forma de construirla requiere de un comps y del uso de un transportador,
ms los clculos y procedimientos matemticos (uso de la regla de tres) para
obtener porcentajes y grados.
azul
caf
gris
beige
verde
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
EJEMPLO
= 212 100.00 360
Procedimiento:
1. Se suman las frecuencias
2. Se hace una regla de tres, tomando como 212 como el 100% para obtener el %
Azul 100 * 38/ 212 = 17.92
3. Para los grados se hace una regla de tres, tomando el 100% como 360 que tiene
la circunferencia, obteniendo as los grados que le corresponden a cada no de
los colores en la grfica de sectores.
Azul 360 * 17.92/100 = 65
As sucesivamente hasta obtener todos los datos.
color frecuencia % 0
Azul Caf Gris Beige Verde
38 52 72 40 10
17.92 24.53 33.96 18.87 04.72
65 88 122 68 17
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
EJERCICIO NMERO 7:
Elaborar un diagrama de sectores con los siguientes datos, calcular el % y los 0
DIVERSIFICADO CANTIDAD
CUARTO BACH QUINTO BACH CUARTO P.C QUINTO P.C SEXTO PC
45 70 25 80 20
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
8
MEDIDAS DE TENDENCIA CENTRAL
Se les llama medidas de Tendencia Central, porque todos los casos tienden hacia un valor que est en el centro., as decimos que la estatura media es de 1.63 m encontraremos que la mayor parte de las personas de una poblacin tienen esa estatura o un poco arriba de ese valor o abajo del mismo.
Medidas de centralizacin, parmetros estadsticos que marcan, bajo distintos criterios, los valores en torno a los cuales se disponen los datos de una distribucin. Tambin se llaman medidas de tendencia central, pues entorno a ellas se disponen los elementos de las distribuciones. Las ms importantes son la media, la mediana y la moda.
La media aritmtica, se obtiene al dividir la suma de las mediciones entre el nmero de ellos en el conjunto Por ejemplo, si las edades de 7 nios son 4, 6, 6, 7, 9, 11 y 13, la media es:
Formula: X = x N
X = 4+6+6+7+9+11+13 = 44.85 aproximando 45
7
MEDIA ARITMTICA
La media es el promedio aritmtico que se obtiene al dividir la suma de todos los datos entre la cantidad de casos que intervienen en la operacin.
Es un valor de una serie comprendido entre el valor mayor y el valor menor y el cual representa a todos los valores de la serie,
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
En una serie de datos agrupados en una distribucin de frecuencias simples.
Esta la calcularemos con la siguiente frmula
Ejemplo: calcular el promedio de las notas de un curso de estadstica.
valores f fx
65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
3 4 2 4 3 2 5 6 4 3 2 2 3 1 2 5
195 264 134 272 207 140 355 432 292 222 150 152 231 78
158 400
f= 51 fx= 3682
X = fx N
X = fx
N
X = 3682 = 72.20
51
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
CALCULO DE MEDIA ARITMETICA AGRUPADOS EN INTERVALOS, utilizando puntos medio de clase.
FORMULA : En donde Xs representa el punto medio de cada clase.
Ejemplo:
X Xs f fxs
60 69 70 79 80 89 90 99
100 110
64.5 74.5 84.5 94.5 104.5
5 6
14 8 2
322.5 447.0
1183.0 756.0 209.0
f=35 fxs=2917.5
X= 2917.7/35= 83.35
CALCULO DE LA MEDIA ARITMTICA AGRUPADO EN INTERVALO, utilizando la desviacin.
FORMULA
Ejemplo:
X d f Fd
60 69 70 79 80 89 90 99
100 110
-1 0 1 2 3
5 6
14 8 2
-5 0
14 16 6
f=35 fd=31
X= 74.5 + (31/35)10 Respuesta: X= 74.5 + 8.86 = 83.35
X = fxs N
X = fxs
N
X = xs + fd i N
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
EJERCICIO NUMERO 8
CALCULAR LA MEDIA ARITMETICA EN LAS 3 FORMAS DE LOS SIGUIENTES DATOS
65 70 62 63 71 70 75 73 74 75 70 78 80 84 85 71 70 75 70 73 81 82 83 85 68 70 75 77 80 84 85 85 85 87 86 85 81 84 40 87 90 90 50 50 99
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
LA MEDIANA, Me o Md, es un nmero que supera a la mitad de los valores de la distribucin y es superada por la otra mitad. Tambin se le define como el valor tal, que abajo del l se encuentra el 50% del total de los datos y arriba el otro 50%.
Si el nmero de trminos de la distribucin es impar, la mediana es el valor del individuo que ocupa el lugar central cuando los datos estn ordenados de menor a mayor. Por ejemplo, en la distribucin de edades 4, 6, 6, 7, 9, 11, 13, la mediana es Me = 7, pues hay tres datos menores que 7 y tres mayores que 7.
Si el nmero de trminos de la distribucin es par, la mediana es el valor medio de los datos centrales. As, en la distribucin 4, 6, 6, 7, 8, 9, 11, 13, los valores 7 y 8 son los centrales. La mediana es Me = 7,5.
CLCULO DE LA MEDIANA EN UNA SERIE DE DATOS AGRUPADOS EN UNA DISTRIBUCIN DE FRECUENCIA SIMPLE.
valores f fa
65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
3 4 2 4 3 2 5 6 4 3 2 2 3 1 2 5
3 7 9
13 16 18 23 29 33 36 28 40 43 44 46 51
Md= 51 + 1= 52 /2 = 26
Md= 72
Md = ( N + 1)
2
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
CLCULO DE LA MEDIANA DE DATOS AGRUPADOS EN INTERVALOS
FORMULA
Md = mediana Li1 = Lmite real inferior del intervalo en donde est la mediana. fa = frecuencia acumulada del intervalo inmediato al intervalo en donde est la mediana. f = frecuencia del intervalo en donde est la mediana. i = Amplitud del intervalo.
X f fa
60 69 70 79 80 89 90 99
100 110
5 6
14 8 2
5
11 25 33 35
Md = 79.5 17.5 11 * 10 Md = 79.5 + 4.64 = 84.14
14
Md = Li1 + N/2 - fa i f
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
EJERCICIO NMERO 9
CALCULAR LA MEDIANA DE LOS SIGUIENTES DATOS EN LAS DOS FORMAS: SIMPLE Y DATOS AGRUPADOS EN INTERVALOS.
61 55 60 58 62 64 66 68 70 75 76 70 51 55 60 65 70 73 80 75 78 66 68 70 75 76 78 80 79 68 53 54 56 58 60 64 68 70 75 80
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
LA MODA, Mo, de una distribucin estadstica es el valor que ms se repite. Una distribucin puede tener ms de una moda o no tener ninguna. En la distribucin 4, 6, 6, 7, 9, 11, 13, la moda es Mo = 6.
Actualmente se conocen dos tipos de modas: MODA CRUDA Y MODA INTERPOLADA
MODA CRUDA
Con este nombre se identifica a la marca de clase del intervalo, correspondiente al
mayor valor de una distribucin de frecuencia. Ejemplo:
Xi f fa
28 36 37 45 46 54 55 63 64 72 73 81 82 90 91 99
5 11 12 19 14 12 6 1
5 16 28 47 61 73 79 80
f= 80
Mo = 55 + 63/2 = 59 Mo = 59
MODA INTERPOLADA EN INTERVALOS DE AMPLITUD
Mo= Li1 + 1 i
1 + 2
Mo = moda
Li1 = Limite real inferior del intervalo donde se localiza la frecuencia mayor
1 = Delta uno, corresponde a la diferencia entre la frecuencia mayor y la frecuencia anterior a
sta.
2 = Delta dos, corresponde a la diferencia entre la frecuencia mayor y la frecuencia posterior a
sta.
I = Amplitud de intervalo
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
EJEMPLO:
Xi f
28 36 37 45 46 54 55 63 64 72 73 81 82 90 91 99
5 11 12 19 14 12 6 1
f= 80
Frecuencia absoluta mayor = 19 Limite real inferior = 54.5 Amplitud de inrvalo = 9 Frecuencia anterior a la frecuencia modal = 12 Frecuencia posterior a la frecuencia modal = 14 Intervalo = 9
1 = 19 12 = 7
2 = 19 14 = 5
Mo = 54.5 + 7 9
7 + 5
Mo = 54.5 + 63 Mo = 59.75
12
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
EJERCICIO NUMERO 10
calcular la moda cruda e interpolada de los siguientes datos.
16 20 30 25 35 55 62 64 84 96 26 74 26 35 97 87 28 34 35 46 76 86 26 28 38 45 56 66 76 96
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
9
MEDIDAS DE DISPERSIN O DE VARIABILIDAD
Las medidas de dispersin o de varianza son muy necesarios en el anlisis
estadstico ya que sirven para determinar en que forma se distribuyen alrededor del
valor medio.
Existen varias medidas de dispersin entre las ms importantes estn: EL
RANGO, LA DESVIACIN MEDIA, LA DESVIACIN ESTANDAR, LA DESVIACIN
CUARTIL ETC.
1. RANGO
Llamado tambin amplitud, mide la extensin de un conjunto de datos y lo vamos
a calcular utilizando nicamente dos nmeros, al determinar la diferencia entre el
dato mayor y menor del conjunto.
R= Xs Xi
Ejemplo: en una compaa de seguros se han registrado los tiempos necesarios
para proceder en 7 demandas por seguro contra incendio. Los tiempos en das son:
2, 5, 4, 3, 8, 7, 5.
R= 8 2 = 6 das
EJERCICIO NUMERO 11
Hallar el rango de las siguientes series de nmeros:
a) 8, 10, 12, 15, 17, 20, 25, 28, 35
b) 89, 93, 65, 45, 67, 58, 68, 89, 76, 85
c) 456, 476, 480, 450, 466, 566, 550, 545.
d) 3456, 3000, 200, 3300, 3450, 3337, 3390, 3450, 3500, 3565
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
2 DESVIACIN MEDIA
La desviacin media, tambin llamada desviacin promedio, es la suma de las
desviaciones absolutas de las observaciones desde su media aritmtica, dividida
entre el nmero de observaciones o es el promedio de las distancias entre los datos
y la media.
FORMULAS A UTILIZAR
DM = f I x XI DM = f I d I
N N
Ejemplo: calcular la desviacin media de los siguientes datos:
PRIMERO se calcula la media de la distribucin. As:
N=51 fx= 3682
X = 3682 = 72.20 51
valores f fx
65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
3 4 2 4 3 2 5 6 4 3 2 2 3 1 2 5
195 264 134 272 207 140 355 432 292 222 150 152 231 78
158 400
DM = f I x X I
N
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
SEGUNDO. Le restamos la media a cada puntaje, despus multiplicamos cada
frecuencia absoluta por la desviacin y sumamos el producto de todas las frecuencias
por las desviaciones.
N = 51 f I d I = 189.40 DM= 189.40/51 = 3.71 Este es el
promedio de las distancias entre los datos y la media
CALCULO DE LA DESVIACION MEDIA, EN DATOS AGRUPADOS EN INTERVALOS
EJEMPLO:
PRIMERO: calculamos la media de la distribucin
X xs f fxs
60 69 70 79 80 89 90 99
100 110
64.5 74.5 84.5 94.5 104.5
5 6 14 8 2
322.5 447.0
1183.0 756.0 209.0
N = 35 fxs=2917.5 X = 2917.5 / 35 = 83.35
valores f I d I = I x X I f I d I
65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
3 4 2 4 3 2 5 6 4 3 2 2 3 1 2 5
7.20 6.20 5.20 4.20 3.20 2.20 1.20 0.20 0.80 1.80 2.80 3.80 4.80 5.80 6.80 7.80
21.20 24.80 10.40 16.80 9.60 4.40 6.00 1.20 3.20 5.40 5.60 7.60 14.40 5.80 13.60 39.00
DM = f I x X I
N
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
SEGUNDO: le restamos la media a cada punto medo de los intervalos, despus
multiplicamos cada frecuencia absoluta por el resultado o por la desviacin y sumamos
el producto de todas las frecuencias por las desviaciones.
X xs f I d I= Ix -XI f IdI
60 69 70 79 80 89 90 99
100 110
64.5 74.5 84.5 94.5 104.5
5 6 14 8 2
18.85 8.85 -1.15
-11.15 -21.15
94.25 53.1 16.1 89.2 42.3
N = 35 fxs=2917.5 X = 294.95 DM= 294.95/35 = 8.43
El resultado de la desviacin nos indica que 8.43 es el promedio de las desviaciones
entre los datos y la media.
EJERCICIO NUMERO 12
CALCULAR LA DESVIACIO MEDIA DE LOS SIGUIENTES DATOS, UTILIZANDO LAS
DOS FORMAS
16 20 30 25 35 55 62 64 84 96
26 74 26 35 97 87 28 34 35 46
76 86 26 28 38 45 56 66 76 96
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
3 DESVIACION ESTANDAR
sta es la principal medida de variabilidad por lo tanto es necesario calcularla
siempre.
La desviacin estndar representa la variabilidad promedio de una
distribucin, porque mide el promedio de las desviaciones de la media. Debemos tomar
en cuenta que mientras mayor sea la dispersin de la media en una distribucin, mayor
ser la desviacin estndar.
FORMULAS S = f(x X)2 S = fd2
N N
Ejemplo: CALCULAR LA DESVIACIN ESTNDAR DE LOS SIGUIENTES DATOS
SERIE SIMPLE
PRIMERO: Se calcula la media de distribucin en este caso es 72.20
SEGUNDO: le restamos la media a cada puntaje para obtener la desviacin
TERCERO: Elevamos cada desviacin al cuadrado, despus multiplicamos cada
desviacin elevada al cuadrado por la frecuencia absoluta y a continuacin sumamos
este producto, obteniendo as fd2.
CUARTO: dividimos la suma entre N y encontramos la raz cuadrada del resultado,
obteniendo as la desviacin estndar.
fd2= 1038.04
S = fd2 = 1038.04 S= 20.35 = 4.51
N 51
X f fx d= x X D 2=(x-X)2 fd2
65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
3 4 2 4 3 2 5 6 4 3 2 2 3 1 2 5
195 264 134 272 207 140 355 432 292 222 150 152 231 78
158 400
7.20 6.20 5.20 4.20 3.20 2.20 1.20 0.20 0.80 1.80 2.80 3.80 4.80 5.80 6.80 7.80
51.84 38.44 27.04 17.64 10.24 4.84 1.44 0.04 0.64 3.24 7.84 14.44 23.04 33.64 46.24 60.84
155.52 153.76 54.08 70.56 30.72 9.68 7.20 0.24 2.56 9.72 15.68 28.88 69.12 33.64 92.48
304.20
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
DESVIACIO ESTANDAR EN DATOS AGRUPADOS EN INTERVALOS
FORMULA = S = fxs X2
N
PRIMERO: se calcula la media de la distribucin. Aqu la media es 83.35
SEGUNDO: Elevamos la media al cuadrado 83.35 al cuadrado es 6947.22
TERCERO: multiplicamos cada punto medio por fxs y sumamos estos productos
CUARTO: sustituimos los valores encontrados en la frmula.
X f Xs fxs Fxs2
60 69 70 79 80 89 90 99 100 110
5 6
14 8 2
64.5 74.5 84.5 94.5 104.5
322.5 447.0
1183.0 756.0 209.0
20801.25 33301.50 99963.50 71442.00 21840.50
f=35 fxs=2917.5 =247348.75
S = 247348.75 6947.22 = 119.887 = 10.95
35
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
EJERCICIO NUMERO 13
Calcular la desviacin estndar en sus dos procedimientos de la siguiente tabla.
65 70 62 63 71 70 75 73 74 75 70 78 80 84 85 71 70 75 70 73 81 82 83 85 68 70 75 77 80 84 85 85 85 87 86 85 81 84 40 87 90 90 50 50 99
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
10
MEDIDAS DE ASIMETRIA Nos interesa conocer en estadstica, si una distribucin de frecuencias se aleja
ms o menos de la forma simtrica, para lo cual conocemos que existen tres tipos de
curvas. Las medidas de asimetra se utilizan para determinar la distribucin de valores
de una variable.
Simtrica o Normal
Es simtrica cuando todos los valores equidistan de otro valor al que se le
denomina valor central
ASIMETRA
Es lo contrario de la simetra, es decir que los valores no se distribuyen,
equitativamente respecto al otro valor central. La asimetra puede ser de dos tipos, una
hacia la derecha y otra hacia la izquierda.
Asimetra derecha (positiva) asimetra izquierda (negativa)
SESGO DE UNA DISTRIBUCIN
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
La distribucin asimtrica tambin se llama distribucin sesgada, si existe sesgo
para un lado, es decir que los puntajes se apilan en un extremo dejando una cola en el
otro, esta cola determina la direccin des sesgo, su formula es la siguiente:
SK = X Mo
Ejemplo: siendo la moda de una distribucin 50 y la media 55 calculamos el sesgo
SK= 55 50 = 5 asimetra positiva.
CORRELACIN, en estadstica, relacin entre las dos variables de una distribucin
bidimensional. Se mide mediante el coeficiente de correlacin, .(r)
Si los datos de la distribucin son (x1,y1), (x2,y2),, (xn,yn), el coeficiente de correlacin
se obtiene mediante la frmula:
r = 1 - 6D2
N(N2 1)
en donde xy es la covarianza, y x, y son las desviaciones tpicas de las dos
variables.
El valor del coeficiente de correlacin oscila entre 1 y 1 (-1 1). En cada caso
concreto, el valor de indica el tipo de relacin entre las variables x e y.
Cuando | |es prximo a 1, la correlacin es fuerte, lo que significa que las variaciones
de una de las variables repercuten fuertemente en la otra. Mientras que si | |es prximo
a 0, la correlacin es muy dbil y las variables estn muy poco relacionadas.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
Correlacin estadstica
La correlacin estadstica determina la re lacin o dependencia
que existe entre las dos var iables que intervienen en una distribucin
bidimensional .
Es decir , determinar s i los cambios en una de las var iables inf luyen
en los cambios de la otra. En caso de que suceda, d iremos que las
var iables estn correlacionadas o que hay correlacin entre e l las.
Coeficiente de correlacin
El coeficiente de correlacin l ineal se expresa mediante la letra
r .
Propiedades
1. El coeficiente de correlacin no var a a l hacerlo la escala de
medicin.
Es decir , s i expresamos la a l tura en metros o en centmetros el
coef ic iente de correlacin no vara.
2. El s igno del coeficiente de correlacin es e l mismo que el de la
covarianza .
Si la covarianza es posi t iva, la correlacin es directa.
Si la covarianza es negat iva, la corre laci n es inversa.
Si la covarianza es nula, no existe correlacin.
3. El coeficiente de correlacin l ineal es un nmero real
comprendido entre menos 1 y 1.
1 r 1
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
4. Si e l coeficiente de correlacin lineal toma valores cercanos a
1 la corre lacin es fuerte e inversa , y ser tanto ms fuerte cuanto
ms se aproxime r a 1.
5. Si e l coeficiente de correlacin lineal toma valores cercanos a
1 la corre lacin es fuerte y directa , y ser tanto ms fuerte cuanto ms
se aproxime r a 1.
6. Si e l coeficiente de correlacin lineal toma valores cercanos a
0, la corre lacin es dbil .
7. Si r = 1 1, los puntos de la nube estn sobre la recta
creciente o decreciente. Entre ambas variables hay dependencia
funcional .
Ejercicios
Las estaturas y pesos de 10 jugadores de baloncesto de un equipo
son:
Estatura (X) 186 189 190 192 193 193 198 201 203 205
Pesos (Y) 85 85 86 90 87 91 93 103 100 101
Calcular e l coeficiente de correlacin .
x i y i x i2 y i
2 x i y i
186 85 34 596 7 225 15 810
189 85 35 721 7 225 16 065
190 86 36 100 7 396 16 340
192 90 36 864 8 100 17 280
193 87 37 249 7 569 16 791
193 91 37 249 8 281 17563
198 93 39 204 8 649 18 414
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
201 103 40 401 10 609 20 703
203 100 41 209 10 000 20 300
205 101 42 025 10 201 20 705
1 950 921 380 618 85 255 179 971
Correlacin positiva muy fuerte .
Los valores de dos var iables X e Y se distr ibuyen segn l a tabla
s iguiente:
Y/X 100 50 25
14 1 1 0
18 2 3 0
22 0 1 2
Obtener e interpretar e l coeficiente de correlacin l ineal .
Convert imos la tabla de doble entrada en una tabla s imple.
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
x i y i f i x i f i x i2 f i y i f i y i
2 f i
x i y i
f i
100 14 1 100 10 000 14 196 1 400
100 18 2 200 20 000 36 648 3 600
50 14 1 50 2 500 14 196 700
50 18 3 150 7 500 54 972 2 700
50 22 1 50 2 500 22 484 1 100
25 22 2 50 1 250 44 968 1 100
10 600 43 750 184 3 464 10 600
Es una correlacin negativa dbil .
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
COOEFICIENTE DE CORRELACIN DE PEARSON
Para medir la relacin entre dos variables se calcula el coeficiente de correlacin
lineal r mediante la expresin siguiente:
r = N(XY) - X Y
NX2 (X)2 N (Y)2 (Y)2
Este cociente de correlacin lo podemos interpretar de acuerdo con los siguientes
casos:
1. Si r es positivo, la correlacin entre las variables es positiva.
2. Si r es negativo, la correlacin entre las variables es negativa.
3. Si r = 0 no existe relacin lineal entre las variables.
4. Si r = 1 la correlacin es positiva perfecta.
5. Si r = -1 la correlacin negativa es perfecta.
6. Si r = 0.95 la correlacin es negativa fuerte.
7. Si r = -0.50, la correlacin es negativa dbil.
8. Si r = -0.10, la correlacin es negativa dbil
9. Si r = 0.10 la correlacin es positiva dbil
10. Si r = 0.50, la correlacin es positiva moderada.
11. Si r = 0.95, la correlacin es positiva fuerte.
Ejemplo: con los siguientes datos, calcular el coeficiente de correlacin
X Y X y xy
2 3 3 4 4 4 4 5 5 5 6 6 8
1 2 3 1 2 3 4 2 3 4 3 5 5
4 9 9
16 16 16 16 25 25 25 36 36 64
1 4 9 1 4 9
16 4 9
16 9
25 25
2 6 9 4 8
12 16 10 15 20 18 30 40
59 38 297 132 190
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
Al sustituir los datos en la frmula del coeficiente, observamos que:
N=13, sumaxy=190, suma x=59,sumay=38, suma x=297, y sumay=132
r = N(XY) - X Y
NX2 (X)2 N (Y)2 (Y)2
r= 13(190) 59 (38)
13(297) (59)2 13 (132)2 (38)2
r= 2470 - 2242
3861 - 3481 1716 - 1444
r= 228 = r= 228 = 228 = 0.71
380 (272) 103360 321.5
-
CURSO: ESTADISTICA GENERAL
LIC. MARTIN SATZ TOL ZARAGOZA, CHIMALTENANGO 2010
BIBLIOGRAFIA
CEREZO RUIZ, ANTONIO Estadstica descriptiva e introduccin al anlisis.
Editorial universitaria. Guatemala 1977
BERENSON, MARK Estadstica para la Administracin, editorial Prentice Hall.
CORONA, FRANCISCO JAVIER Y MA EUGENIA TOBAR Elementos de Estadstica.
Editorial Trillas. Mxico 1987.
LEVIN JACK. Fundamentos de estadstica en la investigacin social, edit Harla,
S.A, Mxico DF 1979.
DANIEL WAYNE W. Estadstica con aplicaciones a las ciencias sociales y la
Educacin, Mxico, Mc. Graw Hill, 1984
GUILFOD, JP FRUTCHER B. Estadstica aplicada. Edit Mc Graw Hill, Mxico DF 1984
BERNARDO OSTLE. Estadstica aplicada, tcnicas de la estadstica moderna cuando
y donde aplicarlas, centro regional de ayuda tcnica, AID Mxico 1965.
WALPOLE, RONAL E. Y MYERS RAYMOND H. Probabilidad y estadstica. Mxico D.F
Editorial McGraw/Interamericana de Mxico.