manual de estadística general.pdf
TRANSCRIPT
-
MANUAL DE ESTADSTICA GENERAL
Jorge Crdova Egocheaga
-
Manual de Estadstica General Jorge Crdova Egocheaga 1ra Edicin: Marzo del 2003
SOBRE EL AUTOR Estudios Doctorales en Ciencias Administrativas (UNFV), Matre en Administration des Affaires (MBA-UQAM, Canad), Magster en Administracin (ESAN), Magster Scientiae (MSc) en Economa (UNA), Especialista en Formulacin y Evaluacin de Proyectos de Inversin (UNMSM), Profesor de Estadstica en la Maestra en Administracin de la Universidad de San Martn de Porres, Docente de Estadstica y de Informtica Aplicada en el rea de Salud en la Escuela Universitaria de Post Grado de la Universidad Nacional Federico Villarreal, Profesor Principal y Jefe de la Divisin de Evaluacin y Estadsticas de la Escuela de Sanidad Naval de la Marina de Guerra del Per, Profesor de Estadstica y Mtodos Cuantitativos para los Negocios en el MBA de la Universidad San Ignacio de Loyola, Consultor y Expositor Independiente. Director Ejecutivo del Centro de Capacitacin y Asesora de Negocios, CECAN. Los derechos intelectuales de esta obra son de propiedad exclusiva de Jorge Crdova Egocheaga. Toda reproduccin total o parcial del contenido de esta obra requerir la autorizacin del propietario de los derechos intelectuales.
-
1
CAPTULO 1
INTRODUCCIN
El pensamiento estadstico algn da ser tan necesario para la ciudadana como la capacidad de leer y escribir...
H.G.Wells hace mas de 100 aos
OBJETIVOS
Al finalizar el Captulo 1, el participante ser capaz de:
1. Comprender los reas de aplicacin de la Estadstica dentro de las Gestin de la Salud.
2. Comprender el pensamiento estadstico 3. Identificar las etapas de la investigacin cientfica 4. Definir las etapas del trabajo estadstico. 5. Identificar los diversos tipos de datos. 6. Diferenciar poblacin y muestra. 7. Distinguir parmetro y estimador. 8. Diferenciar estadstica descriptiva y estadstica
inferencial.
-
Manual de Estadstica General
4
1.1 SITUACIONES EN LAS QUE SE UTILIZA LA ESTADSTICA Ejemplos
Varias veces durante el da una enfermera toma la temperatura a los pacientes en el Servicio de Emergencia de un Centro Hospitalario local.
Un investigador mdico examina los efectos de un agente cancergeno en las ratas. Tres semanas despus de inyectado el agente en una rata, el investigador realiza una intervencin quirrgica para extraer y pesar los tumores.
El Director de un Hospital registra el tiempo de recuperacin por tratamiento.
El Director de un Hospital cuenta el nmero de camas a fin de medir la tasa de ocupabilidad.
Un investigador mdico est interesado en conocer la relacin entre el sexo y el riesgo de infarto.
El Jefe de Almacn de una Clnica revisa unos cuantos frascos del lote de vacunas que acaba de llegar, y verifica su fecha de expiracin.
El mdico responsable del Laboratorio Clnico del Hospital, extrae una muestra de sangre a fin de determinar el nivel de colesterol del paciente.
1.2 EL PENSAMIENTO ESTADSTICO
El profesional de la gestin de la salud debe de preocuparse permanentemente en registrar informacin sobre las caractersticas que le permitan conocer los factores que inciden en la variabilidad del servicio y as estar en condiciones de implementar acciones dirigidas a mejorar la calidad del servicio que ofrece.
Debe medir
Las quejas en el Servicio de Emergencia, Las devoluciones por da en una farmacia,
-
Jorge Crdova Egocheaga
5
Las demoras en la atencin en una clnica o Las placas radiolgicas reprocesadas en un hospital, y compararlos con los indicadores de gestin o estndares internacionales, y as determinar la calidad del servicio.
La implementacin del pensamiento estadstico tiene tres fases:
Identificar los factores de variabilidad. Conocer (o medir) la variabilidad. Manejar (o controlar) la variabilidad
1.3 LA INVESTIGACIN CIENTFICA
1.3.1 Qu es la investigacin cientfica?
Es la bsqueda sistematizada y objetiva de nuevos conocimientos. Investigar es un proceso de buscar, indagar o pesquisar. El mtodo cientfico, comprende la realizar a investigacin en forma sistematizada y objetiva, organizada y coherente.
1.3.2 Etapas de la investigacin cientfica
A. Planificacin: Elaboracin del proyecto. Abarca una descripcin detallada y fundamentada de cada una de las actividades a desarrollarse en la investigacin.
B. Ejecucin: Es la etapa en la cual se lleva a cabo al
investigacin. Recoleccin de datos, anlisis e interpretacin.
-
Manual de Estadstica General
6
C. Informe: Escrito donde se presentan los hallazgos encontrados.
1.4 ESTRUCTURA DE UN PROYECTO DE INVESTIGACIN
1.4.1 Definicin del problema
A. Ttulo B. Antecedentes: Se refiere al nivel actual de
conocimientos. La investigacin que se planea realizar debe contribuir a elevar el conocimiento que la humanidad tenga de este tema. Si no se conocen los antecedentes, es probable que repita una investigacin anterior. Existen antecedentes tericos (marco terico) y antecedentes empricos (resultados).
C. Objetivos: Enunciado de los logros alcanzables y
evaluables en el estudio. a. Cmo voy a identificar las variables? b. Cmo voy a medir esas variables? c. Qu tcnica estadstica se utilizar?
D. Hiptesis: Enunciado de la relacin de la relacin
entre 2 o ms variables.
1.4.2 Tipo de estudio
Casos y controles
Recomendacin: al escribir el ttulo, el problema, objetivos y las hiptesis, se debe referir a lo mismo.
-
Jorge Crdova Egocheaga
7
1.4.3 Definicin del alcance del estudio Qu mbito abarca el estudio?. Definir el alcance fsico, temporal, social, etc.
1.4.4 Diseo estadstico de la muestra A) Tamao de la muestra B) Procedimiento de seleccin
1.4.5 Definicin de variables y escalas de medicin
Depende de los objetivos y las hiptesis
1.4.6 Recoleccin de datos
Fuentes primarias y secundarias. Disear cuestionario y fichas de observacin.
1.4.7 Procesamiento de la informacin
Definir con anticipacin los anlisis estadsticos que se van a realizar y entre que variables: regresin, hiptesis, entre otros.
1.4.8 Recursos y presupuesto de investigacin
Qu recursos personales y de materiales se requieren. Cuales son los costos para llevar a cabo la investigacin. Cmo se desembolsar (mes a mes) estos gastos. Cmo se financiar.
1.4.9 Cronograma
Con ayuda de un Diagrama Gantt o un PERT, para visualizar las diferentes etapas.
1.4.10 Referencias bibliogrficas
-
Manual de Estadstica General
8
1.5 PARTES DE UN INFORME FINAL DE INVESTIGACIN
1.5.1 Introduccin: Ttulo, antecedentes, objetivos, hiptesis
1.5.2 Materiales y mtodos 1.5.3 Resultados analticos: fundamentar diferencias
evidenciadas 1.5.4 Discusin de resultados 1.5.5 Conclusiones: en relacin con los objetivos de la
investigacin.
1.6 QU ES ESTADSTICA?
Es una ciencia que comprende diversas tcnicas para :
RECOLECTAR
ORGANIZAR
ANALIZAR
INTERPRETAR
DATOS
-
Jorge Crdova Egocheaga
9
Cundo se RECOLECTAN datos ? Cuando se registran caractersticas (medicin, observacin, conteo).
Cundo se ANALIZAN datos ?
Cuando se ordenan para una mejor comprensin y facilitar sus anlisis. (tablas, grficos y figuras) Por ejemplo
Edad N Pacientes
30 - 3435 - 3940 - 4445 - 49
612
82
Tabla de Distribucin
Edad N Pacientes
30 - 3435 - 3940 - 4445 - 49
612
82
Edad N Pacientes
30 - 3435 - 3940 - 4445 - 49
612
82
Tabla de Distribucin
Diagrama CircularDiagrama Circular
0
2
4
6
8
10
12
30-34 35-39 40-44 45-49
Diagrama deBarras
-
Manual de Estadstica General
10
Cundo se analizan datos? Cuando se calculan promedios, medidas de variabilidad y medidas de la forma de la distribucin.Cuando se establecen relaciones entre ellas (regresin y correlacin). Cundo se INTERPRETAN datos ? Cuando se le otorga un sentido prctico a los resultados obtenidos en el anlisis.
1.7 QU SON DATOS?
Son los registros de una caracterstica.
Ejemplo
Edad del pacientePeso del recin nacidoTiempo permanenciaTemperatura corporalProfesin
273,750
537,5
Enfermera
aosKg.dasC---
Caractersticas DatosUnidad de
medidaEdad del pacientePeso del recin nacidoTiempo permanenciaTemperatura corporalProfesin
273,750
537,5
Enfermera
aosKg.dasC---
Caractersticas DatosUnidad de
medida
Si un DATO es til para tomar decisiones se convierte en INFORMACIN. Los datos ayudan a los responsables de tomar decisiones a hacer suposiciones coherentes acerca de las CAUSAS y, por tanto, de los EFECTOS probables de ciertas caractersticas en situaciones dadas. Por qu necesitamos recolectar datos? Proporcionan la evidencia imprescindible en un estudio de investigacin.
-
Jorge Crdova Egocheaga
11
Permiten medir el desempeo en el proceso de produccin de un bien o servicio. Ayudan a la formulacin de cursos alternativos de accin en un proceso de toma de decisiones. Satisfacen nuestra curiosidad innata.
1.8 QU TIPOS DE DATOS EXISTEN?
Constante Si el registro de la caracterstica toma un slo valor en todas las unidades elementales. Son muchos datos, pero iguales. Ejemplo: Sexo de las pacientes en el Servicio de Ginecologa Especialidad de los integrantes del Colegio Mdico del
Per
Las constantes no son inters en Estadstica, puesto que ella se ocupa del estudio de la variabilidad de los datos. Variable Si el registro de la caracterstica toma diversos valores en las unidades elementales. Ejemplo: Edad, sexo y peso de los pacientes de una Clnica Una misma caracterstica puede generar constantes variables, depende del marco muestral. Los datos variables pueden ser :
-
Manual de Estadstica General
12
1. Cualitativos : Registro de un atributo. Provienen de una observacin. Las operaciones posibles son el clculo de la tasa porcentual y de proporciones.
Pueden ser dicotmicas (slo pueden tener 2 categoras. Ejemplo :Estado de salud: sano o enfermo. Sexo de pacientes : masculino y femenino 80% son varones (tasa porcentual). 8 de cada 10 pacientes son varones (proporcin) O politmicas (si tienen ms de 2 categoras) Ejemplo : Estado civil del paciente: soltero, casado, viudo, divorciado.
2. Cuantitativos : Registro de una caracterstica a travs de un conteo o una medicin. Las operaciones posibles son los promedios y las medidas de dispersin, entre otras.
Las variables cuantitativas pueden ser continuas o discretas.
DISCRETA o DISCONTINUA: Cuando la variable slo
puede tomar determinados valores dentro de una escala de valores. Proviene de un conteo.
Ejemplo: Nmero de consultas en un da.
Nmero de hijos
CONTINUA : Cuando la variable puede tomar cualquier valor, dentro de una escala de valores. Provienen de una medicin.
Ejemplo: Tiempo de duracin de una consulta.
Peso de la gestante
-
Jorge Crdova Egocheaga
13
DATOS
DISCRETAS
CUANTITATIVASCUALITATIVAS
VARIABLESCONSTANTES
CONTINUAS
DATOS
DISCRETAS
CUANTITATIVASCUALITATIVAS
VARIABLESCONSTANTES
CONTINUAS
1.9 QU SE PUEDE HACER CON LOS DATOS?
Identificar caracte-rsticas de interspara la gestin.
Recoleccin de datos
Organizarlos en tablas, grficos y figuras
Calcular promedios (media, mediana, moda y percentiles) .
Calcular su dispersin (varianza, desviacin estndar ) y forma de la curva.
Determinar una ecuacin que represente la relacin entre ellos (regresin)
Determinar el grado de asociacin entre ellos (correlacin).
Analizarlos dentro de un horizontetemporal (series cronolgicas)
Utilizar datos paramejorar la calidad
Identificar caracte-rsticas de interspara la gestin.
Recoleccin de datos
Organizarlos en tablas, grficos y figuras
Calcular promedios (media, mediana, moda y percentiles) .
Calcular su dispersin (varianza, desviacin estndar ) y forma de la curva.
Determinar una ecuacin que represente la relacin entre ellos (regresin)
Determinar el grado de asociacin entre ellos (correlacin).
Analizarlos dentro de un horizontetemporal (series cronolgicas)
Utilizar datos paramejorar la calidad
-
Manual de Estadstica General
14
1.10 POBLACIN Y MUESTRA Marco Poblacional Conjunto de todas las unidades elementales (personas, procesos o cosas) al que se circunscribe el estudio estadstico.
Ejemplos : Los mdicos cirujanos del mundo. Los trabajadores asegurados en una EPS El proceso de triaje en los Centros de Salud del Estado. Las historias clnicas de un hospital.
MARCO POBLACIONAL(1200 pacientes de un hospital)
Poblacin Estadstica Registro de una caracterstica EN TODOS los elementos del marco poblacional. Tiene tantos datos como elementos tenga el marco poblacional. Habrn tantas poblaciones como caractersticas se deseen registrar en un determinado marco poblacional.
-
Jorge Crdova Egocheaga
15
MARCO POBLACIONAL
(1200 pacientes de un hospital)
Caractersticasde inters
Edad PesoTemperaturacorporal
Estado Civil
Registrode la
caracte-rstica
Poblacin Poblacin Poblacin
P1 P2 P3 ...... Pn(1200 datos) (1200 datos)
Marco Muestral Subconjunto del marco poblacional. Comprende los elementos o estratos del marco poblacional (es representativo). En contraste con el marco poblacional es ms conveniente porque se obtienen los datos en menor tiempo y reduciendo los costos.
Ejemplo : 75 pacientes de un hospital.
-
Manual de Estadstica General
16
Caracterstica
Registrode la
carac-terstica.
Marco Poblacional
(1200 pacientes de un hospital)
Tcnicas
de muestreoMarco Muestral
(75 pacientes de un hospital)
POBLACIN
P1 P2 P3 Pn
Edad Peso Temp. Corpor.Estado civil
...
POBLACIN POBLACINPOBLACIN
Caracterstica
Registrode la
carac-terstica.
Marco Poblacional
(1200 pacientes de un hospital)
Tcnicas
de muestreoMarco Muestral
(75 pacientes de un hospital)
POBLACIN
P1 P2 P3 Pn
Edad Peso Temp. Corpor.Estado civil
...
POBLACIN POBLACINPOBLACIN
Muestra Registro de una caracterstica en todos los elementos del marco muestral. Tiene tantos datos como elementos el marco muestral. Habrn tantas muestras como caractersticas se deseen registrar en un marco muestral. Las muestras no extraen de la poblacin, sino del marco muestral
-
Jorge Crdova Egocheaga
17
MARCO MUESTRAL(75 pacientes de un hospital)
Caracterstica
Registrode la
carac-terstica.
MARCO POBLACIONAL(1200 pacientes de un hospital)
Tcnicas
de muestreo
POBLACIN
P1 P2 P3 Pn
Edad Peso Temp. corporal
Estadocivil
...
POBLACIN POBLACINPOBLACIN
Edad Peso Estadocivil
MUESTRA
m1
75 datos
m2 m3 mn
MUESTRA MUESTRA MUESTRA
MARCO MUESTRAL(75 pacientes de un hospital)
Caracterstica
Registrode la
carac-terstica.
MARCO POBLACIONAL(1200 pacientes de un hospital)
Tcnicas
de muestreo
POBLACIN
P1 P2 P3 Pn
Edad Peso Temp. corporal
Estadocivil
...
POBLACIN POBLACINPOBLACIN
Edad Peso Estadocivil
MUESTRA
m1
75 datos
m2 m3 mn
MUESTRA MUESTRA MUESTRA
1.11 PARMETRO Y ESTIMADOR
Valor representativo de una poblacin. Se simboliza por letras griegas. Slo hay un parmetro en cada poblacin.
: Proporcin poblacional (pi)
: Media poblacional (mu) 2 : V arianza poblacional (sigma cuadrado) : Desviacin estndar poblacional (sigma)
: Coeficiente de correlacin poblacional (rho) : Proporcin poblacional (pi)
: Media poblacional (mu) 2 : V arianza poblacional (sigma cuadrado) : Desviacin estndar poblacional (sigma)
: Coeficiente de correlacin poblacional (rho)
Estimador Valor representativo de una muestra. Se llama tambin estadgrafo o estadstico. Se simboliza por letras latinas. Existen tantos estimadores como muestras se extraigan de una poblacin.
-
Manual de Estadstica General
18
p Proporcin muestral
Media muestral.2s Varianza muestra.
s Desviacin estndar muestral.
r Coeficiente de correlacin muestral
p Proporcin muestral
Media muestral.2s Varianza muestra.2s Varianza muestra.
s Desviacin estndar muestral.s Desviacin estndar muestral.
r Coeficiente de correlacin muestral
DIFERENTES MUESTRAS GENERAN DIFERENTESVALORES DEL ESTIMADOR
n3
POBLACIN
PARMETRO
n22x
nmmx
.
.
3x..
n1
1x
DIFERENTES MUESTRAS GENERAN DIFERENTESVALORES DEL ESTIMADOR
n3
POBLACIN
PARMETRO
n22x
n22x
nmmx
nmmx
.
.
3x3x..
n1
1x
1.12 ESTADSTICA DESCRIPTIVA E INFERENCIAL
Estadstica Descriptiva Tcnicas que permiten describir un conjunto de datos. El anlisis se limita a esos datos (sean muestrales o poblacionales). Tiene como objetivo presentar los datos obtenidos en forma resumida, clara y comprensible.
-
Jorge Crdova Egocheaga
19
Estadstica Inferencial Tcnicas que permiten estimar un parmetro a partir de datos muestrales.
MuestraMuestra
Estimador
POBLACIN
Parmetro
MUESTRAEstadstica Descriptiva
EstadsticaInferencial
Estimador :
POBLACIN
- = Error de muestreoParmetro :
Tcnica
s de M
uestreo
x
Ejemplos sobre muestra y estimador Suponga que estamos interesados en conocer la duracin de la evaluacin en el Servicio de Psiquiatra de las Clnicas de Lima. El INPE esta interesado en la relacin existente entre la criminalidad y los hogares destruidos. Un psiclogo mide la caracterstica en de 50 procesados. Supngase que el equipo de investigacin, desea determinar la proporcin de fumadores en la ciudad de Lima para
-
Manual de Estadstica General
20
determinar los factores de riesgo e incidencia de cncer pulmonar.
1.13 EJERCICIO APLICATIVO
El Director de Personal de la Clnica Santa Luca desea estimar la tardanza mensual promedio del personal que labora en esta clnica. Con este fin elige al azar la Tarjeta de Control de Asistencia del ltimo mes de 10 trabajadores. En uno de las tarjetas seleccionadas se registr 140 minutos de tardanza. En esta situacin, identifique:
Diez trabajadores
La caracterstica :
La unidad elemental :(o unidad de anlisis)
El marco poblacional:
La poblacin :
El marco muestral :
Tiempo de tardanza mensual
Un trabajador de la clnica
Todo el personal que labora en esa clnicaRegistro de tiempo de tardanza mensual de todo el personal que labora en esta clnica
El tiempo medio de tardanza de todos los trabajadores de la clnica ()
La muestra :
Tipo de dato :
Un dato registrado :
La unidad de medida:
El estimador :
El parmetro :
Registro del tiempo de tardanza de cada uno de los trabajadores seleccionado
Variable cuantitativa continua
140
minutos
El tiempo medio de tardanza de los 10 trabajadores x
-
Jorge Crdova Egocheaga
21
Ejercicio 1 El Director de un Hospital sabe que en lo que va del ao, fueron dados de alta 1000 pacientes hospitaliza-dos y desea conocer el tiempo medio de permanencia en el hospital. Para ello selecciona al azar la historia clnica de 100 pacientes. Una de las historias permiti conocer que cierto paciente haba permanecido 6 das hospitalizado. En esta situacin identifique los siguientes trminos (no se pide la definicin): Caracterstica. Unidad elemental. Marco poblacional Poblacin. Marco muestral. Tipo de muestreo. Un dato. Unidad de medida. Un estimador. Un parmetro
-
Manual de Estadstica General
22
-
1 2
CAPTULO 2
RECOLECCIN DE DATOS
Los datos no se recopilan como un fin en s mismos, sino como
un medio para describir los hechos que estn tras los datos
OBJETIVOS
1. Recopilar datos. 2. Identificar la escala adecuada para cada
caracterstica a recopilar. 3. Redondear datos cuantitativos. 4. Diferenciar mtodos y tcnicas de recoleccin de
datos. 5. Elaborar una encuesta 6. Elaborar una hojas de registro.
-
Manual de Estadstica General
24
2.1 CMO SE RECOPILAN DATOS? Las buenas decisiones se basan en un adecuado registro de datos, para lo cual se debe: A. ESTABLECER OBJETIVOS CLAROS
En control de la calidad, los objetivos son: Control del proceso de produccin Anlisis de lo que no se ajusta a las normas o estndares. Inspeccin o auditoria. Permite determinar qu tipo de datos se requiere.
B. DETERMINAR EL TIPO DE DATO
Datos para el control: se toman peridicamente para conocer la variacin diaria dentro de un proceso; es decir, para verificar su estado de control (estabilidad). Ejemplo: Nmero de pacientes diarios en consultorios externos por especialidad. Datos para el anlisis: se registran para conocer la situacin actual de nuestro proceso. Ejemplo: la tasa de prescripciones que no estn disponibles en la farmacia del hospital. Dato para la inspeccin: se recopilan al recibir o entregar un material. Son datos que sirven para verificar si el producto cumple con las especificaciones. Ejemplo: fecha de expiracin de un lote de medicamentos, antes de su ingreso a almacn.
-
Jorge Crdova Egocheaga
25
C. CONSIDERAR LA CONFIABILIDAD DE LOS REGISTROS
Tener en cuenta la adecuada calibracin de los instrumentos de medicin y la variabilidad en inspecciones visuales.
D. SELECCIONAR FORMAS APROPIADAS DE
RECOLECTAR DATOS.
I. Se debe registrar adecuadamente el origen de datos (el da, la hora, quines fueron los responsables, qu lote se uso, entre otros).
II. Los datos deben registrarse de manera que facilite
su utilizacin (hojas de registro).
2.2 ESCALAS DE MEDICIN
ESCALA NOMINAL: Los valores son nominativos, sirven para designar. Slo se puede realizar un conteo (frecuencias). No es factible las operaciones aritmticas. Se analizan a travs de la comparacin: igualdad y no igualdad ( = y ). Ejemplo Sexo del paciente 1: Masculino 2: Femenino Grupo sanguneo A B AB O Servicio mdico 1: Emergencia 2: Ginecologa
3: Traumatologa 4: Pediatra ESCALA ORDINAL: Los valores representan un orden. No son cuantitativos, slo simbolizan una posicin. Se analizan a travs de la desigualdad :mayor que o menor que (> y
-
Manual de Estadstica General
26
Ejemplo: Calificacin : A,B,C,D A > B Lugar (orden) : 1 , 2 , 3 1 > 2 Dolor : leve, moderado, intenso ESCALA DE INTERVALOS: Se utilizan nmeros cardinales. El cero es relativo o diferencial, es decir no indica ausencia de la propiedad. Se pueden realizar operaciones aritmticas.(+ y -). Es una escala creada por el hombre. Ejemplo: Hora 00:00 Temperatura ambiental 0 C El ao en que vivimos 2003 ESCALA DE RAZN: Se utilizan nmeros cardinales. Tienen unidad de medida (cms, pulgadas). El cero es absoluto, indica ausencia de la propiedad. Se pueden realizar operaciones aritmticas (+,-,x ,), Ejemplo: Pacientes no atendidos hoy : 0 N de hijos en edad de vacunacin : 0 Procesos deficientes : 0
2.3 REDONDEO DE DATOS Durante el anlisis, muchas veces se divide un nmero por otro obtenindose en algunas ocasiones, un nmero infinito de decimales.
-
Jorge Crdova Egocheaga
27
Con el objeto de hacer ms operativo el manejo de estos datos se redondean. Para cortar o redondear, se siguen las siguientes reglas.
1ra REGLA: Para la respuesta final, debemos redondear hasta dos lugares ms de lo que haba en los datos originales. No se debe redondear en los pasos intermedios.
Ejemplo : datos originales : enteros resultado final : 2 decimales.
2 REGLA:
Si la cifra que sigue es mayor a 5, se aumenta 1. Si la cifra que sigue es menor a 5, el nmero no vara.
Ejemplo: Redondeo a 2 decimales 6,176 . 6,18 4,123 . 4,12
3 REGLA: Si la cifra que sigue es 5 y el nmero anterior es par no se modifica. Pero si el nmero es impar, aumenta 1. Ejemplo: Redondeo a 2 decimales
6,545 . 6,54 1,975 . 1,98
-
Manual de Estadstica General
28
2.4 FUENTES DE DATOS
A) FUENTES SECUNDARIAS Datos recolectados anteriormente para alcanzar otros objetivos. Constituye la primera fuente que se debe analizar. La tcnica ms utilizada son las fichas.
Ejemplo: Datos publicados (en papel o en forma electrnica) en revistas especializadas, tesis, censos y en las hojas de registro anteriores.
La calidad de los datos debe ser comprobada: De donde provienen los datos? La fuente es imparcial? Los datos comprueban o contradicen otras evidencias que se disponen? Hace falta una evidencia cuya ausencia conduzca a otra conclusin? Cuantas observaciones se tienen? La conclusin que obtengo es lgica? Los principales organismos que disponen de publicaciones son: 1. Instituto Nacional de Estadstica e Informtica (INEI) 2. Organizacin Mundial del Trabajo (OIT) 3. Organizacin Mundial de la Salud (OMS) 4. Organizacin Panamericana de la Salud (OPS)
B) FUENTES PRIMARIAS
1. Constituyen datos recolectados para el trabajo. Son
datos que no existan antes. 2. Se registran bajo dos mtodos: directo e indirecto
-
Jorge Crdova Egocheaga
29
2.5 MTODOS Y TCNICAS DE RECOLECCIN DE DATOS A) MTODOS DIRECTOS
El responsable registra personalmente los valores de la caracterstica. Ejemplo: registro del tiempo que demora un mdico durante una consulta. Comprende 2 tcnicas. (a) La observacin
1. Se registra el dato bajo condiciones normales 2. Cuando se mide el desempeo, la persona observada no debe saber que es sujeta de observacin 3 Se utiliza una hoja de registro. Ejemplo La observacin del desempeo de una enfermera durante sus labores en el Servicio de Emergencia.
(b) La experimentacin Se registra un dato bajo condiciones provocadas simulando el proceso lo ms real posible. Ejemplo: Un mercado prueba para introducir un tipo jabn de antisptico con fragancia .
B) MTODOS INDIRECTOS
1 Se registra la caracterstica a travs de preguntas 2. No se realiza medicin
-
Manual de Estadstica General
30
Ejemplo: Se pregunta a un paciente el tiempo que esper antes que sea atendido en el consultorio externo. Comprende 2 tcnicas: la encuesta y la entrevista. (a) La encuesta
1. Cuestionario de preguntas abiertas o cerradas 2. Al disearla se debe:
Elegir lo temas generales de la encuesta Decidir forma de aplicarlo: correo, telfono
o personal Plantear preguntas Realizar una prueba piloto y hacer
revisiones finales
Ejemplo: Encuesta para conocer el grado de satisfaccin de los asegurados a una clnica.
(b) La entrevista 1. Permite recolectar datos o partir de un dialogo 2. Puede se estructurada o no estructurada
Ejemplo: Entrevista al Director de una Clnica sobre la aplicacin de norma de calidad.
METODOS Y TCNICAS DE RECOLECCION DE DATOS
FUENTE METODOS TECNICAS
SECUNDARIA FICHAS
DIRECTO OBSERVACIONPRIMARIA EXPERIMENTACION
INDIRECTO ENCUESTA
ENTREVISTA
-
Jorge Crdova Egocheaga
31
Cmo seleccionar la fuente, el mtodo y la tcnica? No toda la informacin requerida ser recopilada de una sola fuente, ni usando un mismo mtodo y tcnica. Casi siempre es una combinacin de ellos, para lo cual hay que: Definir caractersticas que interesan registrar. Identificar la fuente de informacin apropiada para cada caracterstica. Seleccionar la tcnica ms conveniente. En un estudio de investigacin de mercados para paales desechables, interesa conocer ciertas caractersticas,
CARACTERISTICA FUENTE TECNICA Tasa de natalidad Secundaria Fichas Nivel socio-econmico de la familia Primaria Encuesta Textura del producto Primaria Entrevista 2.6 EL CUESTIONARIO
Consiste en un conjunto de preguntas diseadas de acuerdo a la necesidad de informacin. Junto con las hojas de registro, es la tcnica ms comn para la recopilacin de datos de fuentes primarias. Recomendaciones para su elaboracin Las preguntas deben ser coherentes con el objetivo de la investigacin. No hay preguntas de carcter general. La extensin (nmero de preguntas) depende de la necesidad de informacin a recolectar por esta tcnica.
-
Manual de Estadstica General
32
El lenguaje utilizado en la redaccin de preguntas debe ser entendible por los encuestados. Es diferente al lenguaje a usarse en el informe final Debe evitarse la ambigedad. Ejemplo: En un estudio para determinar el grado de asociacin entre la incidencia a cncer pulmonar y el hbito a fumar, se hizo la siguiente pregunta: Fuma usted? Si 1 No 2 No formular preguntas dirigidas. Evitar adjetivos, ya que predisponen a una respuesta. Ejemplo: Cree Ud. que el precio del medicamento es alto? Si 1 No 2 Preguntas cerradas y abiertas Preguntas cerradas
Las posibles respuestas se presentan como alternativas. Facilita la codificacin y operatividad de los datos. Ejemplo : Posee Ud. un seguro mdico? Si 1 No 2
Preguntas abiertas
Los encuestados tienen libertad para emitir su opinin. Se utilizan cuando no se tiene precisin sobre las posibles respuestas. Dificulta la recoleccin de datos (incomoda al encuestado). Dificulta la interpretacin de datos.
-
Jorge Crdova Egocheaga
33
Ejemplo: Qu opinin tiene sobre la poltica de salud del actual Gobierno ?
2.7 LA ELABORACIN DE DATOS: EL CONTROL DE
CALIDAD
Una vez que se han recolectado los datos referidos a las diferentes variables necesarias para la investigacin, se debe proceder a revisarla y presentarla de manera que facilite su anlisis. A este proceso se denomina elaboracin de datos. Las etapas que abarca son: edicin, tabulacin y codificacin. A) La edicin: Se revisan los formularios (cuestionario y
fichas de observacin) para verificar si todas las preguntas han sido respondidas en todos los ellos. Se debe verificar incongruencias en de las respuestas. a) Reencuestar: Si no se respondieron todas las
preguntas y es posible identificar al encuestado (por ejemplo, se tiene su direccin), se podra regresar y formular aquellas preguntas que se obviaron.
b) Anular la pregunta: Si una pregunta es dejada de
contestar en muchos cuestionarios, sera recomendable anular esa pregunta y buscar la forma de conseguir el dato por otra fuente. Probablemente, la pregunta fue mal formulada.
c) Anular el formulario: Si una encuesta o la ficha de
observacin tiene demasiadas preguntas en blanco, se anular todo el cuestionario. Es posible que no se contara con la colaboracin apropiada del encuestado o tal vez no se aplic correctamente.
-
Manual de Estadstica General
34
B. La tabulacin: Consiste en etiquetar o titular con pocas palabras, las respuestas a preguntas abiertas. Para homogenizar el criterio, es recomendable que una persona se encargue de este proceso. Si fueran muchos formularios y varias preguntas abiertas, podran ser varias personas que tabulen, pero necesariamente solo una persona por pregunta.
C. La codificacin: Consiste en colocar un cdigo a las
respuestas, a fin de poder construir una base de datos. 2.8 LAS HOJAS DE REGISTRO (O CHECK LIST)
Son formatos preimpresos que facilitan el registro y la organizacin de cualquier tipo de datos. Puede ser: Para registro: Se anota sistemticamente la informacin. Ejemplo: Tarjeta de Registro de Asistencia del personal que labora en una Clnica
Para verificacin: Se anota informacin en determinado tiempo, que debe cotejarse con la realidad. Ejemplo: Registro de las recetas no atendidas por semana. EJEMPLO 1:
Hoja de registro para la distribucin del proceso de produccin
La medida optima es 8.300 Se acepta una variabilidad mxima 0,008 Se registra cada uno de los 55 productos elaborados en un da, colocando una x en la casilla correspondiente. Se construye simultneamente el histograma.
Caso: Hoja de registro para ver la distribucin en un proceso de produccin.
-
Jorge Crdova Egocheaga
35
EJEMPLO 2: Hoja de registro de tems defectuosos Permiten identificar el tipo de defecto ms frecuente. Un producto puede presentar ms de un defecto. Es necesario tipificar con antelacin los defectos posibles. Caso: Hoja de registro de inspeccin final de cierto producto plstico moldeado.
-
Manual de Estadstica General
36
EJEMPLO 3 Hoja de registro de las causas del defecto Permite una estratificacin adicional con el fin de encontrar las causas de los defectos. Caso: Hoja de registros de ocurrencias de los defectos en ciertos accesorios utilizados en la elaboracin de prtesis dental, asignables a maquinaria, trabajadores, da y tipo de defecto.
-
Jorge Crdova Egocheaga
37
-
Manual de Estadstica General
38
-
3
CAPTULO 3
ORGANIZACIN TABULAR DE
DATOS
OBJETIVOS
Al finalizar el Captulo 3, el participante ser capaz de:
1. Organizar datos a travs de una clasificacin ordenada de datos.
2. Organizar datos a travs de un diagrama tallo-hojas. 3. Elaborar una tabla de distribucin de frecuencias para
datos univariados 4. Elaborar una tabla de distribucin de frecuencias para
datos bivariados.
-
Manual de Estadstica General
40
3.1 LA IMPORTANCIA DE LA ORGANIZACIN DE LOS DATOS Los datos deben organizarse, para entender mejor su naturaleza fundamentalmente utilizando dos mtodos : el mtodo tabular y el mtodo grfico. Si los datos no estn organizados son de poca utilidad en una investigacin o para una toma de decisiones. Ejemplo Los niveles altos de colesterol en suero, han sido por mucho tiempo asociados con el incremento del riesgo de enfermedades cardiovasculares. Se han efectuado numerosos estudios en un esfuerzo por lograr una mayor comprensin de la naturaleza de esta asociacin. Se muestra a continuacin las concentraciones de colesterol en suero que fueron recolectadas a una poblacin de 480 individuos aparentemente sanos. A qu conclusin llega?
-
Jorge Crdova Egocheaga
41
244202208213258256142249237212183204275176182287
258209195215276206219214183231201220230216211205
222246226174234259201185239240184277251146182244
226281271203253190240238209202187204240229253231
136254267207258210244277142206243226193200241223
188220174250212278222187246171183245199187172169
225247238265203224232177261160195228196222215209
179204198223269266220242266226183184244193180152
221216262234179187181208224208221227215214191239
175225208221216272239253218218195202295212203239
209210223210231201214202272259199208263188199185
223171241228156237240211264186172192292226189219
208226222265225219231232254248261270217221200196
196231220173218243245184167236227258286189251276
221211196205239218232221221221239199220252249224
265261177238263171189249154202175222248234218206
215274246229209191189161233170231249169252258161191236212232230203219234265208254196228180250209215184174194229188161247195222187248250216249192155209201225212245241255220257224250197216166190243248257192212229204189222221261241180242177244249213262203172266214228173222155218265218252225230216271212163263229233254215184229186259195193227222232200192253230243159263212267223222233209194206205194220235280289223225249179200212189238230276207177262231248230243191192243218154228248197242218241163213202222197269138189214216197304170230234188186236192200186223174201198292180203243223221202220163212230262234186275214245227159238261265197260191194212269183248259236209199231
244202208213258256142249237212183204275176182287
258209195215276206219214183231201220230216211205
222246226174234259201185239240184277251146182244
226281271203253190240238209202187204240229253231
136254267207258210244277142206243226193200241223
188220174250212278222187246171183245199187172169
225247238265203224232177261160195228196222215209
179204198223269266220242266226183184244193180152
221216262234179187181208224208221227215214191239
175225208221216272239253218218195202295212203239
209210223210231201214202272259199208263188199185
223171241228156237240211264186172192292226189219
208226222265225219231232254248261270217221200196
196231220173218243245184167236227258286189251276
221211196205239218232221221221239199220252249224
265261177238263171189249154202175222248234218206
215274246229209191189161233170231249169252258161191236212232230203219234265208254196228180250209215184174194229188161247195222187248250216249192155209201225212245241255220257224250197216166190243248257192212229204189222221261241180242177244249213262203172266214228173222155218265218252225230216271212163263229233254215184229186259195193227222232200192253230243159263212267223222233209194206205194220235280289223225249179200212189238230276207177262231248230243191192243218154228248197242218241163213202222197269138189214216197304170230234188186236192200186223174201198292180203243223221202220163212230262234186275214245227159238261265197260191194212269183248259236209199231
Al observar a un conjunto de datos, deseamos identificar a las principales propiedades que definen a este conjunto. Lamentablemente, no se puede obtener alguna conclusin vlida. Los datos tal como se presentan no nos permiten afirmar algo sobre ellos. Para lograr identificar las principales medidas y propiedades de este conjunto de datos, tenemos que organizar previamente al conjunto de datos.
3.2 ELEMENTOS DE LA ORGANIZACIN TABULAR
Consiste en una presentacin resumida de la informacin usando tablas o cuadros Ejemplo: Supongamos que en una entrevista a pacientes del lo que se busca evaluar son 2 aspectos:
-
Manual de Estadstica General
42
- La opinin sobre la calidad de atencin - Nivel de instruccin de la paciente
Como son dos variables categricas, la presentacin de los datos podra realizarse en una tabla cruzada:
751758TOTAL
15312Superior
30723Secundaria
20515Primaria
1028Analfabeta
DesfavorableFavorableEDUCATIVOTOTAL
OPININNIVEL
751758TOTAL
15312Superior
30723Secundaria
20515Primaria
1028Analfabeta
DesfavorableFavorableEDUCATIVOTOTAL
OPININNIVEL
3.2.1 Ventajas Se pueden apreciar propiedades de los datos. Permite establecer asociaciones entre variables Se ahorra espacio en un informe escrito.
3.2.2 Elementos:
A. El Ttulo: enunciado breve e informativo acerca del
contenido del cuadro. Un buen ttulo debe responder a las siguientes interrogantes:
1. Qu contiene la tabla? Ej.: La opinin de 75 pacientes sobre calidad de atencin. 2. Cmo estamos presentando el contenido? Ej.: Por nivel educativo de las pacientes
-
Jorge Crdova Egocheaga
43
3. De dnde se obtuvieron los datos? Ej.: Del servicio de Ginecologa del Hospital Santa Rosa. Lima.
4. Cundo se obtuvo la informacin? Ej.: (fecha de la recoleccin de los datos) Un buen ttulo podra ser: Opinin de 75 pacientes por nivel educativo sobre la calidad de atencin en el Servicio de Ginecologa del HOSPITAL SANTA ROSA. Lima, enero del 2003.
B. La Matriz: Est constituido por el primer rengln y la primera columna, en donde se describen los nombres de las categoras (en datos categricos) o los intervalos de clases (en datos cuantitativos), tan conciso como sea posible.
Para datoscategricos
TOTAL
Superior
Secundaria
Primaria
Analfabeta
DesfavorableFavorableINSTRUCCIN
TOTALOPININNIVEL DE
TOTAL
Superior
Secundaria
Primaria
Analfabeta
DesfavorableFavorableINSTRUCCIN
TOTALOPININNIVEL DE
Total
71 - 78
63 - 70
55 - 62
47 - 54
39 - 46
(hi)(fi)(en aos)
Tasa porcentual :%N de pacientesEDAD
Total
71 - 78
63 - 70
55 - 62
47 - 54
39 - 46
(hi)(fi)(en aos)
Tasa porcentual :%N de pacientesEDAD
Ejemplo
C. El cuerpo: Est conformado por espacios y
constituyen intersecciones de filas y columnas, que a veces se denominan celdas, y donde se anotan
-
Manual de Estadstica General
44
las frecuencias absolutas y relativas obtenidas en la tabulacin, incluyendo totales y subtotales. Por ejemplo
751758TOTAL
15312Superior
30723Secundaria
20515Primaria
1028Analfabeta
DesfavorableFavorableEDUCATIVOTOTAL
OPININNIVEL
751758TOTAL
15312Superior
30723Secundaria
20515Primaria
1028Analfabeta
DesfavorableFavorableEDUCATIVOTOTAL
OPININNIVEL
D. Notas aclaratorias: Estn constituidas por toda aquella informacin adicional que es necesaria para describir e interpretar adecuadamente el contenido de la tabla o cuadro. Es muy importante cuando se trata de datos proveniente de fuente secundaria. Es un aspecto tico precisar de donde provienen los datos, a la vez que nos liberamos de la responsabilidad de responder por su calidad. Se escribe con letra ms pequea.
-
Jorge Crdova Egocheaga
45
Tabla 1: Opinin de 75 pacientes por nivel educativo sobre la calidad de atencin en el Servicio de Ginecologa del HOSPITAL SANTA ROSA. Lima, enero del 2003.
751758TOTAL
15312Superior
30723Secundaria
20515Primaria
1028Analfabeta
DesfavorableFavorableEDUCATIVOTOTAL
OPININNIVEL
751758TOTAL
15312Superior
30723Secundaria
20515Primaria
1028Analfabeta
DesfavorableFavorableEDUCATIVOTOTAL
OPININNIVEL
Fuente: Hospital San Rosa. Direccin de Procesos. Enero 2003.
La presentacin tabular de datos pueden realizarse bajo tres formas, desde la ms elemental se tiene: - Clasificacin ordenada de datos. - Diagrama de tallos y hojas - Tablas de distribucin de frecuencias.
3.2 CLASIFICACIN ORDENADA DE DATOS
Si ordenamos los datos sin procesar, de la observacin ms pequea a la ms grande, la secuencia ordenada obtenida, se denomina clasificacin ordenada. Ejemplo: en un estudio del crecimiento de varones, se obtuvieron estas observaciones sobre el permetro ceflico (en centmetros) de un nio al nacer:
34.034.136.534.235.134.733.934.833.734.635.2
35.333.633.834.933.434.334.634.734.236.033.735.2
35.134.334.234.535.834.535.634.236.134.234.633.1
34.034.136.534.235.134.733.934.833.734.635.2
35.333.633.834.933.434.334.634.734.236.033.735.2
35.134.334.234.535.834.535.634.236.134.234.633.1
Ordenando los datos de manera ascendente, tenemos:
-
Manual de Estadstica General
46
33.1 33.7 33.9 34.2 34.2 34.3 34.6 34.7 34.9 35.2 35.6 36.133.4 33.7 34.0 34.2 34.2 34.5 34.6 34.7 35.1 35.2 35.8 36.533.6 33.8 34.1 34.2 34.3 34.5 34.6 34.8 35.1 35.3 36.0
Cules son las principales propiedades que se observa en este conjunto de datos? Las principales propiedades que se observan en este conjunto de datos son: El nmero de datos es de 35. La menor observacin es de 33,1 cms. La mayor observacin es de 36,5 cms. El rango de los valores observados es de 3,5 cms. =(36,5 33,1)+ 0,1 cms. El 51,43% (18 nios) de los datos estn alrededor de 34 cms. Son muy pocos frecuentes los nios con permetro ceflico mayor a 36 cms. (slo 3 nios). Mientras mayor sea el nmero de observaciones presentes en una serie de datos, mas laborioso es realizar la clasificacin ordenada de los datos.
3.3 DIAGRAMA DE TALLO Y HOJAS Un diagrama de tallo y hojas consiste en una serie de hileras horizontales de nmeros. El nmero utilizado para designar una hilera es un tallo, el resto de nmeros de la hilera se denominan hojas. Esta tcnica funciona bien, cuando el conjunto de datos no tiene una gran dispersin Se pueden considerar el siguiente proceso: Elija algunos nmeros adecuados que puedan servir de tallo. Se requieren como mnimo 5 tallos. Los tallos elegidos
-
Jorge Crdova Egocheaga
47
generalmente son el primer o los dos primeros dgitos de los datos. Nombre las hileras mediante los tallos elegidos. Organice grficamente los datos registrando el dgito, siguiendo el tallo. Trazar una curva a lo largo de la parte superior del diagrama. Determinar las principales caractersticas. Ejemplo: Con los datos anteriores sobre el permetro ceflico, construir un diagrama tallo-hoja.
33.1 34.6 34.2 36.1 34.2 35.6 34.5 35.8 34.5 34.2 34.3 35.135.2 33.7 36.0 34.2 34.7 34.6 34.3 33.4 34.9 33.8 33.6 35.335.2 34.6 33.7 34.8 33.9 34.7 35.1 34.2 36.5 34.1 34.0
Dato menor: 33,1 Dato mayor: 36,5 Tallos posibles: 33, 34, 35 y 36Slo existen 4 tallos, debiendo ser el mnimo 5 tallos, entonces los tallos propuestos se desdoblan, de la siguiente manera: 33 (del 33,0 al 33,4) 33 (del 33,5 al 33,9)
34 (del 34,0 al 34,4) 34 (del 34,5 al 34,9)
35 (del 35,0 al 35,4) 35 (del 35,5 al 35,9)
36 (del 36,0 al 36,4) 36 (del 36,5 al 36,9)
-
Manual de Estadstica General
48
Luego clasificamos los datos en funcin al valor del decimal.
3 3
3 3
3 4
3 4
3 5
3 5
3 6
3 6
1 4
7 7 9 8 6
2 2 2 3 2 2 1 3 0
6 6 8 7 6 7 5 5 9
2 2 1 1 3
6 8
0 1
5
25 datos
10 datos
Finalmente, se traza una lnea por el borde, a fin de delimitar la forma de la distribucin. Qu caractersticas se observan?.
Las principales propiedades de los datos : - Son 35 casos. - La menor observacin es de 33,1 cms. - La mayor observacin es de 36,5 cms. - El rango de los valores observados es de 3.5 cms. (36,5 33,1 + 0.1 cms.) - El 51,43% (18 casos) de los datos estn alrededor de los 34 cms. - Son muy poco frecuentes los casos mayores a 36 cms (3 casos) y menores a 33,5 cms (2 casos). - La distribucin de datos est sesgada a la derecha (sesgo positivo), es decir, hay una mayor concentracin de datos a la izquierda.
-
Jorge Crdova Egocheaga
49
Ejercicio Se realiza un estudio para ayudar a comprender el efecto de fumar en los patrones de sueo. La variable es el tiempo que tarda en quedarse dormido. La muestras de fumadores y no fumadores producen estas observaciones :
17,419,322,419,218,819,5
20,720,420,521,022,121,8
21,317,520,123,016,921,1
20,223,320,622,118,921,2
21,425,024,120,022,919,8
20,124,923,619,819,916,2
17,618,315,118,119,717,2
17,419,322,419,218,819,5
20,720,420,521,022,121,8
21,317,520,123,016,921,1
20,223,320,622,118,921,2
21,425,024,120,022,919,8
20,124,923,619,819,916,2
17,618,315,118,119,717,2
FUMADORES
15,123,023,119,915,315,7
19,924,917,216,125,123,2
17,923,818,015,225,724,3
16,321,624,115,024,125,8
25,018,325,219,422,422,8
25,215,922,118,121,216,8
24,816,021,317,720,515,1
15,123,023,119,915,315,7
19,924,917,216,125,123,2
17,923,818,015,225,724,3
16,321,624,115,024,125,8
25,018,325,219,422,422,8
25,215,922,118,121,216,8
24,816,021,317,720,515,1
NO FUMADORES
Construya un diagrama tallo-hoja para cada uno de estos conjuntos de datos. Utilice los valores enteros del 15 al 25 (inclusive) como tallos. Se sorprendera si alguien le dijera que no existe diferencia en la distribucin de esta variable en los dos grupos?. Explique.
3.4 TABLA DE DISTRIBUCIN DE FRECUENCIAS
Pueden ser simples o cruzadas A) Tablas simples
1 Se utilizan para presentar una sola variable. 2 Pueden representar datos cualitativos o
cuantitativos. 3. Presentan por lo menos dos columnas: categora o
clase y el nmero de datos o frecuencia de clase. 4. Puede incluirse una columna de tasa porcentual. Para datos cualitativos se siguen los pasos siguientes:
-
Manual de Estadstica General
50
(1) Identificar diferentes categoras. (2) Realizar un conteo. (3) Elaborar la tabla: titulo, cuerpo y fuente.
Ejemplo Con la finalidad de mejorar la calidad del servicio de emergencia en una clnica local, se ha formulado la siguiente pregunta a 45 pacientes atendidos durante una semana: Cmo califica la calidad de la atencin que Ud, acaba de recibir en este Servicio de Emergencia: muy bueno, bueno, aceptable, malo o muy malo
Los datos recolectados se presentan a continuacin:
Muy bueno Aceptable Aceptable Muy bueno Bueno
Bueno Bueno Muy malo Bueno Bueno
Aceptable Bueno Aceptable Malo Muy bueno
Malo Aceptable Muy malo Aceptable Malo
Aceptable Muy bueno Bueno Bueno Aceptable
Bueno Malo Aceptable Muy malo Bueno
Malo Bueno Malo Bueno Aceptable
Bueno Bueno Muy malo Muy bueno Malo
Aceptable Bueno Aceptable Malo Bueno
Muy bueno Aceptable Aceptable Muy bueno Bueno
Bueno Bueno Muy malo Bueno Bueno
Aceptable Bueno Aceptable Malo Muy bueno
Malo Aceptable Muy malo Aceptable Malo
Aceptable Muy bueno Bueno Bueno Aceptable
Bueno Malo Aceptable Muy malo Bueno
Malo Bueno Malo Bueno Aceptable
Bueno Bueno Muy malo Muy bueno Malo
Aceptable Bueno Aceptable Malo Bueno
Primero, se identifican las categoras:
Muy bueno Bueno Aceptable Malo Muy malo
-
Jorge Crdova Egocheaga
51
Segundo, se realiza el conteo de las frecuencias: Muy bueno ///// Bueno ///// ///// ///// / Aceptable ///// ///// // Malo ///// /// Muy malo ////
Tercero, se presenta la tabla, considerando el ttulo y la fuente.
Cuadro 1: Calidad del Servicio de Emergencia
Fuente: Encuesta a los Pacientes, julio 2002
N m e ro d e T a s aC a t e g o r i a P a c ie n t e s P o r c e n t u a l
M u y B u e n o 5 1 1 ,1 1
B u e n o 1 6 3 5 ,5 5
A c e p t a b l e 1 2 2 6 ,6 7
M a lo 8 1 7 ,7 8
M u y M a lo 4 8 ,8 9
T o t a l 4 5 1 0 0 , 0 0
Para datos cuantitativos se sigue el procedimiento siguiente: (1) Se calcula el rango:(mayor - menor) + 1 (2) Se determina el nmero de clases, que mejor
representa a los datos (entre 4 y 20). Se realiza un tanteo.
(3) Se determina el tamao o amplitud de clase.
-
Manual de Estadstica General
52
(4) Se elige el limite inferior de la primera clase. (5) Se establecen los lmites inferiores de las
siguientes clases. (6) Se establecen los limites superiores de cada una de
las clases. (7) Se realiza un conteo, a fin de determinar cuantos
datos se incluyen en cada clase. (8) Se elabora la tabla: titulo, cuerpo y fuente.
Ejemplo: Revisemos el ejemplo sobre los niveles de colesterol en suero presentado anteriormente.
231 199 209 236 259 248 183 269 212 194 191 260 197 265 261
159 227 245 214 275 186 234 262 230 212 163 220 202 221 223
203 180 292 198 201 174 223 186 200 192 236 186 188 234 230
304 197 216 214 189 138 269 197 222 202 213 163 241 218 242
248 228 154 218 243 192 191 243 230 248 231 262 177 207 276
238 189 212 200 179 249 225 223 289 280 235 220 194 205 206
209 233 222 223 267 212 263 159 243 230 253 192 200 232 222
193 195 259 186 229 184 215 254 233 229 263 163 212 271 216
225 252 218 265 218 155 222 173 228 214 266 172 203 262 213
244 177 242 180 241 261 221 222 189 204 229 212 192 257 248
190 166 216 197 250 224 257 220 255 241 245 212 225 201 209
192 249 216 250 248 187 222 195 247 161 188 229 194 174 184
209 250 180 228 196 254 208 265 234 219 203
231 199 209 236 259 248 183 269 212 194 191 260 197 265 261
159 227 245 214 275 186 234 262 230 212 163 220 202 221 223
203 180 292 198 201 174 223 186 200 192 236 186 188 234 230
304 197 216 214 189 138 269 197 222 202 213 163 241 218 242
248 228 154 218 243 192 191 243 230 248 231 262 177 207 276
238 189 212 200 179 249 225 223 289 280 235 220 194 205 206
209 233 222 223 267 212 263 159 243 230 253 192 200 232 222
193 195 259 186 229 184 215 254 233 229 263 163 212 271 216
225 252 218 265 218 155 222 173 228 214 266 172 203 262 213
244 177 242 180 241 261 221 222 189 204 229 212 192 257 248
190 166 216 197 250 224 257 220 255 241 245 212 225 201 209
192 249 216 250 248 187 222 195 247 161 188 229 194 174 184
209 250 180 228 196 254 208 265 234 219 203
Solucin Se calcula el rango: R = Mayor menor + 1 Mayor = 317 Menor = 106 Rango = (317 106) + 1 = 212
-
Jorge Crdova Egocheaga
53
Se tantea el nmero de clases: 4 clases de 53 Rango corregido 212: No exceso 5 clases de 43 Rango corregido 215: Exceso 3 6 clases de 36 Rango corregido 216: Exceso 4 7 clases de 31 Rango corregido 217: Exceso 5 8 clases de 27 Rango corregido 216: Exceso 4
Se escoge 4 clases por tener el menor exceso. La amplitud de clase es 53.
Como no hay exceso con 4 clases, el lmite inferior de la primera clase es el menor nmero. En este caso 106.
5. Los lmites inferiores de las clases siguientes se forman
sumando al lmite inferior de la primera clase, la amplitud. En este caso, 53
NIVELES DE Tasa
COLESTEROLPERSONAS
porcentual (%)
106 -
159 -
212 -
265 -
Total 1000 100,00
Fuente: Departamento de Salud
El menorvalor
106 + 53
6. Luego se calculan los lmites superiores de cada clase. Para la primera clase se resta 1 al lmite inferior de la segunda clase. Para las clases siguientes, se le suma la amplitud, en este caso 53.
-
Manual de Estadstica General
54
Cuadro 2: Niveles de colesterol en Lima
Fuente: Departamento de Salud
NIVELES DE
COLESTEROL porcentual (%)
Total 1000 100,00
106 - 158
159 - 211
212 - 264
265 - 317
159 - 1
158 + 53
TasaPERSONAS
NIVELES DE
COLESTEROL porcentual (%)
Total 1000 100,00
106 - 158106 - 158
159 - 211159 - 211
212 - 264212 - 264
265 - 317265 - 317
159 - 1
158 + 53
TasaPERSONAS
7. Finalmente se realiza el conteo de las frecuencias y se presenta la tabla con un ttulo y fuente.
Se acostumbra presentar una columna con la frecuencias relativas (%) En algunas ocasiones se elaboran las tablas con clases abiertas cuando los datos inferiores o superiores estn muy dispersos
-
Jorge Crdova Egocheaga
55
Cuadro 3: Ventas diarias en la Farmacia durante el mes de junio (en soles)
Ventas Tasa
(en soles) Dias porcentual (%)
menos de 5000 3 10,00
5000 - 8999 7 23,33
9000 - 12999 10 33,33
13000 - 16999 8 26,67
17000 - 20999 2 6,67
Total 30 100,00 Fuente: Registro de Ventas
Ejercicio Los siguientes datos de refieren a la estatura (en metros) de 50 pacientes que se atienden en el servicio de reumatologa de la Clnica Sagrado Corazn. Construya una tabla de distribucin de frecuencias. 1,68 1,72 1,70 1,67 1,76 1,82 1,59 1,66 1,82 1,70 1,66 1,70 1,68 1,65 1,74 1,80 1,57 1,64 1,80 1,68 1,72 1,74 1,72 1,69 1,78 1,84 1,61 1,69 1,84 1,74 1,73 1,75 1,75 1,72 1,81 1,87 1,64 1,70 1,86 1,74 1,75 1,77 1,76 1,72 1,81 1,87 1,64 1,72 1,87 1,77 La tabla de distribucin de frecuencias completa, tiene la siguiente estructura
-
Manual de Estadstica General
56
Acumulada: HiAcumulada: Firelativa: hiabsoluta: fiClase: XiLsLi
Frec. RelativaFrec. AbsolutaFrecuenciaFrecuenciaMarca de CLASE
Acumulada: HiAcumulada: Firelativa: hiabsoluta: fiClase: XiLsLi
Frec. RelativaFrec. AbsolutaFrecuenciaFrecuenciaMarca de CLASE
Li limite inferior
Ls limite superior
Xi Marca de la clase i
fi frecuencia absoluta de la clase i.
hi frecuencia relativa de la clase i.
Fi frecuencia absoluta acumulada hasta la clase i.
Hi frecuencia relativa acumulada hasta la clase i.
Ejercicio 2: Complete la siguiente tabla que corresponde al peso de 60 pacientes del Hospital Central.
Total
968,0 72,9
0,2563,0 67,9
58,0 62,9
0,3053,0 57,9
648,0 52,9
(en kilos)HihiFifi
PESO
Total
968,0 72,9
0,2563,0 67,9
58,0 62,9
0,3053,0 57,9
648,0 52,9
(en kilos)HihiFifi
PESO
Ejercicio 3 La siguiente informacin se refiere al peso (en Kg.) de 60 personas. Elabore una tabla de distribucin de frecuencias. k=6 LI1=35 LS5=64 F2=20 h3=0,213 H4=0,799 f6 = 5 f1=4
-
Jorge Crdova Egocheaga
57
Ejercicio 4 Complete la siguiente tabla de distribucin de frecuencias:
000.1 =ih30==fn
n
fhi =
actanti ffF +=actanti hhH +=
f ant --> frecuencia anterior
f act --> frecuencia actual
Total
3156,2 - 163,0
8149,3 - 156,1
10142,4 - 149,2
7135,5 - 142,3
2128,6 - 135,4
(en librasHihiFiXifi
PESO
Total
3156,2 - 163,0
8149,3 - 156,1
10142,4 - 149,2
7135,5 - 142,3
2128,6 - 135,4
(en librasHihiFiXifi
PESO
Resumamos algunos conceptos
Una distribucin de frecuencias (fi) es un conjunto de
puntuaciones ordenadas en sus respectivas clases.
Las frecuencias relativas (hi) son tasas porcentuales de
casos en cada clase.
La frecuencia acumulada (Fi o Hi) son las frecuencias que se
van acumulando en cada clase, desde la ms baja hasta la mas alta.
La marca de clase (Xi) es el punto medio de una clase
B) Tablas cruzadas Sirven para representar dos o ms variables cualitativas. En cada celda se puede incluir la frecuencia absoluta y relativa (por fila, columna y total).
-
Manual de Estadstica General
58
Ejemplo
Cuadro 4: Enfermedad por sexo Enferm ed ad \Sexo M asculino Femenino Total
Bronquitis 5 12 17
Colitis 11 8 19
Nefritis 15 6 21
Alergias 4 2 6
Total 35 25 63
Fuente: Historia Clnica, julio 2002.
-
4
CAPTULO 4
ORGANIZACIN GRFICA DE
DATOS
OBJETIVOS
Al finalizar el Captulo 4, el participante ser capaz de:
1. Elaborar grficos para una sola variable: barras, columnas, circulo.
2. Elaborar grficos para dos variables: dispersin, lineal.
3. Elaborar grficos en tres dimensiones.
-
Manual de Estadstica General
60
Los grficos constituyen una forma muy efectiva de presentar informacin. Su utilizacin ayuda a una mejor comprensin. Todo grfico tiene tres partes: El ttulo: especfico, pero completo. El cuerpo: es el grfico en si mismo. La fuente: especificar el origen de la informacin. 4.1 EL HISTOGRAMA
Son barras verticales presentadas una a continuacin de otra. Permite presentar datos cuantitativos continuos. Es un grfico muy utilizado. Propiedades: 1. El ancho de cada columna es igual en todo el grfico y
representa la amplitud de clase). 2. El ancho de cada columna es igual en todo el grfico y
representa la amplitud de clase).
0
2
4
6
8
10
12
132.0 138.9 145.8 152.7 159.6
Marca de Clase
Fre
cuen
cia
Distribucin de frecuencias
Histograma
30TOTAL
3159,6156,2 - 163,0
8152,7149,3 - 156,1
10145,8142,4 - 149,2
7138,9135,5 - 142,3
2132,0128,6 - 135,4
fiXiCLASE
30TOTAL
3159,6156,2 - 163,0
8152,7149,3 - 156,1
10145,8142,4 - 149,2
7138,9135,5 - 142,3
2132,0128,6 - 135,4
fiXiCLASE
-
Jorge Crdova Egocheaga
61
Ejemplo
Grfico 4: Peso de 100 Pacientes (en Kg.)
Nmero de Pacientes
0
5
10
15
20
25
29.5 39.5 49.5 59.5 69.5 7 9.5 89.5 9 9.5 Peso(Kgs)
Fuente: Encuesta, julio 2001
Cmo leer histogramas? A) Tipo general: El valor medio est al centro, que tiene la
mayor frecuencia. Es el ms frecuente tiene forma simtrica
-
Manual de Estadstica General
62
B) Tipo multimodal: Hay varios valores mayores.
C) Tipo sesgo positivo: Forma asimtrica la media est localizada a la izquierda.
-
Jorge Crdova Egocheaga
63
D) Tipo precipicio a la izquierda: Forma asimtrica la frecuencia disminuye bruscamente a la izquierda.
E) Tipo planicie: Las clases tienen ms o menos la
misma frecuencia.
-
Manual de Estadstica General
64
F) Tipo bimodal: Se observa claramente dos valores mximos.
G) Tipo pico aislado: Presenta un pico aislado, adems de un histograma general.
-
Jorge Crdova Egocheaga
65
4.2 EL DIAGRAMA DE BARRAS Se utiliza para representar datos cuantitativos discretos o datos cualitativos.
Las barras son de igual ancho. La longitud es proporcional a la frecuencia de la
categora. El espacio entre barras debe ser homogneo, para
evitar efecto visual.
Ejemplo:
Grfico 2: Nmero de hijos en edad escolar por mdico del Hospital Central
0
5
10
15
20
25
30
0 1 2 3 4 5
N de Mdicos
Nmero dehijos
(escolares)Fuente: Departamento de Personal
-
Manual de Estadstica General
66
Ejemplo
Grfico 3: Pacientes atendidos por especialidad
Fuente: Hoja de Ingreso, julio del 2002
0
5
10
15
20
Nefrologa Ginecologa Oftalmologa Neurologa Traumatologa
Ejemplo
Grfico 4: Profesionales de la salud por especialidad
Especialidad
0 10 20 30 40 50 60 70 80 90 100
Obstetriz
Fisioterapeuta
Psiquiatras
Enfermeras
Medico
N de profesionales
Fuente: Gerencia de Potencial Humano. Julio 2002
-
Jorge Crdova Egocheaga
67
4.3 EL POLGONO DE FRECUENCIAS Es otra forma de conocer las distribucin de los datos. Se construye uniendo los punto medios del lado superior de las barras del histograma.
0
5
10
15
20
25
29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.50
5
10
15
20
25
29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5
Grfico N 5: Distribucin de los pesos de los Pacientes del Servicio de cardiologa
Nmero de Pacientes
Peso(Kg.)
Fuente: Historia Clnica, julio del 2002
-
Manual de Estadstica General
68
4.4 DIAGRAMA DE DISPERSIN DE PUNTOS Ejemplo
350Julio
200Junio
280Mayo
320Abril
180Marzo
210Febrero
120Enero
PacientesMeses
350Julio
200Junio
280Mayo
320Abril
180Marzo
210Febrero
120Enero
PacientesMeses
Fuente: Departamento de Admisin Clnica
Grfico 6: Pacientes mensuales
0
50
100
150
200
250
300
350
400
0 2 4 6 8 Enero Feb rero Ma rzo Abril Mayo Jun io Ju lio
4.5 DIAGRAMA LINEAL
Ejemplo
Grfico 7: Pacientes mensuales
Fuente: Departamento de Admisin Clnica
0
50
100
150
200
250
300
350
400
Enero Febrero Marzo Abril Mayo Junio Julio
-
Jorge Crdova Egocheaga
69
4.6 LAS OJIVAS La frecuencia acumulada son las frecuencias que se van acumulando en cada categora, desde la ms baja hasta la mas alta. Las ojivas, relaciona las puntuaciones con sus respectivas frecuencias acumuladas.
4.7 EL DIAGRAMA CIRCULAR
El circulo se divide en segmentos circulares, de tamao proporcional a la frecuencia de la categora. Ejemplo
Grfico 10. Pacientes atendidos en consultorios
externos
1 e r t r i m .
2 d o t r i m .
3 e r t r i m .
4 t o t r i m .
Fuente: Ficha de atencin. Julio del 2002
4.8 DIAGRAMA RADAR
til para visualizar, por ejemplo, el cumplimiento de metas (%) para la Prueba de Papanicolaou en el servicio de ginecologa para pacientes de diferentes zonas
-
Manual de Estadstica General
70
Ejemplo
0
20
40
60
80
100
E ste
O e ste
N or te
S ur
Fuente: Hoja de registro atencin, julio 2002 4.9 SUPERFICIE EN TRES DIMENSIONES
Ejemplo:
Metas alcanzadas en prestacin de servicios mdicos
3er trim.
4to trim.0
50
100
3er trim.
4to trim.Fuente: Encuesta, julio 2002
-
5
CAPTULO 5
PROMEDIOS
Un motivo para hacer sospechar que la Estadstica es ms un arte que una ciencia, gira en torno a la ambigedad con que se
usa el trmino promedio.
OBJETIVOS
Al finalizar el Captulo 5, el participante ser capaz de:
1. Diferenciar los diversos tipos de medidas de resumen que se pueden aplicar a un conjunto de datos
2. Calcular e interpretar las principales medidas de tendencia central
-
Manual de Estadstica General
72
5.1 LA ESTADSTICA DE RESUMEN Despus de construir tablas y grficos, a partir de una coleccin de datos, se requieren medidas ms exactas. La estadstica de resumen, proporciona medidas para describir un conjunto de datos. Existen tres tipos de medidas de resumen: De tendencia central. De dispersin. De la forma de la distribucin.
(A) Las medidas de tendencia central
Se refieren al punto medio de una distribucin Se conocen como medidas de posicin Ejemplo: A partir del grfico siguiente, se observa que la posicin central de la curva B est a la derecha de la posicin central de las curvas A y C. Obsrvese que la posicin central de la curva A es la misma que la curva C.
-
Jorge Crdova Egocheaga
73
(B) Las medidas de dispersin Se refieren a la extensin o amplitud de los datos de una distribucin Representan el grado de variabilidad de los datos. Ejemplo: Observe que la curva A en el siguiente grfico tiene una mayor dispersin que la curva B, a pesar que la posicin central es la misma.
(C) Las medidas de la forma de la curva Las curvas que representan a un conjunto de datos, pueden ser analizadas de acuerdo a su:
a) Simetra b) Curtsis
Las curvas simtricas, tienen una forma tal que con una lnea vertical que pase por el punto ms alto de la curva, dividir el rea de esta en dos partes iguales.
-
Manual de Estadstica General
74
Las curvas sesgadas son aquellas cuyos valores estn concentrados en el extremo inferior o superior de la escala de medicin del eje horizontal. La cola indica el tipo de sesgo.
Cuando medimos la curtsis nos referimos al grado de agudeza. Pueden ser: leptocrtica (concentracin al centro) mesocrtica distribuidos simtricamente) o platicrtica (aplanada).
5.2 PROPIEDADES DE LA SUMATORIA
1ra Regla: La suma de los n trminos de una serie constante, es igual a n veces la constante.
=
=n
ii ncc
1
-
Jorge Crdova Egocheaga
75
Ejemplo:
C = 10, n=3
= 10 + 10 + 10 = 3 (10) = 30=3
1i
c
2da Regla: La suma de los productos de una constante por una variable, es igual a la constante multiplicada por la suma de la variable.
==
=n
i
n
ii ccx
1i
1
x
Ejemplo:C = 5, X1 = 2, X2 = 4, X3 = 6
5(2) + 5(4) + 5(6) = 60 ==3
1iicx
3ra Regla: La suma de los valores de una variable ms una constante es igual a la suma de los valores de la variable ms n veces esa constante.
= =
++ =ni
n
i iincc
1 1
x)x(
Ejemplo:C =2, x1 =5, x2 =3, x3 =2
(5 + 2) + (3 + 2) + (2 + 2) = 16
= (5 + 3 + 2) + 3(2) = 16
=
=+31
)x(i
i
c
-
Manual de Estadstica General
76
5.3 LAS MEDIDAS DE TENDENCIA CENTRAL 1. En general se denominan promedios. 2. Los ms importantes son la media, la mediana y la moda.
Aritmtica Media Geomtrica Medidas de Mediana Armnica tendencia central Moda
3. Tambin es til conocer los percentiles (o fractiles). POR QU SON IMPORTANTES LAS MEDIDAS DE TENDENCIA CENTRAL? Porque la mayor parte de los conjuntos de datos muestran una tendencia a agruparse alrededor de un dato central. Las medidas de tendencia central son puntos en una distribucin, los valores medios o centrales de sta y nos ayudan a ubicarla dentro de la escala de medicin. 5.3.1 La Media
(A) La media aritmtica ( x ) a) Obtencin: Se obtiene sumando los valores
registrados y dividindolos entre el nmero de datos.
Ejemplo: La siguiente tabla muestra el nmero de reclamos y quejas presentadas por pacientes en el Servicio de Emergencias a lo largo de una semana. Calcule e interprete la media.
Da/Semana Lun Mar Mier Jue Vier Sab
Reclamos/da 8 10 5 12 10 15
-
Jorge Crdova Egocheaga
77
Media aritmtica
6
60
6
1510125108 =+++++
= 10 reclamos b) Interpretacin: Si elige al azar un da de la
semana, se espera que los pacientes del servicio de emergencia realicen 10 reclamos en ese da.
c) Simbologa:
Tamao Media aritmtica Muestra n (equis barra) Poblacin N (mu)
d) Clculos a partir de datos no agrupados, se utilizan las siguientes formulas. Para una muestra
donde: x : media muestral
iX nn
iix
= =1X : suma de todos los datos
n : nmero de datos (muestra)
Para una poblacin
donde: : media poblacional: suma de todos los datos
: nmero de datos (poblacin)
iXN
N
ii= =1X N
Se puede calcular la media aritmtica utilizando Excel.
-
Manual de Estadstica General
78
Media aritmetica
e) Clculo a partir de datos agrupados. El clculo de la media aritmtica, cuando los datos disponibles se encuentran en tablas de distribucin de frecuencias, se realiza utilizando la formula siguiente
=
== nf
nf
i
i
i
ii
x
1
1X
donde: :media muestral :frecuencia absoluta de la clase i :marca de la clase i
Ejemplo: La distribucin de frecuencias siguiente, representa los puntajes obtenidos en una evaluacin del desempeo, aplicado al personal tcnico de un Centro de Salud. El puntaje mximo en la prueba es 50. Calcule e interprete en media.
x
if
iX
x
if
iX
-
Jorge Crdova Egocheaga
79
D es e m p e o N m e ro d e
(p unto s ) t cn ic o s
1 2 - 1 6 4
1 7 - 2 1 8
2 2 - 2 6 1 5
2 7 - 3 1 2 3
3 2 - 3 6 1 0
T O T AL 6 0
Primero se calcularn las marcas de clase ( );
es decir, el valor intermedio de cada claseMarca de Frecuencia
clase ( ) absoluta(fi)12 - 16 14 417 - 21 19 822 - 26 24 1527 - 31 29 2332 - 36 34 10
Total 60
14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10)
4 + 8 + 15 + 23 + 10
iX
ix
=x =x=x
clase
157560
26.25
Interpretacin: Si se elige al azar a un trabajador tcnico de este hospital, se espera que tenga un puntaje de 26,25 en su evaluacin de desempeo.
-
Manual de Estadstica General
80
f) La media aritmtica ponderada ( )
donde:
= factor de ponderacin
= datos
=
== ni
i
n
iii
w
w
px
1
1
X
px
iw
iX
Ejemplo: Una empresa comercializadora de Seguros Mdicos dispone de 3 representantes para la zona de Miraflores, cada uno de los cuales cobra diferente comisin por pliza vendida, y realiza diferente nmero de contratos. Calcule e interprete el valor medio de la comisin
N de polizas de Comisin
Vendedor Seguro Mdico por venta $
Pedro 30 30
Juan 25 40
Pablo 20 50
67.38$75
2900
202530
)50(20)40(25)30(30 ==++++=px
Interpretacin: Si se elige al azar un representante se espera que cobre una comisin de $38.67 por pliza vendida.
-
Jorge Crdova Egocheaga
81
g) Ventajas y desventajas de la media aritmtica
Ventajas:
Concepto familiar para muchas personas
Es nica para cada conjunto de datos
Es posible comparar medias de diferentes muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no estn agrupados, su clculo es tedioso
Si los datos estn agrupados en clases con extremos abiertos, no es posible calcular la media.
(B) La media geomtrica ( gx ) Se utiliza para calcular tasas medias de variacin, como la tasa media de crecimiento poblacional, la tasa media de inflacin mensual, la tasa media de mortalidad, entre otros.
a) Obtencin Se obtiene extrayendo la raz
ensima el producto de los n valores de una serie.
ng nx XXXX .........
321=
Ejemplo: La siguiente tabla muestra la tasa de aumento en las quejas durante los ltimos meses. Calcule e interprete la tasa media mensual.
-
Manual de Estadstica General
82
Meses Enero Febrero Marzo Abril Mayo
Aumento de
quejas2.6% 5.4% 3.8% 0.5% 1.4%
La tasa 2,6% tambin se puede expresar como 0,026 , y puesto que se refiere a un aumento a partir de una base de 100%, el factor de variacin ser 1,026. Para los otros datos se opera igual.
b) Clculos
Por lo tanto, la media geomtrica se calcula:
5 )014.1)(005.1( )038.1( )054.1( )026.1(=
)( 0272540,1 medioocrecimientdeFactor=5 143903377.1=
n xxxxx g ,......,, 321=
gx
gx
gx
100)1 ( Tasa mediade variacin
= gx
= (1,0272540 - 1) x 100 = 2,72%
c) Interpretacin
Si se selecciona al azar un mes entre enero y mayo, se espera que las ventas se hayan incrementado 2.72% con respecto al mes anterior.
(C) La media armnica ( hx ) Se utiliza para calcular el tiempo medio, velocidad y aceleracin media, como por ejemplo, el tiempo medio para realizar determinada ciruga.
-
Jorge Crdova Egocheaga
83
a) Obtencin: se obtiene calculando el inverso de la media aritmtica de los inversos de una serie.
n
n
i i
hx
=
= 1 X1
1
Ejemplo: Los siguientes datos registran el tiempo que utilizan cuatro mdicos al realizar una cierta intervencin quirrgica. Calcule e interprete el tiempo medio.
M d ico A B C D
Tie m p o
(m in u tos )4 5 3 8 5 2 40
Conocer el tiempo medio permite contar con una herramienta til en la planeacin de los recursos, como la Sala de Operaciones. Adems de poder comparar nuestro desempeo con los estndares de calidad internacionales.
88920
22231710234019764
40
1
52
1
38
1
45
14
+++=+++=hx
minutos 117953.438249
889204 == hx
segundos 7 minutos 43=hx
-
Manual de Estadstica General
84
mediana
b) Interpretacin: Si se selecciona al azar a uno de los cuatro mdicos, se espera que realice este tipo de ciruga en 43 minutos aproximadamente.
5.3.2 La Mediana
Es la medida que divide en dos subconjuntos iguales a datos, de tal manera que 50% de los datos es menor a la mediana y el otro 50% es mayor a la mediana.
a) Obtencin: Se obtiene ordenando la serie de
datos (en forma ascendente o descendente) y ubicando el dato central.
Ejemplo: Los siguientes datos se refieren al nmero de pacientes que llegaron a su cita, despus de la hora programada durante los ltimos 11 das en el Servicio de Pediatra. Calcule e interprete la mediana. 12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16
Primero se ordenan lo datos: 5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17
5 datos menores 5 datos mayores
b) Interpretacin: Durante 5 das llegaron menos de 11 pacientes tarde a su cita y durante 5 das, ms de 11 pacientes llegaron tarde a su cita.
-
Jorge Crdova Egocheaga
85
5.202
2318 =+=mediana
Md
iL
n
F
Mdf
c
c) Reglas
1 Si la serie es impar, la mediana ocupa el lugar central de la serie previamente ordenada.
Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24 2 Si la serie es par, la mediana se obtiene de la semisuma de los dos valores centrales de la serie previamente ordenada. Ejemplo: 8, 10, 14, 18, 23, 24, 32, 34
3 Sea la serie par o impar, la mediana ocupa el
lugar
+2
1n ,de la serie previamente ordenada.
d) Clculo a partir de datos agrupados.
( )c
Mdf
Fn
Md i
+++=
12
1
L
donde: : mediana : limite real (o frontera) inferior de la clase mediana. : nmero total de datos. : suma de todas las frecuencias hasta, pero sin incluir, la clase mediana. : frecuencia de la clase mediana : amplitud de clase
-
Manual de Estadstica General
86
Ejemplo: La tabla siguiente muestra la experiencia laboral (aos) del personal de seguridad que labora en un gran hospital. Calcule e interprete la mediana.
E xp e r ie nc ia N m e ro d e
la b o ra l tra b a ja d o re s
(a o s ) d e s e g ur id a d
0 - 3 4
4 - 7 1 2
C la s e
M e d ia na
8 - 1 1 2 4
1 2 - 1 5 1 6
1 6 - 1 9 1 0
2 0 - 2 3 3
6 9
Lugar de la mediana:
424
)16(2
169
5,7
++=dM
424
16355,7
+=
Mediana = 10,5 aos
o352
169
2
1 =+=+n
Interpretacin: La mitad del personal de seguridad que labora en este hospital tienen una experiencia laboral igual o menor a 10 aos 6 meses. La otra mitad de este personal tiene una experiencia laboral igual o mayor a 10 aos y 6 meses.
e) Ventajas y desventajas
Ventajas: Los valores extremos no afectan a la mediana como en el caso de la media aritmtica. Es fcil de calcular, interpretar y entender. Se puede determinar para datos cualitativos, registrados bajo una escala ordinal. Desventajas: Como valor central, se debe ordenar primero la serie de datos.
-
Jorge Crdova Egocheaga
87
oM
iL
1
2
c
Para una serie amplia de datos no agrupados, el proceso de ordenamiento de los datos demanda tiempo y usualmente provoca equivocaciones.
5.3.3 La Moda
La moda es el valor que ms se repite dentro de un conjunto de datos. a) Obtencin: se obtiene organizando la serie de datos
y seleccionando el o los datos que ms se repiten. Ejemplo
4, 5, 7, 8, 8 , 10, 12, 15
4, 7, 12,12 , 15, 16, 20, 20 , 24, 27
7, 12, 15, 18, 25, 30, 31, 38
b) Clculo a partir de datos agrupados
ci
+
+=21
1LoM
donde: : moda : limite real (o frontera) inferior de la clase modal (la de mayor frecuencia) : frecuencia de la clase modal menos la frecuencia de la clase anterior : frecuencia de la clase modal menos la frecuencia de la clase siguiente : amplitud de clase
Las clases mediana y modal pueden coincidir pero conceptualmente son diferentes.
-
Manual de Estadstica General
88
Ejemplo: La tabla siguiente muestra los errores de facturacin durante un mes, en una Clnica. Calcule e interprete la moda.
Errores de
f ac turac in Das
0 - 3 6
4 - 7 12Clas e
Moda l
8 - 11 8
12 - 15 3
16 - 19 1
Tota l 30
Clase moda : (4 - 7)
Mo = 5,9
61
=
42
= 4 46
65.3 Mo
++=
Interpretacin: Durante un mes, el nmero ms frecuente de errores de facturacin en esta clnica es 6.
e) Ventajas y desventajas de la moda.
Ventajas: Se puede utilizar tanto para datos cualitativos como cuantitativos. No se ve afectada por los valores extremos. Se puede calcular, a pesar de que existan una o ms clases abiertas. Desventajas: No tiene un uso tan frecuente como la media. Muchas veces no existe moda (distribucin amodal). En otros casos la distribucin tiene varias modas, lo que dificulta su interpretacin.
5.3.4 Los Percentiles
Son los valores que dividen en 100 partes iguales a un conjunto de datos
-
Jorge Crdova Egocheaga
89
KP
c
K
n
iF
K
fP
a) Clculo: para datos agrupados. ( )c
f
n
iK
+ +=
KP
1i
F100
K
LP
donde: : percentil : el percentil buscado : nmero de datos : frecuencia acumulativa hasta la clase anterior a la clase donde se ubica el percentil K : frecuencia absoluta de la clase donde se ubica el percentil K : amplitud de clase
Ejemplo: La tabla muestra la experiencia (en aos) de las enfermeras de un gran centro hospitalario Experiencia Trabajadores
(aos)
0 - 3 18
4 - 7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334
Sobre qu edad se ubica el 25% de las enfermeras de mayor experiencia?
-
Manual de Estadstica General
90
Menor
Experiencia
Mayor
Experiencia
75 % 25 %
P75
K = 75
)ordenados nmeros los de( 5,250100
)334(75
100
KnP delLugar o75 ===
Para saber en cul clase se halla este dato, se calcul la frecuencia acumulativa.
Experiencia N Trabajadores Frec. Acumulada
(aos)
0 - 3 18 18
4 - 7 42 60
8 - 11 68 128
12 - 15 120 248
16 - 19 40 288
20 - 23 34 322
24 - 27 12 334
334
( )4
40
1248100
75(334)
5.1575
P
++= aos 65.1575P =
iFif
En esta clasese localizan del249 - 288
F=248
Interpretacin: Para que una enfermera est comprendida dentro del 25% de mayor experiencia laboral debe tener al menos 15 aos, 7 meses y 24 das.
-
6
CAPTULO 6
MEDIDAS DE DISPERSIN Y
ASIMETRA
OBJETIVOS
Al finalizar el Captulo 6, el participante ser capaz de: Calcular e interpretar las principales medidas de
dispersin: A) Rango B) Rango intercuartlico C) Varianza D) Desviacin estndar E) Coeficiente de variabilidad Calcular e interpretar las principales medidas de la
forma de la distribucin. A) Coeficiente de asimetra B) Coeficiente de curtosis
-
Manual de Estadstica General
92
6.1 LAS MEDIDAS DE DISPERSIN Llamadas tambin medidas de variabilidad Son tiles porque: Permiten juzgar la confiabilidad de la medida de tendencia central. Los datos demasiados dispersos tienen un comportamiento especial. Es posible comparar dispersin de diversas muestras.
6.1.1 El rango (R)
Llamado tambin recorrido, amplitud total o alcance. a) Obtencin: se obtiene de la influencia entre el dato
mayor y el dato menor ms una unidad significativa, a fin de incluir ambos valores extremos.
Ejemplo:
Los siguientes datos representan el peso de 10 nios al nacer, (en Kg.). Calcule e interprete el rango.
2,860 3,150 3,450 2,950 3,780 4,170 3,920 3,280 4,050 3,120
Rango = (4,170 - 2,860) + 0.001 Rango = 1,311 Kg.
b) Interpretacin
La diferencia entre el bebe de mayor peso y el bebe menor peso es 1,311 Kg.
-
Jorge Crdova Egocheaga
93
c) Clculo A partir de datos agrupados, se utiliza la siguiente frmula:
R= (Ls - Li ) + 1 donde: Ls : Limite superior de la
ltima clase Li : Limite inferior de la primera clase
Ejemplo: La distribucin de frecuencias siguiente representa el tiempo que espera un paciente para ser atendido, en un consultorio externo. Calcule e interprete el rango
Tiempo N de Pacientes
(minutos) (por da)
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
Total 60
Rango = (36-12) + 1
R = 25 minutos
Interpretacin: la diferencia de tiempo entre el paciente que ms espera y el que menos espera para ser atendido es 25 minutos.
-
Manual de Estadstica General
94
f) Ventajas y desventajas del rango
Ventajas Fcil de calcular Fcil de entender e interpretar Desventajas Slo considera los valores extremos No toma en cuenta ni el nmero de datos ni el valor de estos No es posible calcular en tablas con extremos abiertos.
6.1.2 El rango intercuartlico
Permite ubicar el 50% de los datos que se encuentran en el centro de la distribucin, es decir, el 25% de los datos son menores al primer cuartil y tambin 25% de los datos son mayores al tercer cuartil.
-
Jorge Crdova Egocheaga
95
Ejemplo: La tabla muestra la experiencia (en aos) del personal que labora en el Hospital Central.
E xp e rie nc ia
(ao s )T rab ajado res
0 - 3 1 8
4 - 7 4 2
8 - 1 1 6 8
12 - 15 1 20
16 - 19 4 0
2 0 - 2 3 3 4
2 4 - 2 7 1 2
T o tal 3 34
A) Entre qu valores se encuentra el 50% intermedio
de estos datos? B) Cul es el rango intercuartlico?
RangoIntercuartlico
50 % 25 %
Q3
clase 3ra laen ubica se 5.83100
)334(25PQLugar 251
o==
25 %
Q1
( )4
68
160100
25(334)
5.7Q1
++= aos 82.8Q
1=
-
Manual de Estadstica General
96
clase 5ta laen ubica se 5.250100
)334(75PQLugar 753
o==
( )4
40
1248100
75(334)
5.153
Q
++=
A. El 50% de los trabajadores con experiencia
intermedia se encuentran entre 8,82 y 15,65 aos.
B. El rango intercuartlico es 6 aos 10 meses aproximadamente
6.1.3 La desviacin cuartlica
Es una medida de variabilidad fcil de calcular. Es la mitad del rango intercuartil. Mide la dispersin del 50% central de las observaciones respecto a la mediana. Es imposible tener una DC negativa. Es raro, pero podra tener un valor igual a 0, en el caso que los percentiles sean iguales (P75 = P25). Cuando mayor sea la diferencia entre los percentiles, mayor ser el valor de la DC.
2PP
DC 2575=
Ejemplo:
Si P25 = 7,2 1,32
2,74,13DC ==
P75 = 13,4 Interpretacin: 50% central de las