manual de estadística general.pdf

Upload: gbrfire14

Post on 11-Oct-2015

210 views

Category:

Documents


4 download

TRANSCRIPT

  • MANUAL DE ESTADSTICA GENERAL

    Jorge Crdova Egocheaga

  • Manual de Estadstica General Jorge Crdova Egocheaga 1ra Edicin: Marzo del 2003

    SOBRE EL AUTOR Estudios Doctorales en Ciencias Administrativas (UNFV), Matre en Administration des Affaires (MBA-UQAM, Canad), Magster en Administracin (ESAN), Magster Scientiae (MSc) en Economa (UNA), Especialista en Formulacin y Evaluacin de Proyectos de Inversin (UNMSM), Profesor de Estadstica en la Maestra en Administracin de la Universidad de San Martn de Porres, Docente de Estadstica y de Informtica Aplicada en el rea de Salud en la Escuela Universitaria de Post Grado de la Universidad Nacional Federico Villarreal, Profesor Principal y Jefe de la Divisin de Evaluacin y Estadsticas de la Escuela de Sanidad Naval de la Marina de Guerra del Per, Profesor de Estadstica y Mtodos Cuantitativos para los Negocios en el MBA de la Universidad San Ignacio de Loyola, Consultor y Expositor Independiente. Director Ejecutivo del Centro de Capacitacin y Asesora de Negocios, CECAN. Los derechos intelectuales de esta obra son de propiedad exclusiva de Jorge Crdova Egocheaga. Toda reproduccin total o parcial del contenido de esta obra requerir la autorizacin del propietario de los derechos intelectuales.

  • 1

    CAPTULO 1

    INTRODUCCIN

    El pensamiento estadstico algn da ser tan necesario para la ciudadana como la capacidad de leer y escribir...

    H.G.Wells hace mas de 100 aos

    OBJETIVOS

    Al finalizar el Captulo 1, el participante ser capaz de:

    1. Comprender los reas de aplicacin de la Estadstica dentro de las Gestin de la Salud.

    2. Comprender el pensamiento estadstico 3. Identificar las etapas de la investigacin cientfica 4. Definir las etapas del trabajo estadstico. 5. Identificar los diversos tipos de datos. 6. Diferenciar poblacin y muestra. 7. Distinguir parmetro y estimador. 8. Diferenciar estadstica descriptiva y estadstica

    inferencial.

  • Manual de Estadstica General

    4

    1.1 SITUACIONES EN LAS QUE SE UTILIZA LA ESTADSTICA Ejemplos

    Varias veces durante el da una enfermera toma la temperatura a los pacientes en el Servicio de Emergencia de un Centro Hospitalario local.

    Un investigador mdico examina los efectos de un agente cancergeno en las ratas. Tres semanas despus de inyectado el agente en una rata, el investigador realiza una intervencin quirrgica para extraer y pesar los tumores.

    El Director de un Hospital registra el tiempo de recuperacin por tratamiento.

    El Director de un Hospital cuenta el nmero de camas a fin de medir la tasa de ocupabilidad.

    Un investigador mdico est interesado en conocer la relacin entre el sexo y el riesgo de infarto.

    El Jefe de Almacn de una Clnica revisa unos cuantos frascos del lote de vacunas que acaba de llegar, y verifica su fecha de expiracin.

    El mdico responsable del Laboratorio Clnico del Hospital, extrae una muestra de sangre a fin de determinar el nivel de colesterol del paciente.

    1.2 EL PENSAMIENTO ESTADSTICO

    El profesional de la gestin de la salud debe de preocuparse permanentemente en registrar informacin sobre las caractersticas que le permitan conocer los factores que inciden en la variabilidad del servicio y as estar en condiciones de implementar acciones dirigidas a mejorar la calidad del servicio que ofrece.

    Debe medir

    Las quejas en el Servicio de Emergencia, Las devoluciones por da en una farmacia,

  • Jorge Crdova Egocheaga

    5

    Las demoras en la atencin en una clnica o Las placas radiolgicas reprocesadas en un hospital, y compararlos con los indicadores de gestin o estndares internacionales, y as determinar la calidad del servicio.

    La implementacin del pensamiento estadstico tiene tres fases:

    Identificar los factores de variabilidad. Conocer (o medir) la variabilidad. Manejar (o controlar) la variabilidad

    1.3 LA INVESTIGACIN CIENTFICA

    1.3.1 Qu es la investigacin cientfica?

    Es la bsqueda sistematizada y objetiva de nuevos conocimientos. Investigar es un proceso de buscar, indagar o pesquisar. El mtodo cientfico, comprende la realizar a investigacin en forma sistematizada y objetiva, organizada y coherente.

    1.3.2 Etapas de la investigacin cientfica

    A. Planificacin: Elaboracin del proyecto. Abarca una descripcin detallada y fundamentada de cada una de las actividades a desarrollarse en la investigacin.

    B. Ejecucin: Es la etapa en la cual se lleva a cabo al

    investigacin. Recoleccin de datos, anlisis e interpretacin.

  • Manual de Estadstica General

    6

    C. Informe: Escrito donde se presentan los hallazgos encontrados.

    1.4 ESTRUCTURA DE UN PROYECTO DE INVESTIGACIN

    1.4.1 Definicin del problema

    A. Ttulo B. Antecedentes: Se refiere al nivel actual de

    conocimientos. La investigacin que se planea realizar debe contribuir a elevar el conocimiento que la humanidad tenga de este tema. Si no se conocen los antecedentes, es probable que repita una investigacin anterior. Existen antecedentes tericos (marco terico) y antecedentes empricos (resultados).

    C. Objetivos: Enunciado de los logros alcanzables y

    evaluables en el estudio. a. Cmo voy a identificar las variables? b. Cmo voy a medir esas variables? c. Qu tcnica estadstica se utilizar?

    D. Hiptesis: Enunciado de la relacin de la relacin

    entre 2 o ms variables.

    1.4.2 Tipo de estudio

    Casos y controles

    Recomendacin: al escribir el ttulo, el problema, objetivos y las hiptesis, se debe referir a lo mismo.

  • Jorge Crdova Egocheaga

    7

    1.4.3 Definicin del alcance del estudio Qu mbito abarca el estudio?. Definir el alcance fsico, temporal, social, etc.

    1.4.4 Diseo estadstico de la muestra A) Tamao de la muestra B) Procedimiento de seleccin

    1.4.5 Definicin de variables y escalas de medicin

    Depende de los objetivos y las hiptesis

    1.4.6 Recoleccin de datos

    Fuentes primarias y secundarias. Disear cuestionario y fichas de observacin.

    1.4.7 Procesamiento de la informacin

    Definir con anticipacin los anlisis estadsticos que se van a realizar y entre que variables: regresin, hiptesis, entre otros.

    1.4.8 Recursos y presupuesto de investigacin

    Qu recursos personales y de materiales se requieren. Cuales son los costos para llevar a cabo la investigacin. Cmo se desembolsar (mes a mes) estos gastos. Cmo se financiar.

    1.4.9 Cronograma

    Con ayuda de un Diagrama Gantt o un PERT, para visualizar las diferentes etapas.

    1.4.10 Referencias bibliogrficas

  • Manual de Estadstica General

    8

    1.5 PARTES DE UN INFORME FINAL DE INVESTIGACIN

    1.5.1 Introduccin: Ttulo, antecedentes, objetivos, hiptesis

    1.5.2 Materiales y mtodos 1.5.3 Resultados analticos: fundamentar diferencias

    evidenciadas 1.5.4 Discusin de resultados 1.5.5 Conclusiones: en relacin con los objetivos de la

    investigacin.

    1.6 QU ES ESTADSTICA?

    Es una ciencia que comprende diversas tcnicas para :

    RECOLECTAR

    ORGANIZAR

    ANALIZAR

    INTERPRETAR

    DATOS

  • Jorge Crdova Egocheaga

    9

    Cundo se RECOLECTAN datos ? Cuando se registran caractersticas (medicin, observacin, conteo).

    Cundo se ANALIZAN datos ?

    Cuando se ordenan para una mejor comprensin y facilitar sus anlisis. (tablas, grficos y figuras) Por ejemplo

    Edad N Pacientes

    30 - 3435 - 3940 - 4445 - 49

    612

    82

    Tabla de Distribucin

    Edad N Pacientes

    30 - 3435 - 3940 - 4445 - 49

    612

    82

    Edad N Pacientes

    30 - 3435 - 3940 - 4445 - 49

    612

    82

    Tabla de Distribucin

    Diagrama CircularDiagrama Circular

    0

    2

    4

    6

    8

    10

    12

    30-34 35-39 40-44 45-49

    Diagrama deBarras

  • Manual de Estadstica General

    10

    Cundo se analizan datos? Cuando se calculan promedios, medidas de variabilidad y medidas de la forma de la distribucin.Cuando se establecen relaciones entre ellas (regresin y correlacin). Cundo se INTERPRETAN datos ? Cuando se le otorga un sentido prctico a los resultados obtenidos en el anlisis.

    1.7 QU SON DATOS?

    Son los registros de una caracterstica.

    Ejemplo

    Edad del pacientePeso del recin nacidoTiempo permanenciaTemperatura corporalProfesin

    273,750

    537,5

    Enfermera

    aosKg.dasC---

    Caractersticas DatosUnidad de

    medidaEdad del pacientePeso del recin nacidoTiempo permanenciaTemperatura corporalProfesin

    273,750

    537,5

    Enfermera

    aosKg.dasC---

    Caractersticas DatosUnidad de

    medida

    Si un DATO es til para tomar decisiones se convierte en INFORMACIN. Los datos ayudan a los responsables de tomar decisiones a hacer suposiciones coherentes acerca de las CAUSAS y, por tanto, de los EFECTOS probables de ciertas caractersticas en situaciones dadas. Por qu necesitamos recolectar datos? Proporcionan la evidencia imprescindible en un estudio de investigacin.

  • Jorge Crdova Egocheaga

    11

    Permiten medir el desempeo en el proceso de produccin de un bien o servicio. Ayudan a la formulacin de cursos alternativos de accin en un proceso de toma de decisiones. Satisfacen nuestra curiosidad innata.

    1.8 QU TIPOS DE DATOS EXISTEN?

    Constante Si el registro de la caracterstica toma un slo valor en todas las unidades elementales. Son muchos datos, pero iguales. Ejemplo: Sexo de las pacientes en el Servicio de Ginecologa Especialidad de los integrantes del Colegio Mdico del

    Per

    Las constantes no son inters en Estadstica, puesto que ella se ocupa del estudio de la variabilidad de los datos. Variable Si el registro de la caracterstica toma diversos valores en las unidades elementales. Ejemplo: Edad, sexo y peso de los pacientes de una Clnica Una misma caracterstica puede generar constantes variables, depende del marco muestral. Los datos variables pueden ser :

  • Manual de Estadstica General

    12

    1. Cualitativos : Registro de un atributo. Provienen de una observacin. Las operaciones posibles son el clculo de la tasa porcentual y de proporciones.

    Pueden ser dicotmicas (slo pueden tener 2 categoras. Ejemplo :Estado de salud: sano o enfermo. Sexo de pacientes : masculino y femenino 80% son varones (tasa porcentual). 8 de cada 10 pacientes son varones (proporcin) O politmicas (si tienen ms de 2 categoras) Ejemplo : Estado civil del paciente: soltero, casado, viudo, divorciado.

    2. Cuantitativos : Registro de una caracterstica a travs de un conteo o una medicin. Las operaciones posibles son los promedios y las medidas de dispersin, entre otras.

    Las variables cuantitativas pueden ser continuas o discretas.

    DISCRETA o DISCONTINUA: Cuando la variable slo

    puede tomar determinados valores dentro de una escala de valores. Proviene de un conteo.

    Ejemplo: Nmero de consultas en un da.

    Nmero de hijos

    CONTINUA : Cuando la variable puede tomar cualquier valor, dentro de una escala de valores. Provienen de una medicin.

    Ejemplo: Tiempo de duracin de una consulta.

    Peso de la gestante

  • Jorge Crdova Egocheaga

    13

    DATOS

    DISCRETAS

    CUANTITATIVASCUALITATIVAS

    VARIABLESCONSTANTES

    CONTINUAS

    DATOS

    DISCRETAS

    CUANTITATIVASCUALITATIVAS

    VARIABLESCONSTANTES

    CONTINUAS

    1.9 QU SE PUEDE HACER CON LOS DATOS?

    Identificar caracte-rsticas de interspara la gestin.

    Recoleccin de datos

    Organizarlos en tablas, grficos y figuras

    Calcular promedios (media, mediana, moda y percentiles) .

    Calcular su dispersin (varianza, desviacin estndar ) y forma de la curva.

    Determinar una ecuacin que represente la relacin entre ellos (regresin)

    Determinar el grado de asociacin entre ellos (correlacin).

    Analizarlos dentro de un horizontetemporal (series cronolgicas)

    Utilizar datos paramejorar la calidad

    Identificar caracte-rsticas de interspara la gestin.

    Recoleccin de datos

    Organizarlos en tablas, grficos y figuras

    Calcular promedios (media, mediana, moda y percentiles) .

    Calcular su dispersin (varianza, desviacin estndar ) y forma de la curva.

    Determinar una ecuacin que represente la relacin entre ellos (regresin)

    Determinar el grado de asociacin entre ellos (correlacin).

    Analizarlos dentro de un horizontetemporal (series cronolgicas)

    Utilizar datos paramejorar la calidad

  • Manual de Estadstica General

    14

    1.10 POBLACIN Y MUESTRA Marco Poblacional Conjunto de todas las unidades elementales (personas, procesos o cosas) al que se circunscribe el estudio estadstico.

    Ejemplos : Los mdicos cirujanos del mundo. Los trabajadores asegurados en una EPS El proceso de triaje en los Centros de Salud del Estado. Las historias clnicas de un hospital.

    MARCO POBLACIONAL(1200 pacientes de un hospital)

    Poblacin Estadstica Registro de una caracterstica EN TODOS los elementos del marco poblacional. Tiene tantos datos como elementos tenga el marco poblacional. Habrn tantas poblaciones como caractersticas se deseen registrar en un determinado marco poblacional.

  • Jorge Crdova Egocheaga

    15

    MARCO POBLACIONAL

    (1200 pacientes de un hospital)

    Caractersticasde inters

    Edad PesoTemperaturacorporal

    Estado Civil

    Registrode la

    caracte-rstica

    Poblacin Poblacin Poblacin

    P1 P2 P3 ...... Pn(1200 datos) (1200 datos)

    Marco Muestral Subconjunto del marco poblacional. Comprende los elementos o estratos del marco poblacional (es representativo). En contraste con el marco poblacional es ms conveniente porque se obtienen los datos en menor tiempo y reduciendo los costos.

    Ejemplo : 75 pacientes de un hospital.

  • Manual de Estadstica General

    16

    Caracterstica

    Registrode la

    carac-terstica.

    Marco Poblacional

    (1200 pacientes de un hospital)

    Tcnicas

    de muestreoMarco Muestral

    (75 pacientes de un hospital)

    POBLACIN

    P1 P2 P3 Pn

    Edad Peso Temp. Corpor.Estado civil

    ...

    POBLACIN POBLACINPOBLACIN

    Caracterstica

    Registrode la

    carac-terstica.

    Marco Poblacional

    (1200 pacientes de un hospital)

    Tcnicas

    de muestreoMarco Muestral

    (75 pacientes de un hospital)

    POBLACIN

    P1 P2 P3 Pn

    Edad Peso Temp. Corpor.Estado civil

    ...

    POBLACIN POBLACINPOBLACIN

    Muestra Registro de una caracterstica en todos los elementos del marco muestral. Tiene tantos datos como elementos el marco muestral. Habrn tantas muestras como caractersticas se deseen registrar en un marco muestral. Las muestras no extraen de la poblacin, sino del marco muestral

  • Jorge Crdova Egocheaga

    17

    MARCO MUESTRAL(75 pacientes de un hospital)

    Caracterstica

    Registrode la

    carac-terstica.

    MARCO POBLACIONAL(1200 pacientes de un hospital)

    Tcnicas

    de muestreo

    POBLACIN

    P1 P2 P3 Pn

    Edad Peso Temp. corporal

    Estadocivil

    ...

    POBLACIN POBLACINPOBLACIN

    Edad Peso Estadocivil

    MUESTRA

    m1

    75 datos

    m2 m3 mn

    MUESTRA MUESTRA MUESTRA

    MARCO MUESTRAL(75 pacientes de un hospital)

    Caracterstica

    Registrode la

    carac-terstica.

    MARCO POBLACIONAL(1200 pacientes de un hospital)

    Tcnicas

    de muestreo

    POBLACIN

    P1 P2 P3 Pn

    Edad Peso Temp. corporal

    Estadocivil

    ...

    POBLACIN POBLACINPOBLACIN

    Edad Peso Estadocivil

    MUESTRA

    m1

    75 datos

    m2 m3 mn

    MUESTRA MUESTRA MUESTRA

    1.11 PARMETRO Y ESTIMADOR

    Valor representativo de una poblacin. Se simboliza por letras griegas. Slo hay un parmetro en cada poblacin.

    : Proporcin poblacional (pi)

    : Media poblacional (mu) 2 : V arianza poblacional (sigma cuadrado) : Desviacin estndar poblacional (sigma)

    : Coeficiente de correlacin poblacional (rho) : Proporcin poblacional (pi)

    : Media poblacional (mu) 2 : V arianza poblacional (sigma cuadrado) : Desviacin estndar poblacional (sigma)

    : Coeficiente de correlacin poblacional (rho)

    Estimador Valor representativo de una muestra. Se llama tambin estadgrafo o estadstico. Se simboliza por letras latinas. Existen tantos estimadores como muestras se extraigan de una poblacin.

  • Manual de Estadstica General

    18

    p Proporcin muestral

    Media muestral.2s Varianza muestra.

    s Desviacin estndar muestral.

    r Coeficiente de correlacin muestral

    p Proporcin muestral

    Media muestral.2s Varianza muestra.2s Varianza muestra.

    s Desviacin estndar muestral.s Desviacin estndar muestral.

    r Coeficiente de correlacin muestral

    DIFERENTES MUESTRAS GENERAN DIFERENTESVALORES DEL ESTIMADOR

    n3

    POBLACIN

    PARMETRO

    n22x

    nmmx

    .

    .

    3x..

    n1

    1x

    DIFERENTES MUESTRAS GENERAN DIFERENTESVALORES DEL ESTIMADOR

    n3

    POBLACIN

    PARMETRO

    n22x

    n22x

    nmmx

    nmmx

    .

    .

    3x3x..

    n1

    1x

    1.12 ESTADSTICA DESCRIPTIVA E INFERENCIAL

    Estadstica Descriptiva Tcnicas que permiten describir un conjunto de datos. El anlisis se limita a esos datos (sean muestrales o poblacionales). Tiene como objetivo presentar los datos obtenidos en forma resumida, clara y comprensible.

  • Jorge Crdova Egocheaga

    19

    Estadstica Inferencial Tcnicas que permiten estimar un parmetro a partir de datos muestrales.

    MuestraMuestra

    Estimador

    POBLACIN

    Parmetro

    MUESTRAEstadstica Descriptiva

    EstadsticaInferencial

    Estimador :

    POBLACIN

    - = Error de muestreoParmetro :

    Tcnica

    s de M

    uestreo

    x

    Ejemplos sobre muestra y estimador Suponga que estamos interesados en conocer la duracin de la evaluacin en el Servicio de Psiquiatra de las Clnicas de Lima. El INPE esta interesado en la relacin existente entre la criminalidad y los hogares destruidos. Un psiclogo mide la caracterstica en de 50 procesados. Supngase que el equipo de investigacin, desea determinar la proporcin de fumadores en la ciudad de Lima para

  • Manual de Estadstica General

    20

    determinar los factores de riesgo e incidencia de cncer pulmonar.

    1.13 EJERCICIO APLICATIVO

    El Director de Personal de la Clnica Santa Luca desea estimar la tardanza mensual promedio del personal que labora en esta clnica. Con este fin elige al azar la Tarjeta de Control de Asistencia del ltimo mes de 10 trabajadores. En uno de las tarjetas seleccionadas se registr 140 minutos de tardanza. En esta situacin, identifique:

    Diez trabajadores

    La caracterstica :

    La unidad elemental :(o unidad de anlisis)

    El marco poblacional:

    La poblacin :

    El marco muestral :

    Tiempo de tardanza mensual

    Un trabajador de la clnica

    Todo el personal que labora en esa clnicaRegistro de tiempo de tardanza mensual de todo el personal que labora en esta clnica

    El tiempo medio de tardanza de todos los trabajadores de la clnica ()

    La muestra :

    Tipo de dato :

    Un dato registrado :

    La unidad de medida:

    El estimador :

    El parmetro :

    Registro del tiempo de tardanza de cada uno de los trabajadores seleccionado

    Variable cuantitativa continua

    140

    minutos

    El tiempo medio de tardanza de los 10 trabajadores x

  • Jorge Crdova Egocheaga

    21

    Ejercicio 1 El Director de un Hospital sabe que en lo que va del ao, fueron dados de alta 1000 pacientes hospitaliza-dos y desea conocer el tiempo medio de permanencia en el hospital. Para ello selecciona al azar la historia clnica de 100 pacientes. Una de las historias permiti conocer que cierto paciente haba permanecido 6 das hospitalizado. En esta situacin identifique los siguientes trminos (no se pide la definicin): Caracterstica. Unidad elemental. Marco poblacional Poblacin. Marco muestral. Tipo de muestreo. Un dato. Unidad de medida. Un estimador. Un parmetro

  • Manual de Estadstica General

    22

  • 1 2

    CAPTULO 2

    RECOLECCIN DE DATOS

    Los datos no se recopilan como un fin en s mismos, sino como

    un medio para describir los hechos que estn tras los datos

    OBJETIVOS

    1. Recopilar datos. 2. Identificar la escala adecuada para cada

    caracterstica a recopilar. 3. Redondear datos cuantitativos. 4. Diferenciar mtodos y tcnicas de recoleccin de

    datos. 5. Elaborar una encuesta 6. Elaborar una hojas de registro.

  • Manual de Estadstica General

    24

    2.1 CMO SE RECOPILAN DATOS? Las buenas decisiones se basan en un adecuado registro de datos, para lo cual se debe: A. ESTABLECER OBJETIVOS CLAROS

    En control de la calidad, los objetivos son: Control del proceso de produccin Anlisis de lo que no se ajusta a las normas o estndares. Inspeccin o auditoria. Permite determinar qu tipo de datos se requiere.

    B. DETERMINAR EL TIPO DE DATO

    Datos para el control: se toman peridicamente para conocer la variacin diaria dentro de un proceso; es decir, para verificar su estado de control (estabilidad). Ejemplo: Nmero de pacientes diarios en consultorios externos por especialidad. Datos para el anlisis: se registran para conocer la situacin actual de nuestro proceso. Ejemplo: la tasa de prescripciones que no estn disponibles en la farmacia del hospital. Dato para la inspeccin: se recopilan al recibir o entregar un material. Son datos que sirven para verificar si el producto cumple con las especificaciones. Ejemplo: fecha de expiracin de un lote de medicamentos, antes de su ingreso a almacn.

  • Jorge Crdova Egocheaga

    25

    C. CONSIDERAR LA CONFIABILIDAD DE LOS REGISTROS

    Tener en cuenta la adecuada calibracin de los instrumentos de medicin y la variabilidad en inspecciones visuales.

    D. SELECCIONAR FORMAS APROPIADAS DE

    RECOLECTAR DATOS.

    I. Se debe registrar adecuadamente el origen de datos (el da, la hora, quines fueron los responsables, qu lote se uso, entre otros).

    II. Los datos deben registrarse de manera que facilite

    su utilizacin (hojas de registro).

    2.2 ESCALAS DE MEDICIN

    ESCALA NOMINAL: Los valores son nominativos, sirven para designar. Slo se puede realizar un conteo (frecuencias). No es factible las operaciones aritmticas. Se analizan a travs de la comparacin: igualdad y no igualdad ( = y ). Ejemplo Sexo del paciente 1: Masculino 2: Femenino Grupo sanguneo A B AB O Servicio mdico 1: Emergencia 2: Ginecologa

    3: Traumatologa 4: Pediatra ESCALA ORDINAL: Los valores representan un orden. No son cuantitativos, slo simbolizan una posicin. Se analizan a travs de la desigualdad :mayor que o menor que (> y

  • Manual de Estadstica General

    26

    Ejemplo: Calificacin : A,B,C,D A > B Lugar (orden) : 1 , 2 , 3 1 > 2 Dolor : leve, moderado, intenso ESCALA DE INTERVALOS: Se utilizan nmeros cardinales. El cero es relativo o diferencial, es decir no indica ausencia de la propiedad. Se pueden realizar operaciones aritmticas.(+ y -). Es una escala creada por el hombre. Ejemplo: Hora 00:00 Temperatura ambiental 0 C El ao en que vivimos 2003 ESCALA DE RAZN: Se utilizan nmeros cardinales. Tienen unidad de medida (cms, pulgadas). El cero es absoluto, indica ausencia de la propiedad. Se pueden realizar operaciones aritmticas (+,-,x ,), Ejemplo: Pacientes no atendidos hoy : 0 N de hijos en edad de vacunacin : 0 Procesos deficientes : 0

    2.3 REDONDEO DE DATOS Durante el anlisis, muchas veces se divide un nmero por otro obtenindose en algunas ocasiones, un nmero infinito de decimales.

  • Jorge Crdova Egocheaga

    27

    Con el objeto de hacer ms operativo el manejo de estos datos se redondean. Para cortar o redondear, se siguen las siguientes reglas.

    1ra REGLA: Para la respuesta final, debemos redondear hasta dos lugares ms de lo que haba en los datos originales. No se debe redondear en los pasos intermedios.

    Ejemplo : datos originales : enteros resultado final : 2 decimales.

    2 REGLA:

    Si la cifra que sigue es mayor a 5, se aumenta 1. Si la cifra que sigue es menor a 5, el nmero no vara.

    Ejemplo: Redondeo a 2 decimales 6,176 . 6,18 4,123 . 4,12

    3 REGLA: Si la cifra que sigue es 5 y el nmero anterior es par no se modifica. Pero si el nmero es impar, aumenta 1. Ejemplo: Redondeo a 2 decimales

    6,545 . 6,54 1,975 . 1,98

  • Manual de Estadstica General

    28

    2.4 FUENTES DE DATOS

    A) FUENTES SECUNDARIAS Datos recolectados anteriormente para alcanzar otros objetivos. Constituye la primera fuente que se debe analizar. La tcnica ms utilizada son las fichas.

    Ejemplo: Datos publicados (en papel o en forma electrnica) en revistas especializadas, tesis, censos y en las hojas de registro anteriores.

    La calidad de los datos debe ser comprobada: De donde provienen los datos? La fuente es imparcial? Los datos comprueban o contradicen otras evidencias que se disponen? Hace falta una evidencia cuya ausencia conduzca a otra conclusin? Cuantas observaciones se tienen? La conclusin que obtengo es lgica? Los principales organismos que disponen de publicaciones son: 1. Instituto Nacional de Estadstica e Informtica (INEI) 2. Organizacin Mundial del Trabajo (OIT) 3. Organizacin Mundial de la Salud (OMS) 4. Organizacin Panamericana de la Salud (OPS)

    B) FUENTES PRIMARIAS

    1. Constituyen datos recolectados para el trabajo. Son

    datos que no existan antes. 2. Se registran bajo dos mtodos: directo e indirecto

  • Jorge Crdova Egocheaga

    29

    2.5 MTODOS Y TCNICAS DE RECOLECCIN DE DATOS A) MTODOS DIRECTOS

    El responsable registra personalmente los valores de la caracterstica. Ejemplo: registro del tiempo que demora un mdico durante una consulta. Comprende 2 tcnicas. (a) La observacin

    1. Se registra el dato bajo condiciones normales 2. Cuando se mide el desempeo, la persona observada no debe saber que es sujeta de observacin 3 Se utiliza una hoja de registro. Ejemplo La observacin del desempeo de una enfermera durante sus labores en el Servicio de Emergencia.

    (b) La experimentacin Se registra un dato bajo condiciones provocadas simulando el proceso lo ms real posible. Ejemplo: Un mercado prueba para introducir un tipo jabn de antisptico con fragancia .

    B) MTODOS INDIRECTOS

    1 Se registra la caracterstica a travs de preguntas 2. No se realiza medicin

  • Manual de Estadstica General

    30

    Ejemplo: Se pregunta a un paciente el tiempo que esper antes que sea atendido en el consultorio externo. Comprende 2 tcnicas: la encuesta y la entrevista. (a) La encuesta

    1. Cuestionario de preguntas abiertas o cerradas 2. Al disearla se debe:

    Elegir lo temas generales de la encuesta Decidir forma de aplicarlo: correo, telfono

    o personal Plantear preguntas Realizar una prueba piloto y hacer

    revisiones finales

    Ejemplo: Encuesta para conocer el grado de satisfaccin de los asegurados a una clnica.

    (b) La entrevista 1. Permite recolectar datos o partir de un dialogo 2. Puede se estructurada o no estructurada

    Ejemplo: Entrevista al Director de una Clnica sobre la aplicacin de norma de calidad.

    METODOS Y TCNICAS DE RECOLECCION DE DATOS

    FUENTE METODOS TECNICAS

    SECUNDARIA FICHAS

    DIRECTO OBSERVACIONPRIMARIA EXPERIMENTACION

    INDIRECTO ENCUESTA

    ENTREVISTA

  • Jorge Crdova Egocheaga

    31

    Cmo seleccionar la fuente, el mtodo y la tcnica? No toda la informacin requerida ser recopilada de una sola fuente, ni usando un mismo mtodo y tcnica. Casi siempre es una combinacin de ellos, para lo cual hay que: Definir caractersticas que interesan registrar. Identificar la fuente de informacin apropiada para cada caracterstica. Seleccionar la tcnica ms conveniente. En un estudio de investigacin de mercados para paales desechables, interesa conocer ciertas caractersticas,

    CARACTERISTICA FUENTE TECNICA Tasa de natalidad Secundaria Fichas Nivel socio-econmico de la familia Primaria Encuesta Textura del producto Primaria Entrevista 2.6 EL CUESTIONARIO

    Consiste en un conjunto de preguntas diseadas de acuerdo a la necesidad de informacin. Junto con las hojas de registro, es la tcnica ms comn para la recopilacin de datos de fuentes primarias. Recomendaciones para su elaboracin Las preguntas deben ser coherentes con el objetivo de la investigacin. No hay preguntas de carcter general. La extensin (nmero de preguntas) depende de la necesidad de informacin a recolectar por esta tcnica.

  • Manual de Estadstica General

    32

    El lenguaje utilizado en la redaccin de preguntas debe ser entendible por los encuestados. Es diferente al lenguaje a usarse en el informe final Debe evitarse la ambigedad. Ejemplo: En un estudio para determinar el grado de asociacin entre la incidencia a cncer pulmonar y el hbito a fumar, se hizo la siguiente pregunta: Fuma usted? Si 1 No 2 No formular preguntas dirigidas. Evitar adjetivos, ya que predisponen a una respuesta. Ejemplo: Cree Ud. que el precio del medicamento es alto? Si 1 No 2 Preguntas cerradas y abiertas Preguntas cerradas

    Las posibles respuestas se presentan como alternativas. Facilita la codificacin y operatividad de los datos. Ejemplo : Posee Ud. un seguro mdico? Si 1 No 2

    Preguntas abiertas

    Los encuestados tienen libertad para emitir su opinin. Se utilizan cuando no se tiene precisin sobre las posibles respuestas. Dificulta la recoleccin de datos (incomoda al encuestado). Dificulta la interpretacin de datos.

  • Jorge Crdova Egocheaga

    33

    Ejemplo: Qu opinin tiene sobre la poltica de salud del actual Gobierno ?

    2.7 LA ELABORACIN DE DATOS: EL CONTROL DE

    CALIDAD

    Una vez que se han recolectado los datos referidos a las diferentes variables necesarias para la investigacin, se debe proceder a revisarla y presentarla de manera que facilite su anlisis. A este proceso se denomina elaboracin de datos. Las etapas que abarca son: edicin, tabulacin y codificacin. A) La edicin: Se revisan los formularios (cuestionario y

    fichas de observacin) para verificar si todas las preguntas han sido respondidas en todos los ellos. Se debe verificar incongruencias en de las respuestas. a) Reencuestar: Si no se respondieron todas las

    preguntas y es posible identificar al encuestado (por ejemplo, se tiene su direccin), se podra regresar y formular aquellas preguntas que se obviaron.

    b) Anular la pregunta: Si una pregunta es dejada de

    contestar en muchos cuestionarios, sera recomendable anular esa pregunta y buscar la forma de conseguir el dato por otra fuente. Probablemente, la pregunta fue mal formulada.

    c) Anular el formulario: Si una encuesta o la ficha de

    observacin tiene demasiadas preguntas en blanco, se anular todo el cuestionario. Es posible que no se contara con la colaboracin apropiada del encuestado o tal vez no se aplic correctamente.

  • Manual de Estadstica General

    34

    B. La tabulacin: Consiste en etiquetar o titular con pocas palabras, las respuestas a preguntas abiertas. Para homogenizar el criterio, es recomendable que una persona se encargue de este proceso. Si fueran muchos formularios y varias preguntas abiertas, podran ser varias personas que tabulen, pero necesariamente solo una persona por pregunta.

    C. La codificacin: Consiste en colocar un cdigo a las

    respuestas, a fin de poder construir una base de datos. 2.8 LAS HOJAS DE REGISTRO (O CHECK LIST)

    Son formatos preimpresos que facilitan el registro y la organizacin de cualquier tipo de datos. Puede ser: Para registro: Se anota sistemticamente la informacin. Ejemplo: Tarjeta de Registro de Asistencia del personal que labora en una Clnica

    Para verificacin: Se anota informacin en determinado tiempo, que debe cotejarse con la realidad. Ejemplo: Registro de las recetas no atendidas por semana. EJEMPLO 1:

    Hoja de registro para la distribucin del proceso de produccin

    La medida optima es 8.300 Se acepta una variabilidad mxima 0,008 Se registra cada uno de los 55 productos elaborados en un da, colocando una x en la casilla correspondiente. Se construye simultneamente el histograma.

    Caso: Hoja de registro para ver la distribucin en un proceso de produccin.

  • Jorge Crdova Egocheaga

    35

    EJEMPLO 2: Hoja de registro de tems defectuosos Permiten identificar el tipo de defecto ms frecuente. Un producto puede presentar ms de un defecto. Es necesario tipificar con antelacin los defectos posibles. Caso: Hoja de registro de inspeccin final de cierto producto plstico moldeado.

  • Manual de Estadstica General

    36

    EJEMPLO 3 Hoja de registro de las causas del defecto Permite una estratificacin adicional con el fin de encontrar las causas de los defectos. Caso: Hoja de registros de ocurrencias de los defectos en ciertos accesorios utilizados en la elaboracin de prtesis dental, asignables a maquinaria, trabajadores, da y tipo de defecto.

  • Jorge Crdova Egocheaga

    37

  • Manual de Estadstica General

    38

  • 3

    CAPTULO 3

    ORGANIZACIN TABULAR DE

    DATOS

    OBJETIVOS

    Al finalizar el Captulo 3, el participante ser capaz de:

    1. Organizar datos a travs de una clasificacin ordenada de datos.

    2. Organizar datos a travs de un diagrama tallo-hojas. 3. Elaborar una tabla de distribucin de frecuencias para

    datos univariados 4. Elaborar una tabla de distribucin de frecuencias para

    datos bivariados.

  • Manual de Estadstica General

    40

    3.1 LA IMPORTANCIA DE LA ORGANIZACIN DE LOS DATOS Los datos deben organizarse, para entender mejor su naturaleza fundamentalmente utilizando dos mtodos : el mtodo tabular y el mtodo grfico. Si los datos no estn organizados son de poca utilidad en una investigacin o para una toma de decisiones. Ejemplo Los niveles altos de colesterol en suero, han sido por mucho tiempo asociados con el incremento del riesgo de enfermedades cardiovasculares. Se han efectuado numerosos estudios en un esfuerzo por lograr una mayor comprensin de la naturaleza de esta asociacin. Se muestra a continuacin las concentraciones de colesterol en suero que fueron recolectadas a una poblacin de 480 individuos aparentemente sanos. A qu conclusin llega?

  • Jorge Crdova Egocheaga

    41

    244202208213258256142249237212183204275176182287

    258209195215276206219214183231201220230216211205

    222246226174234259201185239240184277251146182244

    226281271203253190240238209202187204240229253231

    136254267207258210244277142206243226193200241223

    188220174250212278222187246171183245199187172169

    225247238265203224232177261160195228196222215209

    179204198223269266220242266226183184244193180152

    221216262234179187181208224208221227215214191239

    175225208221216272239253218218195202295212203239

    209210223210231201214202272259199208263188199185

    223171241228156237240211264186172192292226189219

    208226222265225219231232254248261270217221200196

    196231220173218243245184167236227258286189251276

    221211196205239218232221221221239199220252249224

    265261177238263171189249154202175222248234218206

    215274246229209191189161233170231249169252258161191236212232230203219234265208254196228180250209215184174194229188161247195222187248250216249192155209201225212245241255220257224250197216166190243248257192212229204189222221261241180242177244249213262203172266214228173222155218265218252225230216271212163263229233254215184229186259195193227222232200192253230243159263212267223222233209194206205194220235280289223225249179200212189238230276207177262231248230243191192243218154228248197242218241163213202222197269138189214216197304170230234188186236192200186223174201198292180203243223221202220163212230262234186275214245227159238261265197260191194212269183248259236209199231

    244202208213258256142249237212183204275176182287

    258209195215276206219214183231201220230216211205

    222246226174234259201185239240184277251146182244

    226281271203253190240238209202187204240229253231

    136254267207258210244277142206243226193200241223

    188220174250212278222187246171183245199187172169

    225247238265203224232177261160195228196222215209

    179204198223269266220242266226183184244193180152

    221216262234179187181208224208221227215214191239

    175225208221216272239253218218195202295212203239

    209210223210231201214202272259199208263188199185

    223171241228156237240211264186172192292226189219

    208226222265225219231232254248261270217221200196

    196231220173218243245184167236227258286189251276

    221211196205239218232221221221239199220252249224

    265261177238263171189249154202175222248234218206

    215274246229209191189161233170231249169252258161191236212232230203219234265208254196228180250209215184174194229188161247195222187248250216249192155209201225212245241255220257224250197216166190243248257192212229204189222221261241180242177244249213262203172266214228173222155218265218252225230216271212163263229233254215184229186259195193227222232200192253230243159263212267223222233209194206205194220235280289223225249179200212189238230276207177262231248230243191192243218154228248197242218241163213202222197269138189214216197304170230234188186236192200186223174201198292180203243223221202220163212230262234186275214245227159238261265197260191194212269183248259236209199231

    Al observar a un conjunto de datos, deseamos identificar a las principales propiedades que definen a este conjunto. Lamentablemente, no se puede obtener alguna conclusin vlida. Los datos tal como se presentan no nos permiten afirmar algo sobre ellos. Para lograr identificar las principales medidas y propiedades de este conjunto de datos, tenemos que organizar previamente al conjunto de datos.

    3.2 ELEMENTOS DE LA ORGANIZACIN TABULAR

    Consiste en una presentacin resumida de la informacin usando tablas o cuadros Ejemplo: Supongamos que en una entrevista a pacientes del lo que se busca evaluar son 2 aspectos:

  • Manual de Estadstica General

    42

    - La opinin sobre la calidad de atencin - Nivel de instruccin de la paciente

    Como son dos variables categricas, la presentacin de los datos podra realizarse en una tabla cruzada:

    751758TOTAL

    15312Superior

    30723Secundaria

    20515Primaria

    1028Analfabeta

    DesfavorableFavorableEDUCATIVOTOTAL

    OPININNIVEL

    751758TOTAL

    15312Superior

    30723Secundaria

    20515Primaria

    1028Analfabeta

    DesfavorableFavorableEDUCATIVOTOTAL

    OPININNIVEL

    3.2.1 Ventajas Se pueden apreciar propiedades de los datos. Permite establecer asociaciones entre variables Se ahorra espacio en un informe escrito.

    3.2.2 Elementos:

    A. El Ttulo: enunciado breve e informativo acerca del

    contenido del cuadro. Un buen ttulo debe responder a las siguientes interrogantes:

    1. Qu contiene la tabla? Ej.: La opinin de 75 pacientes sobre calidad de atencin. 2. Cmo estamos presentando el contenido? Ej.: Por nivel educativo de las pacientes

  • Jorge Crdova Egocheaga

    43

    3. De dnde se obtuvieron los datos? Ej.: Del servicio de Ginecologa del Hospital Santa Rosa. Lima.

    4. Cundo se obtuvo la informacin? Ej.: (fecha de la recoleccin de los datos) Un buen ttulo podra ser: Opinin de 75 pacientes por nivel educativo sobre la calidad de atencin en el Servicio de Ginecologa del HOSPITAL SANTA ROSA. Lima, enero del 2003.

    B. La Matriz: Est constituido por el primer rengln y la primera columna, en donde se describen los nombres de las categoras (en datos categricos) o los intervalos de clases (en datos cuantitativos), tan conciso como sea posible.

    Para datoscategricos

    TOTAL

    Superior

    Secundaria

    Primaria

    Analfabeta

    DesfavorableFavorableINSTRUCCIN

    TOTALOPININNIVEL DE

    TOTAL

    Superior

    Secundaria

    Primaria

    Analfabeta

    DesfavorableFavorableINSTRUCCIN

    TOTALOPININNIVEL DE

    Total

    71 - 78

    63 - 70

    55 - 62

    47 - 54

    39 - 46

    (hi)(fi)(en aos)

    Tasa porcentual :%N de pacientesEDAD

    Total

    71 - 78

    63 - 70

    55 - 62

    47 - 54

    39 - 46

    (hi)(fi)(en aos)

    Tasa porcentual :%N de pacientesEDAD

    Ejemplo

    C. El cuerpo: Est conformado por espacios y

    constituyen intersecciones de filas y columnas, que a veces se denominan celdas, y donde se anotan

  • Manual de Estadstica General

    44

    las frecuencias absolutas y relativas obtenidas en la tabulacin, incluyendo totales y subtotales. Por ejemplo

    751758TOTAL

    15312Superior

    30723Secundaria

    20515Primaria

    1028Analfabeta

    DesfavorableFavorableEDUCATIVOTOTAL

    OPININNIVEL

    751758TOTAL

    15312Superior

    30723Secundaria

    20515Primaria

    1028Analfabeta

    DesfavorableFavorableEDUCATIVOTOTAL

    OPININNIVEL

    D. Notas aclaratorias: Estn constituidas por toda aquella informacin adicional que es necesaria para describir e interpretar adecuadamente el contenido de la tabla o cuadro. Es muy importante cuando se trata de datos proveniente de fuente secundaria. Es un aspecto tico precisar de donde provienen los datos, a la vez que nos liberamos de la responsabilidad de responder por su calidad. Se escribe con letra ms pequea.

  • Jorge Crdova Egocheaga

    45

    Tabla 1: Opinin de 75 pacientes por nivel educativo sobre la calidad de atencin en el Servicio de Ginecologa del HOSPITAL SANTA ROSA. Lima, enero del 2003.

    751758TOTAL

    15312Superior

    30723Secundaria

    20515Primaria

    1028Analfabeta

    DesfavorableFavorableEDUCATIVOTOTAL

    OPININNIVEL

    751758TOTAL

    15312Superior

    30723Secundaria

    20515Primaria

    1028Analfabeta

    DesfavorableFavorableEDUCATIVOTOTAL

    OPININNIVEL

    Fuente: Hospital San Rosa. Direccin de Procesos. Enero 2003.

    La presentacin tabular de datos pueden realizarse bajo tres formas, desde la ms elemental se tiene: - Clasificacin ordenada de datos. - Diagrama de tallos y hojas - Tablas de distribucin de frecuencias.

    3.2 CLASIFICACIN ORDENADA DE DATOS

    Si ordenamos los datos sin procesar, de la observacin ms pequea a la ms grande, la secuencia ordenada obtenida, se denomina clasificacin ordenada. Ejemplo: en un estudio del crecimiento de varones, se obtuvieron estas observaciones sobre el permetro ceflico (en centmetros) de un nio al nacer:

    34.034.136.534.235.134.733.934.833.734.635.2

    35.333.633.834.933.434.334.634.734.236.033.735.2

    35.134.334.234.535.834.535.634.236.134.234.633.1

    34.034.136.534.235.134.733.934.833.734.635.2

    35.333.633.834.933.434.334.634.734.236.033.735.2

    35.134.334.234.535.834.535.634.236.134.234.633.1

    Ordenando los datos de manera ascendente, tenemos:

  • Manual de Estadstica General

    46

    33.1 33.7 33.9 34.2 34.2 34.3 34.6 34.7 34.9 35.2 35.6 36.133.4 33.7 34.0 34.2 34.2 34.5 34.6 34.7 35.1 35.2 35.8 36.533.6 33.8 34.1 34.2 34.3 34.5 34.6 34.8 35.1 35.3 36.0

    Cules son las principales propiedades que se observa en este conjunto de datos? Las principales propiedades que se observan en este conjunto de datos son: El nmero de datos es de 35. La menor observacin es de 33,1 cms. La mayor observacin es de 36,5 cms. El rango de los valores observados es de 3,5 cms. =(36,5 33,1)+ 0,1 cms. El 51,43% (18 nios) de los datos estn alrededor de 34 cms. Son muy pocos frecuentes los nios con permetro ceflico mayor a 36 cms. (slo 3 nios). Mientras mayor sea el nmero de observaciones presentes en una serie de datos, mas laborioso es realizar la clasificacin ordenada de los datos.

    3.3 DIAGRAMA DE TALLO Y HOJAS Un diagrama de tallo y hojas consiste en una serie de hileras horizontales de nmeros. El nmero utilizado para designar una hilera es un tallo, el resto de nmeros de la hilera se denominan hojas. Esta tcnica funciona bien, cuando el conjunto de datos no tiene una gran dispersin Se pueden considerar el siguiente proceso: Elija algunos nmeros adecuados que puedan servir de tallo. Se requieren como mnimo 5 tallos. Los tallos elegidos

  • Jorge Crdova Egocheaga

    47

    generalmente son el primer o los dos primeros dgitos de los datos. Nombre las hileras mediante los tallos elegidos. Organice grficamente los datos registrando el dgito, siguiendo el tallo. Trazar una curva a lo largo de la parte superior del diagrama. Determinar las principales caractersticas. Ejemplo: Con los datos anteriores sobre el permetro ceflico, construir un diagrama tallo-hoja.

    33.1 34.6 34.2 36.1 34.2 35.6 34.5 35.8 34.5 34.2 34.3 35.135.2 33.7 36.0 34.2 34.7 34.6 34.3 33.4 34.9 33.8 33.6 35.335.2 34.6 33.7 34.8 33.9 34.7 35.1 34.2 36.5 34.1 34.0

    Dato menor: 33,1 Dato mayor: 36,5 Tallos posibles: 33, 34, 35 y 36Slo existen 4 tallos, debiendo ser el mnimo 5 tallos, entonces los tallos propuestos se desdoblan, de la siguiente manera: 33 (del 33,0 al 33,4) 33 (del 33,5 al 33,9)

    34 (del 34,0 al 34,4) 34 (del 34,5 al 34,9)

    35 (del 35,0 al 35,4) 35 (del 35,5 al 35,9)

    36 (del 36,0 al 36,4) 36 (del 36,5 al 36,9)

  • Manual de Estadstica General

    48

    Luego clasificamos los datos en funcin al valor del decimal.

    3 3

    3 3

    3 4

    3 4

    3 5

    3 5

    3 6

    3 6

    1 4

    7 7 9 8 6

    2 2 2 3 2 2 1 3 0

    6 6 8 7 6 7 5 5 9

    2 2 1 1 3

    6 8

    0 1

    5

    25 datos

    10 datos

    Finalmente, se traza una lnea por el borde, a fin de delimitar la forma de la distribucin. Qu caractersticas se observan?.

    Las principales propiedades de los datos : - Son 35 casos. - La menor observacin es de 33,1 cms. - La mayor observacin es de 36,5 cms. - El rango de los valores observados es de 3.5 cms. (36,5 33,1 + 0.1 cms.) - El 51,43% (18 casos) de los datos estn alrededor de los 34 cms. - Son muy poco frecuentes los casos mayores a 36 cms (3 casos) y menores a 33,5 cms (2 casos). - La distribucin de datos est sesgada a la derecha (sesgo positivo), es decir, hay una mayor concentracin de datos a la izquierda.

  • Jorge Crdova Egocheaga

    49

    Ejercicio Se realiza un estudio para ayudar a comprender el efecto de fumar en los patrones de sueo. La variable es el tiempo que tarda en quedarse dormido. La muestras de fumadores y no fumadores producen estas observaciones :

    17,419,322,419,218,819,5

    20,720,420,521,022,121,8

    21,317,520,123,016,921,1

    20,223,320,622,118,921,2

    21,425,024,120,022,919,8

    20,124,923,619,819,916,2

    17,618,315,118,119,717,2

    17,419,322,419,218,819,5

    20,720,420,521,022,121,8

    21,317,520,123,016,921,1

    20,223,320,622,118,921,2

    21,425,024,120,022,919,8

    20,124,923,619,819,916,2

    17,618,315,118,119,717,2

    FUMADORES

    15,123,023,119,915,315,7

    19,924,917,216,125,123,2

    17,923,818,015,225,724,3

    16,321,624,115,024,125,8

    25,018,325,219,422,422,8

    25,215,922,118,121,216,8

    24,816,021,317,720,515,1

    15,123,023,119,915,315,7

    19,924,917,216,125,123,2

    17,923,818,015,225,724,3

    16,321,624,115,024,125,8

    25,018,325,219,422,422,8

    25,215,922,118,121,216,8

    24,816,021,317,720,515,1

    NO FUMADORES

    Construya un diagrama tallo-hoja para cada uno de estos conjuntos de datos. Utilice los valores enteros del 15 al 25 (inclusive) como tallos. Se sorprendera si alguien le dijera que no existe diferencia en la distribucin de esta variable en los dos grupos?. Explique.

    3.4 TABLA DE DISTRIBUCIN DE FRECUENCIAS

    Pueden ser simples o cruzadas A) Tablas simples

    1 Se utilizan para presentar una sola variable. 2 Pueden representar datos cualitativos o

    cuantitativos. 3. Presentan por lo menos dos columnas: categora o

    clase y el nmero de datos o frecuencia de clase. 4. Puede incluirse una columna de tasa porcentual. Para datos cualitativos se siguen los pasos siguientes:

  • Manual de Estadstica General

    50

    (1) Identificar diferentes categoras. (2) Realizar un conteo. (3) Elaborar la tabla: titulo, cuerpo y fuente.

    Ejemplo Con la finalidad de mejorar la calidad del servicio de emergencia en una clnica local, se ha formulado la siguiente pregunta a 45 pacientes atendidos durante una semana: Cmo califica la calidad de la atencin que Ud, acaba de recibir en este Servicio de Emergencia: muy bueno, bueno, aceptable, malo o muy malo

    Los datos recolectados se presentan a continuacin:

    Muy bueno Aceptable Aceptable Muy bueno Bueno

    Bueno Bueno Muy malo Bueno Bueno

    Aceptable Bueno Aceptable Malo Muy bueno

    Malo Aceptable Muy malo Aceptable Malo

    Aceptable Muy bueno Bueno Bueno Aceptable

    Bueno Malo Aceptable Muy malo Bueno

    Malo Bueno Malo Bueno Aceptable

    Bueno Bueno Muy malo Muy bueno Malo

    Aceptable Bueno Aceptable Malo Bueno

    Muy bueno Aceptable Aceptable Muy bueno Bueno

    Bueno Bueno Muy malo Bueno Bueno

    Aceptable Bueno Aceptable Malo Muy bueno

    Malo Aceptable Muy malo Aceptable Malo

    Aceptable Muy bueno Bueno Bueno Aceptable

    Bueno Malo Aceptable Muy malo Bueno

    Malo Bueno Malo Bueno Aceptable

    Bueno Bueno Muy malo Muy bueno Malo

    Aceptable Bueno Aceptable Malo Bueno

    Primero, se identifican las categoras:

    Muy bueno Bueno Aceptable Malo Muy malo

  • Jorge Crdova Egocheaga

    51

    Segundo, se realiza el conteo de las frecuencias: Muy bueno ///// Bueno ///// ///// ///// / Aceptable ///// ///// // Malo ///// /// Muy malo ////

    Tercero, se presenta la tabla, considerando el ttulo y la fuente.

    Cuadro 1: Calidad del Servicio de Emergencia

    Fuente: Encuesta a los Pacientes, julio 2002

    N m e ro d e T a s aC a t e g o r i a P a c ie n t e s P o r c e n t u a l

    M u y B u e n o 5 1 1 ,1 1

    B u e n o 1 6 3 5 ,5 5

    A c e p t a b l e 1 2 2 6 ,6 7

    M a lo 8 1 7 ,7 8

    M u y M a lo 4 8 ,8 9

    T o t a l 4 5 1 0 0 , 0 0

    Para datos cuantitativos se sigue el procedimiento siguiente: (1) Se calcula el rango:(mayor - menor) + 1 (2) Se determina el nmero de clases, que mejor

    representa a los datos (entre 4 y 20). Se realiza un tanteo.

    (3) Se determina el tamao o amplitud de clase.

  • Manual de Estadstica General

    52

    (4) Se elige el limite inferior de la primera clase. (5) Se establecen los lmites inferiores de las

    siguientes clases. (6) Se establecen los limites superiores de cada una de

    las clases. (7) Se realiza un conteo, a fin de determinar cuantos

    datos se incluyen en cada clase. (8) Se elabora la tabla: titulo, cuerpo y fuente.

    Ejemplo: Revisemos el ejemplo sobre los niveles de colesterol en suero presentado anteriormente.

    231 199 209 236 259 248 183 269 212 194 191 260 197 265 261

    159 227 245 214 275 186 234 262 230 212 163 220 202 221 223

    203 180 292 198 201 174 223 186 200 192 236 186 188 234 230

    304 197 216 214 189 138 269 197 222 202 213 163 241 218 242

    248 228 154 218 243 192 191 243 230 248 231 262 177 207 276

    238 189 212 200 179 249 225 223 289 280 235 220 194 205 206

    209 233 222 223 267 212 263 159 243 230 253 192 200 232 222

    193 195 259 186 229 184 215 254 233 229 263 163 212 271 216

    225 252 218 265 218 155 222 173 228 214 266 172 203 262 213

    244 177 242 180 241 261 221 222 189 204 229 212 192 257 248

    190 166 216 197 250 224 257 220 255 241 245 212 225 201 209

    192 249 216 250 248 187 222 195 247 161 188 229 194 174 184

    209 250 180 228 196 254 208 265 234 219 203

    231 199 209 236 259 248 183 269 212 194 191 260 197 265 261

    159 227 245 214 275 186 234 262 230 212 163 220 202 221 223

    203 180 292 198 201 174 223 186 200 192 236 186 188 234 230

    304 197 216 214 189 138 269 197 222 202 213 163 241 218 242

    248 228 154 218 243 192 191 243 230 248 231 262 177 207 276

    238 189 212 200 179 249 225 223 289 280 235 220 194 205 206

    209 233 222 223 267 212 263 159 243 230 253 192 200 232 222

    193 195 259 186 229 184 215 254 233 229 263 163 212 271 216

    225 252 218 265 218 155 222 173 228 214 266 172 203 262 213

    244 177 242 180 241 261 221 222 189 204 229 212 192 257 248

    190 166 216 197 250 224 257 220 255 241 245 212 225 201 209

    192 249 216 250 248 187 222 195 247 161 188 229 194 174 184

    209 250 180 228 196 254 208 265 234 219 203

    Solucin Se calcula el rango: R = Mayor menor + 1 Mayor = 317 Menor = 106 Rango = (317 106) + 1 = 212

  • Jorge Crdova Egocheaga

    53

    Se tantea el nmero de clases: 4 clases de 53 Rango corregido 212: No exceso 5 clases de 43 Rango corregido 215: Exceso 3 6 clases de 36 Rango corregido 216: Exceso 4 7 clases de 31 Rango corregido 217: Exceso 5 8 clases de 27 Rango corregido 216: Exceso 4

    Se escoge 4 clases por tener el menor exceso. La amplitud de clase es 53.

    Como no hay exceso con 4 clases, el lmite inferior de la primera clase es el menor nmero. En este caso 106.

    5. Los lmites inferiores de las clases siguientes se forman

    sumando al lmite inferior de la primera clase, la amplitud. En este caso, 53

    NIVELES DE Tasa

    COLESTEROLPERSONAS

    porcentual (%)

    106 -

    159 -

    212 -

    265 -

    Total 1000 100,00

    Fuente: Departamento de Salud

    El menorvalor

    106 + 53

    6. Luego se calculan los lmites superiores de cada clase. Para la primera clase se resta 1 al lmite inferior de la segunda clase. Para las clases siguientes, se le suma la amplitud, en este caso 53.

  • Manual de Estadstica General

    54

    Cuadro 2: Niveles de colesterol en Lima

    Fuente: Departamento de Salud

    NIVELES DE

    COLESTEROL porcentual (%)

    Total 1000 100,00

    106 - 158

    159 - 211

    212 - 264

    265 - 317

    159 - 1

    158 + 53

    TasaPERSONAS

    NIVELES DE

    COLESTEROL porcentual (%)

    Total 1000 100,00

    106 - 158106 - 158

    159 - 211159 - 211

    212 - 264212 - 264

    265 - 317265 - 317

    159 - 1

    158 + 53

    TasaPERSONAS

    7. Finalmente se realiza el conteo de las frecuencias y se presenta la tabla con un ttulo y fuente.

    Se acostumbra presentar una columna con la frecuencias relativas (%) En algunas ocasiones se elaboran las tablas con clases abiertas cuando los datos inferiores o superiores estn muy dispersos

  • Jorge Crdova Egocheaga

    55

    Cuadro 3: Ventas diarias en la Farmacia durante el mes de junio (en soles)

    Ventas Tasa

    (en soles) Dias porcentual (%)

    menos de 5000 3 10,00

    5000 - 8999 7 23,33

    9000 - 12999 10 33,33

    13000 - 16999 8 26,67

    17000 - 20999 2 6,67

    Total 30 100,00 Fuente: Registro de Ventas

    Ejercicio Los siguientes datos de refieren a la estatura (en metros) de 50 pacientes que se atienden en el servicio de reumatologa de la Clnica Sagrado Corazn. Construya una tabla de distribucin de frecuencias. 1,68 1,72 1,70 1,67 1,76 1,82 1,59 1,66 1,82 1,70 1,66 1,70 1,68 1,65 1,74 1,80 1,57 1,64 1,80 1,68 1,72 1,74 1,72 1,69 1,78 1,84 1,61 1,69 1,84 1,74 1,73 1,75 1,75 1,72 1,81 1,87 1,64 1,70 1,86 1,74 1,75 1,77 1,76 1,72 1,81 1,87 1,64 1,72 1,87 1,77 La tabla de distribucin de frecuencias completa, tiene la siguiente estructura

  • Manual de Estadstica General

    56

    Acumulada: HiAcumulada: Firelativa: hiabsoluta: fiClase: XiLsLi

    Frec. RelativaFrec. AbsolutaFrecuenciaFrecuenciaMarca de CLASE

    Acumulada: HiAcumulada: Firelativa: hiabsoluta: fiClase: XiLsLi

    Frec. RelativaFrec. AbsolutaFrecuenciaFrecuenciaMarca de CLASE

    Li limite inferior

    Ls limite superior

    Xi Marca de la clase i

    fi frecuencia absoluta de la clase i.

    hi frecuencia relativa de la clase i.

    Fi frecuencia absoluta acumulada hasta la clase i.

    Hi frecuencia relativa acumulada hasta la clase i.

    Ejercicio 2: Complete la siguiente tabla que corresponde al peso de 60 pacientes del Hospital Central.

    Total

    968,0 72,9

    0,2563,0 67,9

    58,0 62,9

    0,3053,0 57,9

    648,0 52,9

    (en kilos)HihiFifi

    PESO

    Total

    968,0 72,9

    0,2563,0 67,9

    58,0 62,9

    0,3053,0 57,9

    648,0 52,9

    (en kilos)HihiFifi

    PESO

    Ejercicio 3 La siguiente informacin se refiere al peso (en Kg.) de 60 personas. Elabore una tabla de distribucin de frecuencias. k=6 LI1=35 LS5=64 F2=20 h3=0,213 H4=0,799 f6 = 5 f1=4

  • Jorge Crdova Egocheaga

    57

    Ejercicio 4 Complete la siguiente tabla de distribucin de frecuencias:

    000.1 =ih30==fn

    n

    fhi =

    actanti ffF +=actanti hhH +=

    f ant --> frecuencia anterior

    f act --> frecuencia actual

    Total

    3156,2 - 163,0

    8149,3 - 156,1

    10142,4 - 149,2

    7135,5 - 142,3

    2128,6 - 135,4

    (en librasHihiFiXifi

    PESO

    Total

    3156,2 - 163,0

    8149,3 - 156,1

    10142,4 - 149,2

    7135,5 - 142,3

    2128,6 - 135,4

    (en librasHihiFiXifi

    PESO

    Resumamos algunos conceptos

    Una distribucin de frecuencias (fi) es un conjunto de

    puntuaciones ordenadas en sus respectivas clases.

    Las frecuencias relativas (hi) son tasas porcentuales de

    casos en cada clase.

    La frecuencia acumulada (Fi o Hi) son las frecuencias que se

    van acumulando en cada clase, desde la ms baja hasta la mas alta.

    La marca de clase (Xi) es el punto medio de una clase

    B) Tablas cruzadas Sirven para representar dos o ms variables cualitativas. En cada celda se puede incluir la frecuencia absoluta y relativa (por fila, columna y total).

  • Manual de Estadstica General

    58

    Ejemplo

    Cuadro 4: Enfermedad por sexo Enferm ed ad \Sexo M asculino Femenino Total

    Bronquitis 5 12 17

    Colitis 11 8 19

    Nefritis 15 6 21

    Alergias 4 2 6

    Total 35 25 63

    Fuente: Historia Clnica, julio 2002.

  • 4

    CAPTULO 4

    ORGANIZACIN GRFICA DE

    DATOS

    OBJETIVOS

    Al finalizar el Captulo 4, el participante ser capaz de:

    1. Elaborar grficos para una sola variable: barras, columnas, circulo.

    2. Elaborar grficos para dos variables: dispersin, lineal.

    3. Elaborar grficos en tres dimensiones.

  • Manual de Estadstica General

    60

    Los grficos constituyen una forma muy efectiva de presentar informacin. Su utilizacin ayuda a una mejor comprensin. Todo grfico tiene tres partes: El ttulo: especfico, pero completo. El cuerpo: es el grfico en si mismo. La fuente: especificar el origen de la informacin. 4.1 EL HISTOGRAMA

    Son barras verticales presentadas una a continuacin de otra. Permite presentar datos cuantitativos continuos. Es un grfico muy utilizado. Propiedades: 1. El ancho de cada columna es igual en todo el grfico y

    representa la amplitud de clase). 2. El ancho de cada columna es igual en todo el grfico y

    representa la amplitud de clase).

    0

    2

    4

    6

    8

    10

    12

    132.0 138.9 145.8 152.7 159.6

    Marca de Clase

    Fre

    cuen

    cia

    Distribucin de frecuencias

    Histograma

    30TOTAL

    3159,6156,2 - 163,0

    8152,7149,3 - 156,1

    10145,8142,4 - 149,2

    7138,9135,5 - 142,3

    2132,0128,6 - 135,4

    fiXiCLASE

    30TOTAL

    3159,6156,2 - 163,0

    8152,7149,3 - 156,1

    10145,8142,4 - 149,2

    7138,9135,5 - 142,3

    2132,0128,6 - 135,4

    fiXiCLASE

  • Jorge Crdova Egocheaga

    61

    Ejemplo

    Grfico 4: Peso de 100 Pacientes (en Kg.)

    Nmero de Pacientes

    0

    5

    10

    15

    20

    25

    29.5 39.5 49.5 59.5 69.5 7 9.5 89.5 9 9.5 Peso(Kgs)

    Fuente: Encuesta, julio 2001

    Cmo leer histogramas? A) Tipo general: El valor medio est al centro, que tiene la

    mayor frecuencia. Es el ms frecuente tiene forma simtrica

  • Manual de Estadstica General

    62

    B) Tipo multimodal: Hay varios valores mayores.

    C) Tipo sesgo positivo: Forma asimtrica la media est localizada a la izquierda.

  • Jorge Crdova Egocheaga

    63

    D) Tipo precipicio a la izquierda: Forma asimtrica la frecuencia disminuye bruscamente a la izquierda.

    E) Tipo planicie: Las clases tienen ms o menos la

    misma frecuencia.

  • Manual de Estadstica General

    64

    F) Tipo bimodal: Se observa claramente dos valores mximos.

    G) Tipo pico aislado: Presenta un pico aislado, adems de un histograma general.

  • Jorge Crdova Egocheaga

    65

    4.2 EL DIAGRAMA DE BARRAS Se utiliza para representar datos cuantitativos discretos o datos cualitativos.

    Las barras son de igual ancho. La longitud es proporcional a la frecuencia de la

    categora. El espacio entre barras debe ser homogneo, para

    evitar efecto visual.

    Ejemplo:

    Grfico 2: Nmero de hijos en edad escolar por mdico del Hospital Central

    0

    5

    10

    15

    20

    25

    30

    0 1 2 3 4 5

    N de Mdicos

    Nmero dehijos

    (escolares)Fuente: Departamento de Personal

  • Manual de Estadstica General

    66

    Ejemplo

    Grfico 3: Pacientes atendidos por especialidad

    Fuente: Hoja de Ingreso, julio del 2002

    0

    5

    10

    15

    20

    Nefrologa Ginecologa Oftalmologa Neurologa Traumatologa

    Ejemplo

    Grfico 4: Profesionales de la salud por especialidad

    Especialidad

    0 10 20 30 40 50 60 70 80 90 100

    Obstetriz

    Fisioterapeuta

    Psiquiatras

    Enfermeras

    Medico

    N de profesionales

    Fuente: Gerencia de Potencial Humano. Julio 2002

  • Jorge Crdova Egocheaga

    67

    4.3 EL POLGONO DE FRECUENCIAS Es otra forma de conocer las distribucin de los datos. Se construye uniendo los punto medios del lado superior de las barras del histograma.

    0

    5

    10

    15

    20

    25

    29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.50

    5

    10

    15

    20

    25

    29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5

    Grfico N 5: Distribucin de los pesos de los Pacientes del Servicio de cardiologa

    Nmero de Pacientes

    Peso(Kg.)

    Fuente: Historia Clnica, julio del 2002

  • Manual de Estadstica General

    68

    4.4 DIAGRAMA DE DISPERSIN DE PUNTOS Ejemplo

    350Julio

    200Junio

    280Mayo

    320Abril

    180Marzo

    210Febrero

    120Enero

    PacientesMeses

    350Julio

    200Junio

    280Mayo

    320Abril

    180Marzo

    210Febrero

    120Enero

    PacientesMeses

    Fuente: Departamento de Admisin Clnica

    Grfico 6: Pacientes mensuales

    0

    50

    100

    150

    200

    250

    300

    350

    400

    0 2 4 6 8 Enero Feb rero Ma rzo Abril Mayo Jun io Ju lio

    4.5 DIAGRAMA LINEAL

    Ejemplo

    Grfico 7: Pacientes mensuales

    Fuente: Departamento de Admisin Clnica

    0

    50

    100

    150

    200

    250

    300

    350

    400

    Enero Febrero Marzo Abril Mayo Junio Julio

  • Jorge Crdova Egocheaga

    69

    4.6 LAS OJIVAS La frecuencia acumulada son las frecuencias que se van acumulando en cada categora, desde la ms baja hasta la mas alta. Las ojivas, relaciona las puntuaciones con sus respectivas frecuencias acumuladas.

    4.7 EL DIAGRAMA CIRCULAR

    El circulo se divide en segmentos circulares, de tamao proporcional a la frecuencia de la categora. Ejemplo

    Grfico 10. Pacientes atendidos en consultorios

    externos

    1 e r t r i m .

    2 d o t r i m .

    3 e r t r i m .

    4 t o t r i m .

    Fuente: Ficha de atencin. Julio del 2002

    4.8 DIAGRAMA RADAR

    til para visualizar, por ejemplo, el cumplimiento de metas (%) para la Prueba de Papanicolaou en el servicio de ginecologa para pacientes de diferentes zonas

  • Manual de Estadstica General

    70

    Ejemplo

    0

    20

    40

    60

    80

    100

    E ste

    O e ste

    N or te

    S ur

    Fuente: Hoja de registro atencin, julio 2002 4.9 SUPERFICIE EN TRES DIMENSIONES

    Ejemplo:

    Metas alcanzadas en prestacin de servicios mdicos

    3er trim.

    4to trim.0

    50

    100

    3er trim.

    4to trim.Fuente: Encuesta, julio 2002

  • 5

    CAPTULO 5

    PROMEDIOS

    Un motivo para hacer sospechar que la Estadstica es ms un arte que una ciencia, gira en torno a la ambigedad con que se

    usa el trmino promedio.

    OBJETIVOS

    Al finalizar el Captulo 5, el participante ser capaz de:

    1. Diferenciar los diversos tipos de medidas de resumen que se pueden aplicar a un conjunto de datos

    2. Calcular e interpretar las principales medidas de tendencia central

  • Manual de Estadstica General

    72

    5.1 LA ESTADSTICA DE RESUMEN Despus de construir tablas y grficos, a partir de una coleccin de datos, se requieren medidas ms exactas. La estadstica de resumen, proporciona medidas para describir un conjunto de datos. Existen tres tipos de medidas de resumen: De tendencia central. De dispersin. De la forma de la distribucin.

    (A) Las medidas de tendencia central

    Se refieren al punto medio de una distribucin Se conocen como medidas de posicin Ejemplo: A partir del grfico siguiente, se observa que la posicin central de la curva B est a la derecha de la posicin central de las curvas A y C. Obsrvese que la posicin central de la curva A es la misma que la curva C.

  • Jorge Crdova Egocheaga

    73

    (B) Las medidas de dispersin Se refieren a la extensin o amplitud de los datos de una distribucin Representan el grado de variabilidad de los datos. Ejemplo: Observe que la curva A en el siguiente grfico tiene una mayor dispersin que la curva B, a pesar que la posicin central es la misma.

    (C) Las medidas de la forma de la curva Las curvas que representan a un conjunto de datos, pueden ser analizadas de acuerdo a su:

    a) Simetra b) Curtsis

    Las curvas simtricas, tienen una forma tal que con una lnea vertical que pase por el punto ms alto de la curva, dividir el rea de esta en dos partes iguales.

  • Manual de Estadstica General

    74

    Las curvas sesgadas son aquellas cuyos valores estn concentrados en el extremo inferior o superior de la escala de medicin del eje horizontal. La cola indica el tipo de sesgo.

    Cuando medimos la curtsis nos referimos al grado de agudeza. Pueden ser: leptocrtica (concentracin al centro) mesocrtica distribuidos simtricamente) o platicrtica (aplanada).

    5.2 PROPIEDADES DE LA SUMATORIA

    1ra Regla: La suma de los n trminos de una serie constante, es igual a n veces la constante.

    =

    =n

    ii ncc

    1

  • Jorge Crdova Egocheaga

    75

    Ejemplo:

    C = 10, n=3

    = 10 + 10 + 10 = 3 (10) = 30=3

    1i

    c

    2da Regla: La suma de los productos de una constante por una variable, es igual a la constante multiplicada por la suma de la variable.

    ==

    =n

    i

    n

    ii ccx

    1i

    1

    x

    Ejemplo:C = 5, X1 = 2, X2 = 4, X3 = 6

    5(2) + 5(4) + 5(6) = 60 ==3

    1iicx

    3ra Regla: La suma de los valores de una variable ms una constante es igual a la suma de los valores de la variable ms n veces esa constante.

    = =

    ++ =ni

    n

    i iincc

    1 1

    x)x(

    Ejemplo:C =2, x1 =5, x2 =3, x3 =2

    (5 + 2) + (3 + 2) + (2 + 2) = 16

    = (5 + 3 + 2) + 3(2) = 16

    =

    =+31

    )x(i

    i

    c

  • Manual de Estadstica General

    76

    5.3 LAS MEDIDAS DE TENDENCIA CENTRAL 1. En general se denominan promedios. 2. Los ms importantes son la media, la mediana y la moda.

    Aritmtica Media Geomtrica Medidas de Mediana Armnica tendencia central Moda

    3. Tambin es til conocer los percentiles (o fractiles). POR QU SON IMPORTANTES LAS MEDIDAS DE TENDENCIA CENTRAL? Porque la mayor parte de los conjuntos de datos muestran una tendencia a agruparse alrededor de un dato central. Las medidas de tendencia central son puntos en una distribucin, los valores medios o centrales de sta y nos ayudan a ubicarla dentro de la escala de medicin. 5.3.1 La Media

    (A) La media aritmtica ( x ) a) Obtencin: Se obtiene sumando los valores

    registrados y dividindolos entre el nmero de datos.

    Ejemplo: La siguiente tabla muestra el nmero de reclamos y quejas presentadas por pacientes en el Servicio de Emergencias a lo largo de una semana. Calcule e interprete la media.

    Da/Semana Lun Mar Mier Jue Vier Sab

    Reclamos/da 8 10 5 12 10 15

  • Jorge Crdova Egocheaga

    77

    Media aritmtica

    6

    60

    6

    1510125108 =+++++

    = 10 reclamos b) Interpretacin: Si elige al azar un da de la

    semana, se espera que los pacientes del servicio de emergencia realicen 10 reclamos en ese da.

    c) Simbologa:

    Tamao Media aritmtica Muestra n (equis barra) Poblacin N (mu)

    d) Clculos a partir de datos no agrupados, se utilizan las siguientes formulas. Para una muestra

    donde: x : media muestral

    iX nn

    iix

    = =1X : suma de todos los datos

    n : nmero de datos (muestra)

    Para una poblacin

    donde: : media poblacional: suma de todos los datos

    : nmero de datos (poblacin)

    iXN

    N

    ii= =1X N

    Se puede calcular la media aritmtica utilizando Excel.

  • Manual de Estadstica General

    78

    Media aritmetica

    e) Clculo a partir de datos agrupados. El clculo de la media aritmtica, cuando los datos disponibles se encuentran en tablas de distribucin de frecuencias, se realiza utilizando la formula siguiente

    =

    == nf

    nf

    i

    i

    i

    ii

    x

    1

    1X

    donde: :media muestral :frecuencia absoluta de la clase i :marca de la clase i

    Ejemplo: La distribucin de frecuencias siguiente, representa los puntajes obtenidos en una evaluacin del desempeo, aplicado al personal tcnico de un Centro de Salud. El puntaje mximo en la prueba es 50. Calcule e interprete en media.

    x

    if

    iX

    x

    if

    iX

  • Jorge Crdova Egocheaga

    79

    D es e m p e o N m e ro d e

    (p unto s ) t cn ic o s

    1 2 - 1 6 4

    1 7 - 2 1 8

    2 2 - 2 6 1 5

    2 7 - 3 1 2 3

    3 2 - 3 6 1 0

    T O T AL 6 0

    Primero se calcularn las marcas de clase ( );

    es decir, el valor intermedio de cada claseMarca de Frecuencia

    clase ( ) absoluta(fi)12 - 16 14 417 - 21 19 822 - 26 24 1527 - 31 29 2332 - 36 34 10

    Total 60

    14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10)

    4 + 8 + 15 + 23 + 10

    iX

    ix

    =x =x=x

    clase

    157560

    26.25

    Interpretacin: Si se elige al azar a un trabajador tcnico de este hospital, se espera que tenga un puntaje de 26,25 en su evaluacin de desempeo.

  • Manual de Estadstica General

    80

    f) La media aritmtica ponderada ( )

    donde:

    = factor de ponderacin

    = datos

    =

    == ni

    i

    n

    iii

    w

    w

    px

    1

    1

    X

    px

    iw

    iX

    Ejemplo: Una empresa comercializadora de Seguros Mdicos dispone de 3 representantes para la zona de Miraflores, cada uno de los cuales cobra diferente comisin por pliza vendida, y realiza diferente nmero de contratos. Calcule e interprete el valor medio de la comisin

    N de polizas de Comisin

    Vendedor Seguro Mdico por venta $

    Pedro 30 30

    Juan 25 40

    Pablo 20 50

    67.38$75

    2900

    202530

    )50(20)40(25)30(30 ==++++=px

    Interpretacin: Si se elige al azar un representante se espera que cobre una comisin de $38.67 por pliza vendida.

  • Jorge Crdova Egocheaga

    81

    g) Ventajas y desventajas de la media aritmtica

    Ventajas:

    Concepto familiar para muchas personas

    Es nica para cada conjunto de datos

    Es posible comparar medias de diferentes muestras

    Desventajas

    Se ve afectada por los datos extremos

    Si la muestra es grande y los datos no estn agrupados, su clculo es tedioso

    Si los datos estn agrupados en clases con extremos abiertos, no es posible calcular la media.

    (B) La media geomtrica ( gx ) Se utiliza para calcular tasas medias de variacin, como la tasa media de crecimiento poblacional, la tasa media de inflacin mensual, la tasa media de mortalidad, entre otros.

    a) Obtencin Se obtiene extrayendo la raz

    ensima el producto de los n valores de una serie.

    ng nx XXXX .........

    321=

    Ejemplo: La siguiente tabla muestra la tasa de aumento en las quejas durante los ltimos meses. Calcule e interprete la tasa media mensual.

  • Manual de Estadstica General

    82

    Meses Enero Febrero Marzo Abril Mayo

    Aumento de

    quejas2.6% 5.4% 3.8% 0.5% 1.4%

    La tasa 2,6% tambin se puede expresar como 0,026 , y puesto que se refiere a un aumento a partir de una base de 100%, el factor de variacin ser 1,026. Para los otros datos se opera igual.

    b) Clculos

    Por lo tanto, la media geomtrica se calcula:

    5 )014.1)(005.1( )038.1( )054.1( )026.1(=

    )( 0272540,1 medioocrecimientdeFactor=5 143903377.1=

    n xxxxx g ,......,, 321=

    gx

    gx

    gx

    100)1 ( Tasa mediade variacin

    = gx

    = (1,0272540 - 1) x 100 = 2,72%

    c) Interpretacin

    Si se selecciona al azar un mes entre enero y mayo, se espera que las ventas se hayan incrementado 2.72% con respecto al mes anterior.

    (C) La media armnica ( hx ) Se utiliza para calcular el tiempo medio, velocidad y aceleracin media, como por ejemplo, el tiempo medio para realizar determinada ciruga.

  • Jorge Crdova Egocheaga

    83

    a) Obtencin: se obtiene calculando el inverso de la media aritmtica de los inversos de una serie.

    n

    n

    i i

    hx

    =

    = 1 X1

    1

    Ejemplo: Los siguientes datos registran el tiempo que utilizan cuatro mdicos al realizar una cierta intervencin quirrgica. Calcule e interprete el tiempo medio.

    M d ico A B C D

    Tie m p o

    (m in u tos )4 5 3 8 5 2 40

    Conocer el tiempo medio permite contar con una herramienta til en la planeacin de los recursos, como la Sala de Operaciones. Adems de poder comparar nuestro desempeo con los estndares de calidad internacionales.

    88920

    22231710234019764

    40

    1

    52

    1

    38

    1

    45

    14

    +++=+++=hx

    minutos 117953.438249

    889204 == hx

    segundos 7 minutos 43=hx

  • Manual de Estadstica General

    84

    mediana

    b) Interpretacin: Si se selecciona al azar a uno de los cuatro mdicos, se espera que realice este tipo de ciruga en 43 minutos aproximadamente.

    5.3.2 La Mediana

    Es la medida que divide en dos subconjuntos iguales a datos, de tal manera que 50% de los datos es menor a la mediana y el otro 50% es mayor a la mediana.

    a) Obtencin: Se obtiene ordenando la serie de

    datos (en forma ascendente o descendente) y ubicando el dato central.

    Ejemplo: Los siguientes datos se refieren al nmero de pacientes que llegaron a su cita, despus de la hora programada durante los ltimos 11 das en el Servicio de Pediatra. Calcule e interprete la mediana. 12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

    Primero se ordenan lo datos: 5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17

    5 datos menores 5 datos mayores

    b) Interpretacin: Durante 5 das llegaron menos de 11 pacientes tarde a su cita y durante 5 das, ms de 11 pacientes llegaron tarde a su cita.

  • Jorge Crdova Egocheaga

    85

    5.202

    2318 =+=mediana

    Md

    iL

    n

    F

    Mdf

    c

    c) Reglas

    1 Si la serie es impar, la mediana ocupa el lugar central de la serie previamente ordenada.

    Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24 2 Si la serie es par, la mediana se obtiene de la semisuma de los dos valores centrales de la serie previamente ordenada. Ejemplo: 8, 10, 14, 18, 23, 24, 32, 34

    3 Sea la serie par o impar, la mediana ocupa el

    lugar

    +2

    1n ,de la serie previamente ordenada.

    d) Clculo a partir de datos agrupados.

    ( )c

    Mdf

    Fn

    Md i

    +++=

    12

    1

    L

    donde: : mediana : limite real (o frontera) inferior de la clase mediana. : nmero total de datos. : suma de todas las frecuencias hasta, pero sin incluir, la clase mediana. : frecuencia de la clase mediana : amplitud de clase

  • Manual de Estadstica General

    86

    Ejemplo: La tabla siguiente muestra la experiencia laboral (aos) del personal de seguridad que labora en un gran hospital. Calcule e interprete la mediana.

    E xp e r ie nc ia N m e ro d e

    la b o ra l tra b a ja d o re s

    (a o s ) d e s e g ur id a d

    0 - 3 4

    4 - 7 1 2

    C la s e

    M e d ia na

    8 - 1 1 2 4

    1 2 - 1 5 1 6

    1 6 - 1 9 1 0

    2 0 - 2 3 3

    6 9

    Lugar de la mediana:

    424

    )16(2

    169

    5,7

    ++=dM

    424

    16355,7

    +=

    Mediana = 10,5 aos

    o352

    169

    2

    1 =+=+n

    Interpretacin: La mitad del personal de seguridad que labora en este hospital tienen una experiencia laboral igual o menor a 10 aos 6 meses. La otra mitad de este personal tiene una experiencia laboral igual o mayor a 10 aos y 6 meses.

    e) Ventajas y desventajas

    Ventajas: Los valores extremos no afectan a la mediana como en el caso de la media aritmtica. Es fcil de calcular, interpretar y entender. Se puede determinar para datos cualitativos, registrados bajo una escala ordinal. Desventajas: Como valor central, se debe ordenar primero la serie de datos.

  • Jorge Crdova Egocheaga

    87

    oM

    iL

    1

    2

    c

    Para una serie amplia de datos no agrupados, el proceso de ordenamiento de los datos demanda tiempo y usualmente provoca equivocaciones.

    5.3.3 La Moda

    La moda es el valor que ms se repite dentro de un conjunto de datos. a) Obtencin: se obtiene organizando la serie de datos

    y seleccionando el o los datos que ms se repiten. Ejemplo

    4, 5, 7, 8, 8 , 10, 12, 15

    4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

    7, 12, 15, 18, 25, 30, 31, 38

    b) Clculo a partir de datos agrupados

    ci

    +

    +=21

    1LoM

    donde: : moda : limite real (o frontera) inferior de la clase modal (la de mayor frecuencia) : frecuencia de la clase modal menos la frecuencia de la clase anterior : frecuencia de la clase modal menos la frecuencia de la clase siguiente : amplitud de clase

    Las clases mediana y modal pueden coincidir pero conceptualmente son diferentes.

  • Manual de Estadstica General

    88

    Ejemplo: La tabla siguiente muestra los errores de facturacin durante un mes, en una Clnica. Calcule e interprete la moda.

    Errores de

    f ac turac in Das

    0 - 3 6

    4 - 7 12Clas e

    Moda l

    8 - 11 8

    12 - 15 3

    16 - 19 1

    Tota l 30

    Clase moda : (4 - 7)

    Mo = 5,9

    61

    =

    42

    = 4 46

    65.3 Mo

    ++=

    Interpretacin: Durante un mes, el nmero ms frecuente de errores de facturacin en esta clnica es 6.

    e) Ventajas y desventajas de la moda.

    Ventajas: Se puede utilizar tanto para datos cualitativos como cuantitativos. No se ve afectada por los valores extremos. Se puede calcular, a pesar de que existan una o ms clases abiertas. Desventajas: No tiene un uso tan frecuente como la media. Muchas veces no existe moda (distribucin amodal). En otros casos la distribucin tiene varias modas, lo que dificulta su interpretacin.

    5.3.4 Los Percentiles

    Son los valores que dividen en 100 partes iguales a un conjunto de datos

  • Jorge Crdova Egocheaga

    89

    KP

    c

    K

    n

    iF

    K

    fP

    a) Clculo: para datos agrupados. ( )c

    f

    n

    iK

    + +=

    KP

    1i

    F100

    K

    LP

    donde: : percentil : el percentil buscado : nmero de datos : frecuencia acumulativa hasta la clase anterior a la clase donde se ubica el percentil K : frecuencia absoluta de la clase donde se ubica el percentil K : amplitud de clase

    Ejemplo: La tabla muestra la experiencia (en aos) de las enfermeras de un gran centro hospitalario Experiencia Trabajadores

    (aos)

    0 - 3 18

    4 - 7 42

    8 - 11 68

    12 - 15 120

    16 - 19 40

    20 - 23 34

    24 - 27 12

    Total 334

    Sobre qu edad se ubica el 25% de las enfermeras de mayor experiencia?

  • Manual de Estadstica General

    90

    Menor

    Experiencia

    Mayor

    Experiencia

    75 % 25 %

    P75

    K = 75

    )ordenados nmeros los de( 5,250100

    )334(75

    100

    KnP delLugar o75 ===

    Para saber en cul clase se halla este dato, se calcul la frecuencia acumulativa.

    Experiencia N Trabajadores Frec. Acumulada

    (aos)

    0 - 3 18 18

    4 - 7 42 60

    8 - 11 68 128

    12 - 15 120 248

    16 - 19 40 288

    20 - 23 34 322

    24 - 27 12 334

    334

    ( )4

    40

    1248100

    75(334)

    5.1575

    P

    ++= aos 65.1575P =

    iFif

    En esta clasese localizan del249 - 288

    F=248

    Interpretacin: Para que una enfermera est comprendida dentro del 25% de mayor experiencia laboral debe tener al menos 15 aos, 7 meses y 24 das.

  • 6

    CAPTULO 6

    MEDIDAS DE DISPERSIN Y

    ASIMETRA

    OBJETIVOS

    Al finalizar el Captulo 6, el participante ser capaz de: Calcular e interpretar las principales medidas de

    dispersin: A) Rango B) Rango intercuartlico C) Varianza D) Desviacin estndar E) Coeficiente de variabilidad Calcular e interpretar las principales medidas de la

    forma de la distribucin. A) Coeficiente de asimetra B) Coeficiente de curtosis

  • Manual de Estadstica General

    92

    6.1 LAS MEDIDAS DE DISPERSIN Llamadas tambin medidas de variabilidad Son tiles porque: Permiten juzgar la confiabilidad de la medida de tendencia central. Los datos demasiados dispersos tienen un comportamiento especial. Es posible comparar dispersin de diversas muestras.

    6.1.1 El rango (R)

    Llamado tambin recorrido, amplitud total o alcance. a) Obtencin: se obtiene de la influencia entre el dato

    mayor y el dato menor ms una unidad significativa, a fin de incluir ambos valores extremos.

    Ejemplo:

    Los siguientes datos representan el peso de 10 nios al nacer, (en Kg.). Calcule e interprete el rango.

    2,860 3,150 3,450 2,950 3,780 4,170 3,920 3,280 4,050 3,120

    Rango = (4,170 - 2,860) + 0.001 Rango = 1,311 Kg.

    b) Interpretacin

    La diferencia entre el bebe de mayor peso y el bebe menor peso es 1,311 Kg.

  • Jorge Crdova Egocheaga

    93

    c) Clculo A partir de datos agrupados, se utiliza la siguiente frmula:

    R= (Ls - Li ) + 1 donde: Ls : Limite superior de la

    ltima clase Li : Limite inferior de la primera clase

    Ejemplo: La distribucin de frecuencias siguiente representa el tiempo que espera un paciente para ser atendido, en un consultorio externo. Calcule e interprete el rango

    Tiempo N de Pacientes

    (minutos) (por da)

    12 - 16 4

    17 - 21 8

    22 - 26 15

    27 - 31 23

    32 - 36 10

    Total 60

    Rango = (36-12) + 1

    R = 25 minutos

    Interpretacin: la diferencia de tiempo entre el paciente que ms espera y el que menos espera para ser atendido es 25 minutos.

  • Manual de Estadstica General

    94

    f) Ventajas y desventajas del rango

    Ventajas Fcil de calcular Fcil de entender e interpretar Desventajas Slo considera los valores extremos No toma en cuenta ni el nmero de datos ni el valor de estos No es posible calcular en tablas con extremos abiertos.

    6.1.2 El rango intercuartlico

    Permite ubicar el 50% de los datos que se encuentran en el centro de la distribucin, es decir, el 25% de los datos son menores al primer cuartil y tambin 25% de los datos son mayores al tercer cuartil.

  • Jorge Crdova Egocheaga

    95

    Ejemplo: La tabla muestra la experiencia (en aos) del personal que labora en el Hospital Central.

    E xp e rie nc ia

    (ao s )T rab ajado res

    0 - 3 1 8

    4 - 7 4 2

    8 - 1 1 6 8

    12 - 15 1 20

    16 - 19 4 0

    2 0 - 2 3 3 4

    2 4 - 2 7 1 2

    T o tal 3 34

    A) Entre qu valores se encuentra el 50% intermedio

    de estos datos? B) Cul es el rango intercuartlico?

    RangoIntercuartlico

    50 % 25 %

    Q3

    clase 3ra laen ubica se 5.83100

    )334(25PQLugar 251

    o==

    25 %

    Q1

    ( )4

    68

    160100

    25(334)

    5.7Q1

    ++= aos 82.8Q

    1=

  • Manual de Estadstica General

    96

    clase 5ta laen ubica se 5.250100

    )334(75PQLugar 753

    o==

    ( )4

    40

    1248100

    75(334)

    5.153

    Q

    ++=

    A. El 50% de los trabajadores con experiencia

    intermedia se encuentran entre 8,82 y 15,65 aos.

    B. El rango intercuartlico es 6 aos 10 meses aproximadamente

    6.1.3 La desviacin cuartlica

    Es una medida de variabilidad fcil de calcular. Es la mitad del rango intercuartil. Mide la dispersin del 50% central de las observaciones respecto a la mediana. Es imposible tener una DC negativa. Es raro, pero podra tener un valor igual a 0, en el caso que los percentiles sean iguales (P75 = P25). Cuando mayor sea la diferencia entre los percentiles, mayor ser el valor de la DC.

    2PP

    DC 2575=

    Ejemplo:

    Si P25 = 7,2 1,32

    2,74,13DC ==

    P75 = 13,4 Interpretacin: 50% central de las