introduccion a estadistica inferencial

Upload: kanfer

Post on 14-Apr-2018

242 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/27/2019 Introduccion a Estadistica Inferencial

    1/45

    INTRODUCCION A LAS PROBABILIDADES

    ORIGEN DE LAS PROBABILIDADES

    Se remonta al siglo XVIII cuando Antoine Gombauld conocido como el caballero de Merquien crey haber descubierto una tcnica infalible para jugar a los dados, con muy

    buenos resultados al comienzo, luego empez a perder, situacin que le oblig aconsultar a Blas Pascal y Pierre de Fernat, inicindose as los fundamentos de estaciencia.

    PROBABILIDAD

    La probabilidad es una medida numrica de la certidumbre de que suceder determinadoevento.

    Los valores de probabilidad siempre se asignan en una escala de valores entre 0 y 1.

    Una probabilidad cercana a cero indica que es difcil que el evento ocurra, unaprobabilidad cercana a uno indica que es casi seguro que suceder. Las probabilidadesentre 0 y 1 indican los grados de certeza de que el evento ocurra.

    Probabilidad creciente de ocurrencia.

    0 0.5 1

    La ocurrencia del evento

    Es igualmente probable o

    Improbable

    EXPERIMENTO

    Cualquier proceso que genere resultados bien definidos.

    Proceso que conduce a que ocurra una y solamente una de varias observaciones posibles

    EXPERIMENTO RESULTADO EXPERIMENTAL

    Lanzar una moneda cara - sello

    Seleccionar una pieza para inspeccin defectuosa no defectuosa

    Visita de ventas venta no venta

    Tirar un dado 1 2 3 4 5 6

  • 7/27/2019 Introduccion a Estadistica Inferencial

    2/45

    Nota: El concepto de experimento estadstico es diferente al usado en las ciencias delaboratorio, en las que el investigador supone que cada vez que un experimento se repiteexactamente de la misma manera ocurrir el mismo resultado.

    En probabilidad el resultado queda determinado por la casualidad, y aunque elexperimento se repita de la misma manera puede ocurrir un resultado distinto.

    ESPACIO MUESTRAL

    Es el conjunto de todos los resultados posibles de un experimento

    PUNTO MUESTRAL

    Cualquier resultado en particular de un experimento. Los elementos del espacio muestralse llaman puntos muestrales.

    S= cara, sello

    S= defectuoso, no defectuoso

    S= 1, 2, 3, 4, 5,6

    ASIGNACION DE PROBABILIDADES A RESULTADOS EXPERIMENTALES

    REQUISITOS BASICOS DE PROBABILIDADES.

    1) P(Ei) es la probabilidad del resultado experimental

    0 P(Ei) 1 para todas i

    2) La sumatoria de todas las probabilidades de los resultados experimentales debe ser igual a

    1

    P(E1) + P(E2) + + P(En) = 1

    Es aceptable para asignar valores probabilsticos para resultados experimentales quesatisfaga ambos requerimientos y resulte en medidas numricas razonables de laposibilidad de los resultados.

    La asignacin de probabilidades se puede realizar con base en los siguientes mtodos:

  • 7/27/2019 Introduccion a Estadistica Inferencial

    3/45

    METODO CLASICO

    Si un experimento tiene n resultados posibles, el mtodo clsico asignar una

    probabilidad de a cada resultado experimental (en el caso del lanzamiento de una

    moneda ser entonces correspondiente la probabilidad de obtener el resultado cara o

    sello en un intento)

    METODO DE FRECUENCIA RELATIVA

    Su clculo tiene normalmente un antecedente histrico basado en el nmero derepeticiones de un suceso similar. (por ejemplo un vendedor que ha visitado 40 clientes yen esas visitas realiz ventas en 10 de ellas; con base en este mtodo la probabilidad

    para su siguiente visita de ventas ser para una venta y

    para una no venta).

    METODO SUBJETIVO

    Es una asignacin de probabilidad realizada por una persona basndose en cualquierinformacin que est disponible, o en su criterio. En este mtodo predomina laexperiencia subjetiva de la persona que toma la decisin.

    EVENTO

    Conjunto de uno o ms resultados de un experimento.

    Ejemplo: El evento de obtener un nmero par al lanzar un dado:

    A = *+PROBABILIDAD DE UN EVENTO

    La probabilidad de un evento es igual a la suma de las probabilidades de los puntosmuestrales del evento.

    Para el ejemplo anterior la probabilidad de obtener un nmero par al lanzar un dado esigual a la probabilidad de obtener un 2 ms la probabilidad de obtener un 4 ms laprobabilidad de obtener un 6.

    A={ }

    ALGUNAS RELACIONES BASICAS DE PROBABILIDAD

    Espacio muestral

    ACA

  • 7/27/2019 Introduccion a Estadistica Inferencial

    4/45

    COMPLEMENTO DE UN EVENTO

    Para un evento A, el complemento de A es aquel evento que contiene todos los puntosmuestrales no existentes en A.

    P(A) + P(AC) = 1

    EVENTOS MUTUAMENTE EXCLUYENTES

    Se dice que dos o ms eventos son mutuamente excluyentes cuando la ocurrencia de unevento implica que ninguno de los otros puede ocurrir al mismo tiempo.

    LEY ADITIVA

    Para dos eventos A y B la unin de los eventos A y B es aquel evento que contienetodos los puntos muestrales contenidos en A y B.

    P(AUB) = P(A) + P(B).

    INTERSECCION DE EVENTOS

    Para dos eventos A Y B la interseccin de los eventos A y B es aquel evento que tienetodos los puntos muestrales existentes tanto en A como en B.

    A B

    A B

  • 7/27/2019 Introduccion a Estadistica Inferencial

    5/45

    LEY ADITIVA PARA INTERSECCION

    P(AUB) = P(A) + P(B) P(AnB)

    EJEMPLO 1:

    A=*+ B=*+P(AUB) = P(1,2,3) + P(3,4,5) P(3) = P(1,2,3,4,5)

    EJEMPLO 2:

    De 200 estudiantes de estadstica, 160 pasaron el examen parcial y 140 pasaron elexamen final; y 124 estudiantes pasaron ambos.

    Consideremos: A = evento de pasar el examen parcial

    B = evento de pasar el examen final

    P(A) = = 0,8 P(B) =

    0,7 P(AnB) = = 0,62

    Despus de revisar las notas, el profesor decidi aprobar a cualquier estudiante que

    hubiera pasado por lo menos alguno de los dos exmenes. Cul es la probabilidad deque un estudiante reciba nota de aprobado en el curso?

    P(AUB) = 0,8 + 0,7 0,62 = 0,88

    REGLA DE LA MULTIPLICACION

    La regla especial de la multiplicacin requiere que dos eventos A y B seanindependientes; dos eventos son independientes si la ocurrencia de uno no altera laprobabilidad de que suceda el otro.

    Si dos eventos A y B son independientes la probabilidad de que ocurran A y B se obtienemultiplicando las dos probabilidades.

    P(A y B) = P(A)* P(B)

  • 7/27/2019 Introduccion a Estadistica Inferencial

    6/45

    Si P1, P2, P3Pn son todas las distintas probabilidades de presentacin de n sucesosindependientes, la probabilidad (p) de que ocurran todos estos sucesos en un soloensayo, estar dada por el producto de cada suceso.

    P = P1*P2*P3.*Pn

    DIFERENCIA ENTRE SUCESOS MUTUAMENTE EXCLUYENTES Y SUCESOSINDEPENDIENTES

    a) En el primero se tiene un solo dado, una baraja; en el segundo son dos o masdados o barajas

    b) En el primero se extrae una sola carta o se obtiene una sola cara, es decir seespera la presentacin de un suceso, en el segundo espera la presentacin de doso ms sucesos.

    c) En el primero utilizamos la conjuncin o y en el segundo la conjuncin y.

    SUCESOS DEPENDIENTES

    Se dice que dos sucesos son dependientes si la ocurrencia o no ocurrencia de un eventoen cualquier prueba afecta la probabilidad de otros eventos en otras pruebas, es decir quela probabilidad del segundo suceso depende del primer suceso, la del tercero de lo quehaya sucedido en el primero y segundo y as sucesivamente.

    PROBABILIDAD CONDICIONAL

    Es la probabilidad de que ocurra un evento determinado dado que otro evento ya hayasucedido.

    Regla general de la multiplicacin: P(AyB) = P(A)*P(BA)

    Ejemplo:

    Suponga que hay 10 rollos de pelcula fotogrfica en una caja, y se sabe que tres estndefectuosos; se selecciona uno

    La probabilidad de escoger uno defectuoso es de

    y la probabilidad de escoger unobueno es de

    .

    Despus se elige un segundo rollo de la caja sin devolver el primero; la probabilidad deque sea defectuoso depende de si el primer rollo seleccionado no fue aceptable.

    La probabilidad de que tambin el segundo rollo tenga defectos es:

    Si el primer rollo seleccionado fue defectuoso

    Si el primer rollo seleccionado fue bueno

  • 7/27/2019 Introduccion a Estadistica Inferencial

    7/45

    A la fraccin ( o bien

    ) se le denomina probabilidad condicional, porque su valor

    est condicionado por ( o depende ) el primer rollo que se sac de la caja que haya sidodefectuoso o no.

    Cul es la probabilidad de escoger un rollo defectuoso, seguido de otro tambin

    defectuoso?

    P(A) =

    ; El segundo rollo seleccionado es el evento B; por tanto: P(BA) =

    porque despus de que el primer rollo seleccionado fue defectuoso solo quedaron 2 en lacaja que contena 9. La probabilidad de dos rollos defectuosos es:

    P(AyB) = P(A)*P(BA) = * =

    = 0,066.

    EJEMPLO:

    Una encuesta a ejecutivos se enfoc en su lealtad a la empresa; una de las preguntasplanteadas fue; si otra compaa le hiciera una oferta igual o ligeramente mejor que la desu puesto actual, permanecera con la empresa, o tomara el otro empleo? Las respuestasde los 200 ejecutivos se clasificaron en forma cruzada con su tiempo de servicio en lacompaa en la siguiente tabla de contingencias:

    TIEMPO DE SERVICIO

    LEALTAD Menos de 1

    ao

    1 a 5 aos 6 a 10 aos Ms de 10

    aos

    TOTAL

    si

    permanecera

    10 30 5 75 120

    No

    permanecera

    25 15 10 30 80

    35 45 15 105 200

    Cul es la probabilidad de seleccionar al azar un ejecutivo que sea leal a la empresa (sipermanecera) y que tenga ms de 10 aos de servicio?

    Evento A permanencia P(A) = = 0.6

    Evento B ejecutivo con ms de 10 aos en la empresa y que se queda

    P(BA) =

  • 7/27/2019 Introduccion a Estadistica Inferencial

    8/45

    La probabilidad de que un ejecutivo seleccionado al azar sea uno de los que se quedaranen la compaa y de los que tienen ms de 10 aos de servicio se determina utilizando laregla general de multiplicacin

    P(AyB) = P(A) * P(BA) =(

    )(

    ) =

    = 0.375

    ESPERANZA

    Si P es la probabilidad de xito de un suceso en un solo ensayo, el nmero esperado desucesos o la esperanza de ese suceso en n ensayos, estar dado por el producto de n yla probabilidad de xito

    E = np

    MEDIA o VALOR ESPERADO

    Es el promedio ponderado de los valores posibles de la variable aleatoria para el cual lafuncin de probabilidad proporciona las ponderaciones.

    E(x) = = x*P(x)

    VARIANZA

    La varianza representa el grado de dispersin o de variabilidad de los datos con respectoa la media.

    2= (x-)2*P(x)

    DESVIACION ESTANDAR

    La desviacin estndar se determina tomando la raz cuadrada de la varianza, es decir

    =

  • 7/27/2019 Introduccion a Estadistica Inferencial

    9/45

    DISTRIBUCIONES DE PROBABILIDAD

    Una distribucin de probabilidad indica toda la gama de valores que pueden presentarsecomo resultado de un experimento. Una distribucin de probabilidad es semejante a una

    distribucin de frecuencias relativas. Sin embargo en vez de describir el pasado, describeque tan probable es un evento futuro. Por ejemplo un fabricante de medicamentos afirmaque un tratamiento causar la prdida de peso en 80% de la poblacin. Una agencia deproteccin al consumidor puede probar este medicamento en una muestra de seispersonas. Si la declaracin del fabricante es verdadera es casi imposible tener unresultado en el que ninguna de las personas de la muestra pierda peso, y es muyprobable que 5 de las seis pierdan peso.

    La distribucin de probabilidad muestra todos los resultados posibles de un experimentoy la probabilidad de cada resultado

    Cmo se puede generar una distribucin de probabilidad?

    Ejemplo:

    Suponga que se quiere saber el nmero de caras que se obtienen al lanzar tres vecesuna moneda. Este es el experimento. Los posibles resultados son cero, uno, dos y trescaras Cul es la distribucin de probabilidad del nmero de caras?

    Hay ocho posibles resultados. En el primer lanzamiento puede caer sello, otro sello en elsegundo y otro en el tercero. O puede caer sello, sello y cara en ese orden. Acontinuacin se indica todos los resultados posibles.

  • 7/27/2019 Introduccion a Estadistica Inferencial

    10/45

    Lanzamientos de moneda

    Resultado

    posiblePrimero Segundo Tercero

    Numero de

    caras

    1 SELLO SELLO SELLO 0

    2 SELLO SELLO CARA 1

    3 SELLO CARA SELLO 1

    4 SELLO CARA CARA 2

    5 CARA SELLO SELLO 1

    6 CARA SELLO CARA 2

    7 CARA CARA SELLO 2

    8 CARA CARA CARA 3

    Observe que el resultado cero caras se obtuvo solo una vez, una cara apareci tresveces, dos caras tres veces y el resultado tres caras solo una vez. Es decir cero carasocurri en una de ocho veces. De modo que la probabilidad de cero caras es un octavo(1/8); la de una cara es tres octavos (3/8), y as sucesivamente. La distribucin deprobabilidad se muestra en la siguiente tabla.

    0

    0.05

    0.1

    0.15

    0.2

    0.25

    0.3

    0.35

    0.4

    1 2 3 4

    probabilidad del resultado

    probabilidad del

    resultado

  • 7/27/2019 Introduccion a Estadistica Inferencial

    11/45

    En el grafico anterior el valor uno (1) corresponde a cero (0) nmero de caras, el valor dos(2) a un (1) nmero de caras y as de manera sucesiva el valor cuatro a tres caras.

    Conviene recordar algunas definiciones que vamos a trabajar de manera reiterada enestos temas:

    Distribucin de probabilidad: son todos los posibles valores que resultan de unexperimento aleatorio, junto con la probabilidad asociada a cada valor.

    Variable aleatoria: Corresponde a una caracterizacin cuantitativa de los resultados que

    constituyen un espacio muestral. Cada cantidad o valor es el resultado de un experimentoaleatorio y como tal puede tomar distintos valores.

    Variable aleatoria discreta: Se considera as cuando los valores que asume se puedencontar, y si estos pueden organizarse en una secuencia al igual que los nmeros enterospositivos. Solo puede asumir un nmero finito de valores.

    Variable aleatoria continua. Se da, cuando puede asumir cualquier valor dentro de unintervalo o en una unin de intervalos. Como ejemplo se podra considerar cualquierresultado de medicin del ancho, longitud de una cosa, as como el tiempo de realizacinde una tarea; en estos casos las variables admiten fracciones.

    DISTRIBUCION DE PROBABILIDAD BINOMIAL

    Es una distribucin de probabilidad discreta. Una caracterstica de dicha distribucin es

    que solo hay dos resultados posibles en cada ensayo de un experimento.Por ejemplo el enunciado de una pregunta del tipo verdadero/falso. Los resultados sonmutuamente excluyentes, lo cual significa, que la respuesta a una pregunta no puede serverdadera y falsa al mismo tiempo. Otros ejemplos son: un departamento de control decalidad clasifica un producto como aceptable o no aceptable, un trabajador es clasificadocomo empleado o desempleado y una llamada de venta hace que el cliente compre elproducto o no lo compre. Frecuentemente se clasifican los resultados posibles como

  • 7/27/2019 Introduccion a Estadistica Inferencial

    12/45

    xito o fracaso. Sin embargo esta clasificacin no implica que un resultado sea buena yel otro malo.

    Otra caracterstica de la distribucin binomial es que la variable aleatoria es el resultadode conteos. Esto es, se cuenta el nmero de xitos en la totalidad de ensayos. Porejemplo se lanza cinco veces una moneda y se cuentan el nmero de caras que resultan,se seleccionan 10 trabajadores y se evala el nmero de ellos que tienen ms de 50 aosde edad o bien se escogen 20 cajas de cereal y se cuentan las que pesaron ms de loque dice en la etiqueta.

    Otra caracterstica de esta distribucin es que la probabilidad de un xito sigue siendo lamisma de un ensayo a otro. Ejemplo:

    La probabilidad de que se adivine correctamente (xito) la primera pregunta de la pruebade verdadero/falso es igual a , este es el primer ensayo. La probabilidad en formacorrecta la segunda pregunta (el segundo ensayo) tambin es ; la probabilidad de tenerxito en el tercer ensayo es y as sucesivamente.

    La ltima caracterstica de la distribucin de probabilidad binomial es que cada ensayo esindependiente de cualquier otro. Esto significa que los resultados no siguen ningn patrn.Por ejemplo las respuestas de la prueba de verdadero/falso no figuran comoV,V,V,F,F,F,V,V,V etc.

    En resumen la distribucin binomial tiene las siguientes caractersticas:

    1. El resultado de cada ensayo de un experimento se clasifica en una de doscategoras mutuamente excluyentes a saber xito o fracaso.

    2. La variable aleatoria cuenta el nmero de xitos en una cantidad fija de ensayos3. La probabilidad de un xito permanece igual en todos los ensayos. Lo mismo

    sucede con la probabilidad de un fracaso4. Los ensayos son independientes, lo cual significa que el resultado de un ensayo

    no afecta el resultado de algn otro.

  • 7/27/2019 Introduccion a Estadistica Inferencial

    13/45

    COMO SE CALCULA?

    Para elaborar una distribucin de probabilidad binomial se necesita: (1) el nmero deensayos y (2) la probabilidad de xito en cada ensayo. Por ejemplo si un examen altrmino de un seminario de administracin contiene 20 preguntas de opcin mltiple elnmero de ensayos es 20. Si cada pregunta tiene cinco opciones y solo una es correcta laprobabilidad de xito en cada ensayo que tiene una persona que desconoce la materia esde 0.20. de este modo la probabilidad de que una persona sin conocimiento del temaadivine la respuesta correcta a una pregunta tiene un valor de 0.20. Por tanto sesatisfacen las condiciones descritas para una distribucin binomial.

    En los casos en los que es aplicable la distribucin binomial, la formula matemtica paracalcular la probabilidad de cualquier valor de una variable aleatoria, es la funcin deprobabilidad:

    () ( ) ( )

    Dnde: n = nmero de intentos

    p = probabilidad de acierto de un intento

    x= nmero de aciertos en n intentos

    f(x) = probabilidad dexaciertos en n intentos.

    Ejemplo:

    Elaboremos una distribucin de probabilidad con el experimento consistente en ellanzamiento de cuatro monedas, para el cual la variable aleatoria discreta est dada por laobtencin de exactamente cero, una, dos, tres y cuatro caras (x= 0, 1, 2, 3, 4)

  • 7/27/2019 Introduccion a Estadistica Inferencial

    14/45

    x fraccin decimal

    0 1/16 0.0625

    1 4/16 0.2500

    2 6/16 0.3750

    3 4/16 0.2500

    4 1/16 0.0625

    16/16 1.0000

    Para encontrar en forma rpida, sin necesidad de hacer clculos engorrosos al aplicar lafrmula:

    ()

    ( )

    ( )

    Podemos hacer uso de la tabla de distribucin binomial como se presenta a continuacinpara n = 8 y p de 0,05 0,10 0,20 0,25 0,30 0,35 0,40 0,45 0,50

    0.0000

    0.0500

    0.1000

    0.1500

    0.2000

    0.2500

    0.3000

    0.3500

    0.4000

    1/16 4/16 6/16 4/16 1/16

    0 1 2 3 4

  • 7/27/2019 Introduccion a Estadistica Inferencial

    15/45

    Distribucin binomial clculo de la probabilidad para x

    p

    n x 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

    8 0 .6634 .4305 .2725 .1678 .1001 .0576 .0319 .0168 .0084 .0039

    1 .2793 .3825 .3847 .3355 .2670 .1977 .1373 .0896 .0548 .0312

    2 .0515 .1488 .2376 .2936 .3115 .2965 .2587 .2000 .1569 .1094

    3 .0054 .0331 .0839 .1468 .2076 .2541 .2786 .2787 .2568 .2188

    4 .0004 .0046 .0185 .0459 .0865 .1361 .1875 .2322 .2627 .2734

    5 .0000 .0004 .0026 .0092 .0231 .0467 .0808 .1239 .1719 .2188

    6 .0000 .0000 .0002 .0011 .0038 .0100 .0217 .0413 .0703 .1094

    7 .0000 .0000 .0000 .0001 .0004 .0012 .0033 .0079 .0164 .0312

    8 .0000 .0000 .0000 .0000 .0000 .0001 .0002 .0007 .0017 .0039

    Media de la distribucin Binomial:

    El valor esperado o esperanza matemtica de la variable aleatoria est dada por:

    Varianza de la distribucin binomial:

    La varianza de la variable aleatoria es:

    ( )

  • 7/27/2019 Introduccion a Estadistica Inferencial

    16/45

    DISTRIBUCION DE PROBABILIDAD DE POISSON

    La distribucin de probabilidad de poisson describe la cantidad de veces que ocurre unevento en un intervalo determinado. El intervalo puede ser de tiempo, distancia, rea o

    volumen. La distribucin se basa en dos supuestos. El primero, es que la probabilidad esproporcional a la extensin del intervalo. El segundo supuesto es que los intervalos sonindependientes. Dicho de otra manera, cuanto mayor sea la magnitud o extensin delintervalo tanto mayor ser la probabilidad, y el nmero de ocurrencias en un intervalo noafecta a los otros intervalos. Esta distribucin tambin es una forma lmite de ladistribucin binomial, cuando la probabilidad de xito es muy pequea y n es grande.

    La distribucin de probabilidad de poisson es una distribucin de probabilidad discretapuesto que se forma por conteo.

    Esta distribucin tiene muchas aplicaciones. Se utiliza como modelo para describir la

    distribucin de errores en la captura de datos; en el nmero de imperfecciones en piezasde fabricacin; en la cantidad de partes defectuosas en embarques de salida; en elnmero de clientes que esperan servicio en un restaurante, o en la cantidad de clientesque hacen fila para entrar a una de las atracciones en un parque de diversiones y tambinen el nmero de accidentes en una carretera durante un periodo de tres meses.

    La distribucin de poisson puede describirse matemticamente utilizando la siguienteformula:

    () para = 0, 1, 2, .

    Dnde:

    Numero promedio de ocurrencias de un intervalo (np)e = 2.71828

    x= nmero de ocurrencias dentro de un intervalo ( nmero de casos favorables)

    f(x) = probabilidad dexocurrencias en el intervalo

  • 7/27/2019 Introduccion a Estadistica Inferencial

    17/45

    La varianza de la distribucin de poisson tambin es igual a su media. Si por ejemplo laprobabilidad de que sea devuelto un cheque emitido por un banco es 0.0003 y si secambian 10.000 cheques el nmero medio de cheques devueltos es 3 que se obtiene por

    = np = 10.000(0.0003) = 3

    Ejemplo:

    Suponga que estamos interesados en el nmero de llegadas a un cajero automtico en unperiodo de 15 minutos en las maanas. Si suponemos que la probabilidad de que llegueuna persona es la misma para cualesquiera de 2 periodos de tiempo de igual duracin, yque la llegada o no llegada de una persona en cualquier periodo de tiempo esindependiente de la llegada o no llegada en cualquier otro periodo de tiempo, es aplicablela funcin de probabilidad de poisson. Entonces si suponemos que un anlisis de losdatos histricos muestra que el numero promedio de de personas que llegan durante unintervalo de 15 minutos es de 10 es aplicable la funcin de distribucin de probabilidad depoisson con = 10

    ()

    Si deseamos saber cul es la probabilidad de 5 llegadas en 15 minutos hacemos x= 5 yobtendremos:

    ()

    Aunque determinamos esta probabilidad evaluando la funcin de probabilidad mediante laaplicacin de la formula a menudo resulta ms sencillo usar las tablas de distribucin deprobabilidad de poisson. Estas tablas proporcionan probabilidades para valoresespecficos dexy de .

  • 7/27/2019 Introduccion a Estadistica Inferencial

    18/45

    DISTRIBUCION DE PROBABILIDAD NORMAL

    Quiz la distribucin de probabilidad ms importante utilizada para describir una variablealeatoria continua es la distribucin de probabilidad normal; es aplicable a grancantidad de situaciones de problemas prcticos. Su funcin de densidad de probabilidadtiene la forma de una curva en forma de campana.

    La forma matemtica de la funcin de probabilidad de la distribucin normal es:

    () ()

    Para

  • 7/27/2019 Introduccion a Estadistica Inferencial

    19/45

    iguales y estn localizadas en el pico. De esta forma la mitad del rea bajo lacurva se encuentra por arriba de este punto central, y la otra mitad por abajo.

    2. La distribucin de probabilidad normal es simtrica con respecto a su media. Si secorta la curva normal verticalmente en este valor central, ambas mitades serncomo imgenes en el espejo.

    3. La curva normal decrece uniformemente en ambas direcciones a partir del valor

    central. Es asinttica, esto significa que la curva se acerca cada vez ms al ejeX,pero en realidad nunca llega a tocarlo. Esto es, los puntos extremos de la curva seextienden indefinidamente en ambas direcciones.

    No existe solo una distribucin de probabilidad normal, sino que hay una familia de ellas.Existe una distribucin de probabilidad normal para los aos de servicio en una empresa,en la que la media es 20 aos y la desviacin es 3.1 aos. Existe otra distribucin deprobabilidad normal de los aos de servicio de otra empresa en la cual =20 y =3.9.

    DISTRIBUCION DE PROBABILIDAD NORMAL ESTANDAR

    Hay una familia de distribuciones normales. Cada distribucin puede tener una media ()o desviacin estndar () diferentes. Por tanto el nmero de distribuciones normales esilimitado. Sera imposible proporcionar una tabla de probabilidades (como para lasdistribuciones binomial y poisson) para cada combinacin de y . Por fortuna se puedeutilizar, en todos los casos en los que la distribucin normal es aplicable, un miembro de

    la familia de distribuciones normales que tiene una media 0 y una desviacin estndar 1denominado distribucin normal estndar. Cualquier distribucin normal puedeconvertirse en una distribucin normal estndar restando a la media de cadaobservacin, y dividiendo entre la desviacin estndar.

    Primero se convierte o se estandariza, la distribucin que se tiene, en la distribucinnormal estndar utilizando el valorz(tambin denominado puntuacin z, valor estadstico,desviacin normal estndaro simplemente desviacin normal).

    Valorzdiferencia entre un valor elegido, denotado porX, y la media , dividida entre la

    desviacin estndar, .

    Por tanto un valor z es la distancia a la media, medida en unidades de la desviacinestndar.

  • 7/27/2019 Introduccion a Estadistica Inferencial

    20/45

    Expresado en una frmula:

    Valor normal estndar

    Dnde:

    x es el valor de cualquier medida u observacin especifica

    es la media de la distribucin

    es la desviacin estndar de la distribucin.

    Como se observa en la definicin anterior un valor z mide la distancia entre un valorespecfico x y la media aritmtica en unidades de desviacin estndar. Al determinar elvalor z mediante la frmula se puede obtener el rea o la probabilidad bajo cualquiercurva normal recurriendo a las tablas diseadas para el efecto.

    Para explicar lo anterior suponga que el valor calculado para zes 1.91 Cul es el reabajo la curva normal entre la media yX ? En la tabla siguiente se reproduce una partede la tabla para una distribucin de probabilidad normal que ilustra el ejemplo.

    La columna izquierda de la tabla encabezada por la letra zse recorre hacia abajo hastaencontrar el 1.9. Despus se desplaza horizontalmente hacia la derecha se lee laprobabilidad bajo la columna encabezada con 0.01. La probabilidad es de 0.4719. Esto

    significa que 47.19% del rea bajo la curva normal estndar se encuentra entre la media yel valorXde 1.91 desviaciones estndar despus de la media. Esta es la probabilidad deque una observacin se encuentre entre 0 y 1.91 desviaciones estndar despus de lamedia.

  • 7/27/2019 Introduccion a Estadistica Inferencial

    21/45

    z 0.00 0.01 0.02 0.03 0.04 0.05

    1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394

    1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505

    1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599

    1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678

    1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744

    reas bajo la curva normal

    Se consideran tres reas bajo la curva normal que sern muy utilizadas:

    1. Aproximadamente 68% del rea bajo la curva normal esta entre la media ms unay menos una desviaciones estndar se expresa 1

    2. Alrededor de 95% del rea bajo la curva normal est entre la media ms dos ymenos de dos desviaciones estndar lo que se expresa 2

    3. Prcticamente toda el rea bajo la curva normal est entre la media y tresdesviaciones estndar (a uno y otro lados del centro) es decir 3

    Ejemplo:

    Una prueba del tiempo de vida til de bateras alcalinas tipo D revelo que su tiempo medio

    de vida es de 19 horas (h). La distribucin de los tiempos de vida se aproxima a unadistribucin normal. La desviacin estndar de la distribucin es 1.2 h.

    1. Entre que par de valores falla alrededor de 68% de las bateras?2. Entre que par de valores falla aproximadamente 95% de las bateras?3. Entre que par de valores fallan prcticamente todas las bateras?

  • 7/27/2019 Introduccion a Estadistica Inferencial

    22/45

    Para responder a estas preguntas se pueden utilizar los resultados de la regla emprica.

    1. Aproximadamente 68% de las bateras falla entre 17.8 y 20.2 horas, valoresobtenidos de 19.0 1(1.2)h

    2. Alrededor de 95% de las bateras falla entre 16.6 y 21.4 horas que se obtiene de19.0 2(1.2)h3. Prcticamente todas las bateras fallan entre 15.4 y 22.6 horas que se obtiene de

    19.0 3(1.2)h.

    NOCIONES DE MUESTREO

    El muestreo es un mtodo cientfico que utiliza principios matemticos y estadsticos para

    la adecuada seleccin de una muestra y manejo de la informacin obtenida a partir deella, para as tener estimaciones confiables. El muestreo consiste en la seleccin de unaparte de la poblacin, de tal manera que sta parte represente adecuadamente lapoblacin.

    CONCEPTOS GENERALES

    Muestra. Es un subconjunto de una poblacin. Este subconjunto debe ser representativode la poblacin que se seleccion.

    Para que una muestra sea aceptable es necesario que sea representativa de la poblacin,

    que tenga una confiabilidad susceptible de medicin y que responda a un plan prctico yeficaz.

    Para que la muestra represente apropiadamente a la poblacin, se debe atribuir a cadaunidad una probabilidad conocida de ser elegida, la que debe ser siempre distinta de cero.

    Poblacin. Cualquier conjunto de unidades o elementos claramente definido para el quese obtienen las estimaciones. Cuando se va a hacer una investigacin se debe tener muyclaro cul es su cobertura o alcance para as mismo definir la poblacin.

    Unidad de anlisis o elemento de muestreo es el objeto en el cual se toman lasmediciones. Estas unidades pueden ser personas, familias, fincas, empresas, tarjetas,etc.

    Unidades de muestreo "son colecciones no traslapadas de elementos de la poblacinque cubren la poblacin completa"1es decir que no debe haber interseccin entre unaunidad y otra, por lo tanto, cada elemento de muestreo puede pertenecer a slo una

    http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/lecciones/capituloseis/6_1.html#1http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/lecciones/capituloseis/6_1.html#1http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/lecciones/capituloseis/6_1.html#1http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/lecciones/capituloseis/6_1.html#1
  • 7/27/2019 Introduccion a Estadistica Inferencial

    23/45

    unidad de muestreo. Estas unidades pueden ser manzanas de barrios, barrios, familias,fincas, parcelas, sectores, etc.. Si cada unidad de muestreo contiene un solo elemento,entonces la unidad de muestreo y el elemento de muestreo son iguales.

    Marco de muestreo es un listado o mapa que contiene todas las unidades de muestreo y

    por consiguiente cubre a toda la poblacin.

    Error de muestreoUn error en estadstica es la diferencia entre el valor de un estimadory el del parmetro correspondiente. Existen varias causas para producir estos errores.Segn la causa son clasificados en errores de muestreo y de no muestreo.

    El error de no muestreo puede ocurrir en cualquier encuesta, sea un censo o unamuestra. Estos errores comprenden errores sistemticos y equivocaciones.

    Los factores que causan error sistemtico son: falta de definicin clara de la poblacin,inadecuada elaboracin del marco de muestreo, falta de definicin del cuestionario, vaga

    concepcin de la informacin deseada, mtodos imprecisos de entrevistas.

    Surgen errores por equivocacin cuando las respuestas son anotadas en lugaresequivocados, cuando los entrevistados no responden, dan respuestas incorrectas oinapropiadas y cuando se hacen clculos y anotaciones incorrectas al procesar los datos."Los errores de no muestreo pueden ser controlados mediante una atencin cuidadosa enla construccin de los cuestionarios y en los detalles del trabajo de campo"1. Estos erroresen las encuestas pueden ser minimizados as: la no respuesta con un plan para hacer re-entrevistas a los elementos muestreados, con recompensas e incentivos para quienresponde y entrevistadores adiestrados; la respuesta incorrecta se puede corregir si los

    cuestionarios despus de diligenciados son revisados por alguien diferente alencuestador.

    Los errores de muestreo son resultado de la eleccin casual de unidades de muestreo.Este tipo de error ocurre porque solo se observa una parte de la poblacin; as que si sehace un censo, puede esperarse que desaparezca el error de muestreo.

    Ventajas del muestreo. Hay dos formas de estudiar las poblaciones: por censo o pormuestreo. En el censo se analizan todos y cada una uno de los elementos de unapoblacin y en el muestreo se analiza una parte de la poblacin.

    Las principales ventajas del muestreo comparadas con el censo son:

    a. Costo reducido. Si la informacin se obtienen nicamente para una parte de lapoblacin, los gastos son menores que los se tendran si se realiza un censo.

    b. Mayor rapidez. La informacin puede ser recolectada y procesada ms rpidamentecuando se selecciona una muestra que cuando se realiza un censo.

    http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/lecciones/capituloseis/6_2.html#1http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/lecciones/capituloseis/6_2.html#1http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/lecciones/capituloseis/6_2.html#1http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/lecciones/capituloseis/6_2.html#1
  • 7/27/2019 Introduccion a Estadistica Inferencial

    24/45

    c. Mayor exactitud. Cuando los errores ajenos al muestreo son necesariamente grandes,una muestra puede dar mejores resultados que un censo, ya que esos errores secontrolan con ms facilidad si la operacin es de pequea escala. Como el volumen detrabajo se reduce, se puede emplear personal calificado y realizar una supervisincuidadosa del trabajo de campo y del procesamiento de la informacin, reduciendo as los

    errores de no muestreo.

    d. Posibilidad de hacerse. En la industria algunas pruebas son destructivas, por lo tanto,ciertas investigaciones slo pueden realizarse con una muestra de productos. Porejemplo, un estudio sobre la duracin de los bombillos o la resistencia de cualquiermaterial.

    Muestreo Aleatorio Simple. (M.A.S) Si de una poblacin de tamao N se seleccionauna muestra de tamao n, de tal manera que cada muestra posible de tamao n tenga lamisma probabilidad de ser seleccionada, el tipo de muestreo utilizado se llama Muestreo

    Aleatorio Simple.

    En la prctica, una muestra aleatoria simple es seleccionada unidad por unidad. Lasunidades de muestreo son numeradas de 1 a N, a continuacin se seleccionan n nmerosentre 1 y N, ya sea utilizando una tabla de nmeros aleatorios o colocando los N nmerosen una urna y las unidades de muestreo que lleven los nmeros seleccionadosconstituirn la muestra. La muestra se selecciona sin repeticin o sin sustitucin, es decir,que cada unidad de muestreo solo puede aparecer una sola vez en una muestradeterminada.

    Este tipo de muestreo se utiliza cuando: la poblacin es ms o menos homognea con

    respecto a las caractersticas que se desean estudiar; cuando los elementos de lapoblacin no se pueden enumerar fcilmente; cuando las estimaciones que se debenobtener se refieren a todo el conjunto y no a subgrupos de la poblacin.

    Cuando se selecciona una muestra el objetivo es tener estimaciones para los parmetrosa travs de la informacin suministrada por la muestra.

    Muestreo Aleatorio Estratificado. (MAE) El muestreo aleatorio estratificado (MAE)consiste en clasificar primero los elementos de la poblacin en grupos que no presententraslapes o intersecciones, y de estos grupos o estratos seleccionar una muestrairrestricta aleatoria, tomando al menos un elemento de cada grupo o estrato.

    El proceso que se sigue para establecer los grupos se conoce como estratificacin. Alformar los estratos se debe buscar que los elementos de cada estrato sean lo mshomogneos entre s y que haya marcadas diferencias entre un estrato y otro. Estosestratos pueden reflejar regiones geogrficas de un pas, clases sociales dentro de unaciudad, etc.

  • 7/27/2019 Introduccion a Estadistica Inferencial

    25/45

    Cuando se utiliza el muestreo aleatorio estratificado las probabilidades de seleccin de ungrupo al otro pueden ser iguales o diferentes, aunque se debe conocer la probabilidad deseleccin que corresponde a cada uno. Las muestras se seleccionan separadamente paracada estrato y las estimaciones se realizan separadamente para cada estrato y seponderan para obtener una estimacin combinada para la poblacin.

    El utilizar muestreo estratificado tiene sus ventajas como son: aumento en la exactitud delos resultados, reduciendo el error de muestreo y permite obtener estimaciones para cadaestrato. A cambio de lo anterior, se necesita ms informacin que en MAS. para definir losestratos y el clculo de los errores es ms complejo que en MAS.

    CONSIDERACIONES PARA LA SELECCIN DE UNA MUESTRA.

    1. Se debe seguir un diseo estadstico (Muestreo Aleatorio Simple, Muestreo

    Aleatorio Estratificado). El mejor es el que muestra la precisin necesaria entrminos de un limite en cuanto al error de estimacin a un menor costo.

    2. La seleccin de los elementos al azar para luego recolectar la informacin porcualquiera de los mtodos: (Entrevista, Correo, Observacion directa, telfono etc)

    3. El error muestral. Es decir la diferencia entre el resultado obtenido mediante lamuestra y el obtenido mediante la investigacin total o censo.

    Parametro: Son las medidas descriptivas numricas aplicadas a las caractersticas de lapoblacin ( valores estadsticos de la poblacin.

    Estimador puntual: son las medidas descriptivas numricas aplicadas a las caractersticasde las unidades de muestra

    Estimador por intervalos: Es la estimacin del parmetro mediante la especificacin de unintervalo de valores determinado por un limite inferior y otro superior (limites de confianza)dentro del cual estar el parmetro poblacional.

    Intervalo de confianza: corresponde a un intervalo de valores dentro de los cuales seespera que este el parmetro, con cierto grado de confianza o con riesgo de errorconocido.

    DISTRIBUCION DE LAS MEDIAS MUESTRALES

    Las estimaciones que tienen la propiedad de que sus valores esperados sean iguales alos valores poblacionales se denominan estimaciones insesgadas. En el Muestreo

    Aleatorio Simple (MAS) la media muestral es una estimacin insesgada del promediopoblacional.

  • 7/27/2019 Introduccion a Estadistica Inferencial

    26/45

    Las muestras tienden a dar estimaciones relativamente ms confiables, es decir seaproximan ms al valor verdadero, a medida que aumenta el tamao de la muestra. Laconcentracin cada vez mayor de las estimaciones muestrales alrededor del valorverdadero a medida que aumenta el tamao de la muestra, es lo que se conoce como laconsistencia del estimador.

    Supongamos una poblacin N=5 o sea de 5 elementos cuyos elementos (valores) son: 7,3, 5, 8, 2,

    Calculamos = = 5

    2 =() = 5.2

    =

    =2.28

    El nmero de muestras posibles de tamao 2 seleccionadas sin reposicion corresponde a10 muestras.

    Los valores de las medias aritmticas de cada una de ls muestras encontradas son lossiguientes:

  • 7/27/2019 Introduccion a Estadistica Inferencial

    27/45

    Al calcular la media aritmtica del total de las medias muestrales el resultado obtenido esel valor de la media de la poblacin, con lo cual podemos afirmar lo siguiente:

    TEOREMA DEL LIMITE CENTRAL.

    Si de una poblacin, se extraen muestras aleatorias de tamao constante nla distribucinde las medias muestrales es una distribucin normal; la media aritmtica de la distribucin

    es igual a la media de la poblacin, y la varianza de las muestras ser igual a

    LEY DE LOS GRANDES NUMEROS

    Si se extraen de cualquier poblacin muestras aleatorias de tamao constante n, amedida que n aumenta, la distribucin de las medias de las muestras se aproxima cadavez mas a una distribucin normal, la media de las distribucin de las medias es igual a la

    media de la poblacin y la varianza de las medias ser igual a

    En conclusin:

    La distribucin de las medias tiende a ser normal

    La media de las muestras es igual a la media de la poblacin

    Si la estimacin del valor de la media se basa en una sola muestra de tamao n, laaproximacin ser tanto mas cercana, cuanto mayor sea el valor de n.

    El error estndar=

    que es el valor de la desviacin estndar de las medias de las

    muestras. Cuanto mas pequeo sea el error estndar mas representativa es la mediamuestral. En general, el error estndar es utilizado principalmente para cuantificar ladispersin del estimador obtenido.

    El intervalo de confianza para la media es: p(-zs

  • 7/27/2019 Introduccion a Estadistica Inferencial

    28/45

    Si la muestra es grande (n> 30), Z pertenece a una distribucin normal y si la muestra espequea (n < 30), Z pertenece a una distribucin t con n-1 grados de libertad.

    EJEMPLO

    Se desea estimar el promedio de hectreas destinadas al cultivo de caf; para ello setoma una muestra aleatoria de 15 fincas de un total de 750 en el departamento deCaldas, obtenindose los siguientes resultados en hectreas sembradas en caf:

    FINCA Has. CAF FINCA Has. CAF FINCA Has. CAF

    1 12 6 10 11 15

    2 15 7 6 12 12

    3 25 8 11 13 10

    4 30 9 24 14 19

    5 22 10 18 15 22

    Una vez estimado el promedio obtenga un intervalo de confianza para el promedio.

    Solucin:

    El promedio se obtiene: =

    La desviacin estndar para el promedio se obtiene con la frmula, pero para aplicarla senecesita la varianza corregida.

  • 7/27/2019 Introduccion a Estadistica Inferencial

    29/45

    Los anteriores resultados quieren decir que en el departamento de Caldas el promedio dehectreas sembradas en caf por finca es de 16,73 con un margen de error de 1,74hectreas.

    El intervalo de confianza para el promedio se obtiene teniendo en cuenta que la muestra

    es pequea, el valor de Z se halla en una tabla de la distribucin t con 14 grados delibertad, que para una confiabilidad del 95 por ciento es de 2,145.

    Esto quiere decir que con una confiabilidad del 95 por ciento, el promedio de hectreascultivadas en caf por finca en el departamento de Caldas, est entre 13 y 20,47.

    DETERMINACION DEL TAMAO DE LA MUESTRA

    Cuando deseamos estimar el tamao de la muestra se deben tener en cuenta que losobjetivos de la encuesta suelen requerir varias estadsticas y que al considerar cada unade ellas pueden llevar a un diseo diferente, por lo tanto, para determinar el tamao de lamuestra se debe elegir el principal objetivo y calcular el tamao de muestra necesariopara cumplir dicho objetivo. En caso de ser varios los objetivos principales se determinaun tamao de muestra para cumplir cada objetivo y entre todos ellos, se elige el mayor.

    El tamao de la muestra depende bsicamente del tamao de la poblacin, del nivel deconfianza o confiabilidad de las estimaciones, del grado de variacin o dispersin de lavariable a estudiar y del error de estimacin.

    El nivel de confianza o confiabilidad lo fija arbitrariamente quien est calculando el tamaode la muestra, teniendo en cuenta que dicha confiabilidad debe estar entre el noventa y elnoventa y nueve por ciento. A mayor confiabilidad mayor tamao de muestra.

    El grado de variacin o dispersin de la variable se mide a travs de la desviacinestndar, la cual puede ser estimada a partir de una muestra piloto o a partir de lainformacin recopilada en una investigacin similar, realizada anteriormente.

    El error de estimacin es la mxima diferencia en valor absoluto, que se est dispuesto aaceptar, entre el valor del estimador y el valor del parmetro, a ste error de estimacin sele nota como E. El valor del error de estimacin depende del estimador que se deseeobtener y de la magnitud de la variable. Por ejemplo si se va a estimar la proporcin dedesempleados, un error de estimacin lgico puede ser del 3 por ciento; pero si se va aestimar el peso promedio de un grupo de estudiantes, un error de estimacin lgico puedeser de 7 kilos. A mayor error de estimacin menor tamao de muestra.

  • 7/27/2019 Introduccion a Estadistica Inferencial

    30/45

    Dependiendo del tipo de estimador que se desee obtener, se debe utilizar una frmuladiferente para calcular el tamao de la muestra.

    Tamao de la muestra para la media poblacional para poblaciones infinitas:

    n =

    E = es el margen de error que se puede aceptar al nivel de confianza dado.

    Z = es el nivel de confianza que se usa

    = desviacin estndar de la poblacin (una estimacin)

    Cuando no se conoce la desviacin estndar de la poblacin es necesario buscar un valorpreliminar o un valor de planeacin. Se puede optar en la practica por:

    Usar una desviacin estndar muestral de muestras previas.

    Usar un estudio piloto para seleccionar una muestra preliminar de unidades

    Usar el juicio o una mejor estimacin

    Tamao de la muestra para la media poblacional para poblaciones finitas:

    n =

    (

    )

    DISTRIBUCION MUESTRAL DE LA PROPORCION

    En el anlisis de una caracterstica cualitativa o atributo se emplea la proporcin de xitosy no el numero de xitos como en la distribucin binomial.

  • 7/27/2019 Introduccion a Estadistica Inferencial

    31/45

    Antes p =

    Ahora en vez de expresar la variable en trminos de xitos nos referiremos al numero deatributos en la muestra (a) y lo dividimos por el tamao de la muestra (n).

    P = a = ai = np

    Si lo trasladamos a la poblacion P = A= Ai = NP

    P es la proporcin de elementos que presenta la caracterstica en la poblacin; (1 P) esla proporcin de elementos que no presenta la caracterstica en la poblacin.

    p = varianza de la proporcin de la poblacin p = P(1 P)

    = desviacin estndar= P = () TAMAO DE LA MUESTRA

    Para determinar el tamao de la muestra es necesario identificar los siguientescomponentes:

    La varianza (x) que corresponde al grado de variabilidad que presentan las unidades dela poblacin. Mientras mas grande sea x mayor ser el tamao de la muestra. El valor

    de x supuestamente es conocido, de lo contrario se debe estimar a travs de unainvestigacin preliminar. En el caso de p = P(1 P) sucede algo similar pero se tiene lacostumbre de tomar P = 0,50 con lo cual se obtiene el mximo valor posible de n.

    Nivel de confianza. Tiene relacin directa con el tamao de la muestra, por lo tanto se dirque a mayor nivel de confianza, mas grande debe ser el tamao de la muestra. Losvalores de Zse obtienen mediante el uso de tablas. El nivel es fijado por el investigadorcon base en su experiencia.

    Precisin de la estimacin: corresponde al margen de error que el investigador fija deacuerdo al conocimiento que tenga acerca del parmetro que piensa estimar. Se le

    conoce como error de muestreo (E) siendo: E = Z

    E = Z

    Tamao de la muestra para la proporcin poblacional para poblaciones infinitas:

  • 7/27/2019 Introduccion a Estadistica Inferencial

    32/45

    n =()

    E = error muestral

    Z = el nivel de confianza

    P = el valor de la proporcin de la poblacin

    El valor de planeacin de la proporcin de la poblacin se puede elegir mediante:

    Usar una proporcin muestral de una muestra anterior

    Llevar a cabo un estudio piloto

    Usar el juicio o un estimado mejor del valor de P

    Usar P = 0.50

    Tamao de la muestra para la proporcin poblacional para poblaciones infinitas:

    n =()

    ()

    PRUEBAS DE HIPOTESIS

    Una hiptesis estadstica es un supuesto acerca del valor de un parmetro de unapoblacin determinada. Este supuesto debe comprobarse con la informacin suministradapor una muestra aleatoria obtenida de dicha poblacin.

    Cuando se realiza una prueba de hiptesis, se plantean dos hiptesis que deben sermutuamente excluyentes; una es la hiptesis nula que se nota como H0 y la otra es lahiptesis alternativa que se nota como H1 .

    Se debe establecer un criterio o regla de decisin segn la cual no se rechace la hiptesisnula o se rechace. Si se rechaza la hiptesis nula (H0 ) se acepta hiptesis alternativa (H1). Para establecer esta regla de decisin la distribucin de probabilidad se divide en dos

  • 7/27/2019 Introduccion a Estadistica Inferencial

    33/45

    categoras mutuamente excluyentes: la que lleva al rechazo de H0 , es decir est en lazona de rechazo y la que lleva al no rechazo de H0 , es decir, est en la zona de norechazo.

    Debido a que se est trabajando con una muestra aleatoria, cuando se realiza una prueba

    de hiptesis se pueden cometer dos tipos de errores. La hiptesis nula (H0 ) es enrealidad verdadera, pero debido a que los datos muestrales parecen ser inconsistentescon ella, se la rechaza (ERROR TIPO I) y la probabilidad de cometer un error tipo I sellama nivel de significancia ( ). Puesto que cuando se comete un error tipo I, seguiramosuna accin errnea, se puede definir el nivel de significancia como la probabilidad dedecidirnos por H1 dado que H0 es verdadera.

    Por otro lado, podemos no rechazar H0 siendo en realidad falsa, a este error se le llamaERROR TIPO II.

    FORMULACION DE HIPOTESIS

    El primer paso en la prueba de hiptesis es el planteamiento de las hiptesis, lo que enalgunos casos no es una tarea fcil.

    Hay tres tipos de hiptesis, a saber:

    - Prueba de hiptesis a dos colas

    H0: = k

    H1: k

    - Prueba de hiptesis a una cola superior

    H0 : = k H0: k

    H1 : > k H1 : > k

    - Prueba de hiptesis a una cola inferior

    H0 : = k H0 : k

    H1 : < k H1 : < k

    Ntese que las hiptesis siempre se plantean para un parmetro .

  • 7/27/2019 Introduccion a Estadistica Inferencial

    34/45

    Una vez establecidas las hiptesis, se selecciona el nivel de significancia o mrgen deerror ( ) el que generalmente se fija entre el uno y el diez por ciento.

    El tercer paso es la estadstica a probar o estadstica de trabajo, la cual depende de ladistribucin en el muestreo del estimador con el que se est trabajando y de los

    supuestos correspondientes a la poblacin y al tamao de la muestra. Cuando se realizanlos clculos siempre se supone que la hiptesis nula (H0) es cierta.

    El cuarto paso es establecer la regla de decisin, la cual depende de la distribucin deprobabilidad de la estadstica a probar, del nivel de significancia ( ) y de la hiptesisalternativa (H1).

    Finalmente se toma la decisin de no rechazar la hiptesis nula o rechazarla.

    PRUEBA DE HIPOTESIS PARA LA MEDIA

    El promedio aritmtico poblacional es un indicador muy importante, por lo tanto, frecuentementese desea probar si dicho promedio ha permanecido igual, ha aumentado o ha disminudo. Atravs de la prueba de hiptesis se determina si la media poblacional es significativamentemayor o menor que algn valor supuesto.

    Hiptesis

    Se puede plantear uno de los siguientes tres tipos de hiptesis:

    - Prueba de hiptesis a dos colas

    H0 : = k

    H1 : k

    - Prueba de hiptesis a una cola superior

    H0 : = k H0 : k

    H1 : >k H1 : > k

    - Prueba de hiptesis a una cola inferior

    H0 : = k H0 : k

    H1 : < k H1 : < k

  • 7/27/2019 Introduccion a Estadistica Inferencial

    35/45

    En las distribuciones en el muestreo se vio que para el caso de la media, hay tressituaciones, por consiguiente la estadstica de trabajo a utilizar depende de los supuestosde la poblacin y del tamao de la muestra.

    Prueba de hiptesis para la media si la poblacin de donde se obtiene la muestra

    tiene distribucin normal con conocida.

    La estadstica de trabajo a usar corresponde a la expresin

    Dnde: es el valor que se est suponiendo en la hiptesis nula (H0).

    REGLA DE DECISION

    - Si se ha planteado la hiptesis alternativa como: H1 : k se tiene una prueba dehiptesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partesiguales, quedando estos valores en los extremos de la distribucin como se aprecia en lafigura

    Regla de decisin para una prueba de hiptesis a dos colas.

    y pertenecen a una distribucin normal estndar. Si el valor de la estadstica detrabajo (Zx) est entre y no se rechaza la hiptesis nula, en caso contrario serechaza H0 lo cual implica aceptar H1. Es decir:

  • 7/27/2019 Introduccion a Estadistica Inferencial

    36/45

    - Si se ha planteado la hiptesis alternativa como:

    H1 : > k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de

    significancia ( ) en la parte superior de la distribucin, como se aprecia en la figura

    Regla de decisin para una prueba de hiptesis a una cola superior.

    pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo

    (Zx) es menor que no se rechaza la hiptesis nula, en caso contrario se rechaza H0 locual implica aceptar H1. Es decir,

    Si se ha planteado la hiptesis alternativa como:

    H1 : < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel designificancia ( ) en la parte inferior de la distribucin, como se aprecia en la figura

  • 7/27/2019 Introduccion a Estadistica Inferencial

    37/45

    Regla de decisin para una prueba de hiptesis a una cola inferior.

    Z pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo(Zx) es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H0 locual implica aceptar H1. Es decir,

    EJEMPLO

    Un proceso manufacturero usado por una fbrica durante los ltimos aos da unaproduccin media de 100 unidades por hora con una desviacin estndar de 8 unidades.Se acaba de introducir en el mercado una nueva mquina para realizar ese tipo deproducto. Aunque es muy cara comparada con la que est ahora en uso, si la media deproduccin de la nueva mquina es de ms de 150 unidades por hora, su adopcin dara

    bastantes beneficios.

    Para decidir si se debiera comprar la nueva mquina, a la gerencia de la fbrica se lepermite hacer un ensayo durante 35 horas, hallndose un promedio de 160 unidades porhora. Con sta informacin qu decisin se debe tomar si se asume un nivel de confianzadel 99 por ciento.

    Solucin.

    Segn el enunciado, solo se compra la mquina si la produccin es de mas de 150unidades por hora, por lo tanto las hiptesis son:

    H0 : = 150

    H1 : > 150

    Para elegir la estadstica de trabajo se tiene en cuenta que se conoce la varianzapoblacional, por lo tanto se usa la expresin:

    por el planteamiento de la hiptesis alternativa se trabaja a una cola superior. En ladistribucin normal, con una confiabilidad del 99 por ciento el valor de Z es 2,33. comopuede observarse en la figura, la estadstica de trabajo est en la zona de rechazo de la

  • 7/27/2019 Introduccion a Estadistica Inferencial

    38/45

    hiptesis nula, por lo tanto, se acepta que la produccin promedio por hora es superior alas 150 unidades y asumiendo un riesgo del 1 por ciento se puede comprar la nuevamquina.

    Regla de decisin para una prueba de hiptesis a una cola inferior.

    Prueba de hiptesis para la media si se selecciona una muestra aleatoria de tamaon 30 de una poblacin con cualquier distribucin.

    La estadstica de trabajo a usar es la expresin:

    REGLA DE DECISION

    Es la misma que en el caso anterior y depende en todo caso de la hiptesis alternativa.

    EJEMPLO

    La duracin promedio de las llantas producidas por una fbrica de llantas, segnexperiencias registradas es de 46.050 kms. Se desea probar si el promedio poblacionalha cambiado; para tal efecto se toma una muestra aleatoria de 60 llantas y se obtiene unaduracin promedio de 45.050 kms. con una desviacin estndar de 3.070 kms.

    Solucin

  • 7/27/2019 Introduccion a Estadistica Inferencial

    39/45

    H 0 : = 46.050

    H1 : 46.050

    Teniendo en cuenta que el tamao de la muestra es grande, como estadstica de trabajo

    se utiliza la expresin 3.2

    Por la hiptesis alternativa, la regla de decisin es a dos colas. La tabla a utilizar es la dela distribucin normal. Asumiendo un nivel de confianza del 95 por ciento, loscorrespondientes valores de Z son -1,96 y 1,96. Como puede observarse en la figura el

    valor de la estadstica de trabajo est en la zona de rechazo de la hiptesis nula, porconsiguiente, con una confiabilidad del 95 por ciento se acepta que la duracin promediode las llantas ha cambiado.

    Regla de decisin para una prueba de hiptesis a dos colas

    Prueba de hiptesis para la media si se selecciona una muestra aleatoria de tamao

    n

  • 7/27/2019 Introduccion a Estadistica Inferencial

    40/45

    Si se utiliza la varianza corregida la estadstica de trabajo es la expresin:

    EJEMPLO

    En su calidad de comprador comercial para un supermercado, se toma una muestraaleatoria de doce (12) sobres de caf de una empacadora. Se encuentra que el peso

    promedio del contenido de caf de cada sobre es 15,97 grs. con una desviacin estndarde 0,15. La compaa empacadora afirma que el peso promedio mnimo del caf es de 16grs. por sobre. Puede aceptarse sta afirmacin si se asume un nivel de confianza del 90por ciento?

    Solucin

    Se desea probar si el peso mnimo es de 16 grs., es decir mayor o igual a 16 grs., as quelas hiiptesis adecuadas son:

    H0 : 16

    H1 : < 16

    Teniendo en cuenta que el tamao de la muestra es pequeo, como estadstica de trabajose utiliza la expresin:

    Como lo indica la hiptesis alternativa, se trabaja a una cola inferior en la tabla de ladistribucin t con 11 grados de libertad y una confiabilidad del 90 por ciento, el valor de Zes - 1,363

    Como puede observarse, la estadstica de trabajo (-0,663) est ubicada en la zona de norechazo de la hiptesis nula, por lo tanto, con un nivel de confianza del 90 por ciento no

  • 7/27/2019 Introduccion a Estadistica Inferencial

    41/45

    se rechaza que los empacadores de caf tienen la razn, por lo tanto se concluye que elpeso promedio de los sobres de caf es mayor o igual a 16 grs.

    Regla de decisin para una prueba de hiptesis a una cola inferior

    PRUEBA DE HIPOTESIS PARA LA PROPORCION

    Frecuentemente se desea estimar la proporcin de elementos que tienen unacaracterstica determinada, en tal caso, las observaciones son de naturaleza cualitativa.Cuando se analiza informacin cualitativa y se est interesado en verificar un supuesto

    acerca de la proporcin poblacional de elementos que tienen determinada caracterstica,es til trabajar con la prueba de hiptesis para la proporcin.

    HIPTESIS

    Como en el caso de la media, se puede plantear uno de los siguientes tres tipos dehiptesis:

    - Prueba de hiptesis a dos colas

    H0 : = k

    H1 : k

    - Prueba de hiptesis a una cola superior

    H0 : = k H0 : k

  • 7/27/2019 Introduccion a Estadistica Inferencial

    42/45

    H1 : > k H1 : > k

    - Prueba de hiptesis a una cola inferior

    H0 : = k H0 : k

    H1: < k H1 : < k

    Cuando se va a estimar una proporcin el tamao de la muestra (n) siempre debe sermayor a 30, por lo tanto se tiene un solo caso.

    La estadstica de trabajo a utilizar es la expresin:

    REGLA DE DECISION

    Si se ha planteado la hiptesis alternativa como:

    H1: k se tiene una prueba de hiptesis a dos colas, por lo tanto, el nivel de significancia( ) se divide en dos partes iguales, quedando estos valores en los extremos de ladistribucin

    y pertenecen a una distribucin normal estndar. Si el valor de la estadstica detrabajo (Zp) est entre y no se rechaza la hiptesis nula, en caso contrario se

    rechaza H0 lo cual implica aceptar H1 . Es decir, si < Zp < no se rechaza H0 .

    - Si se ha planteado la hiptesis alternativa como:

    H1 : > k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel designificancia ( ) en la parte superior de la distribucin

    pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo

    (Zp ) es menor que no se rechaza la hiptesis nula, en caso contrario se rechaza H0 locual implica aceptar H1 . Es decir, si Zp < no se rechaza H0 .

    - Si se ha planteado la hiptesis alternativa como:

    H1 : < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel designificancia ( ) en la parte inferior de la distribucin

  • 7/27/2019 Introduccion a Estadistica Inferencial

    43/45

    Z pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo(Zp ) es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H0 locual implica aceptar H1 . Es decir, si Zp > Z no se rechaza H0 .

    EJEMPLO

    Un fabricante afirma que por lo menos el 90 por ciento de las piezas de una maquinariaque suministra a una fbrica guardan las formas especificadas. Un exmen de 200 deesas piezas revel que 160 de ellas no eran defectuosas. Pruebe si lo que afirma elfabricante es cierto.

    Solucin

    H0 : 0,9

    H1 : < 0,9

    Para realizar una prueba de hiptesis para la proporcin se utiliza la expresin:

    Asumiendo una confiabilidad del 95 por ciento, el valor correspondiente a Z en la

    distribucin normal es -1,64

    Como puede observarse en la figura, el valor de la estadstica de trabajo se encuentra enla zona de rechazo de la hiptesis nula, por consiguiente, con una confiabilidad del 95 porciento se concluye que la afirmacin del fabricante no es cierta.

  • 7/27/2019 Introduccion a Estadistica Inferencial

    44/45

    Regla de decisin para una prueba de hiptesis a una cola inferior

    BIBLIOGRAFIA

    BERENSON, Mark L. y LEVINE , David M. Estadstica bsica enadministracin, conceptos y aplicaciones. Mxico: Prentice-HallHispanoamericana S.A. 1992. 946 p.

    GUJARATI Damodar . ECONOMETRIA, tercera edicin. Ed. Mc Graww -Hill.

    ABAD, Adela y SERVIN, Luis A. Introduccin al muestreo, segundaedicin. Mxico D.F: Ed. Limusa, 1984. 216 p.

    MENDENHALL, William y REINMUTH, James E. Estadstica paraadministracin y economa. California: Ed. WadsworthInternacional/Iberoamrica, 1982. 707 p.

    LARSON, Harold J. Introduccin a la teora de probabilidades e inferenciaestadstica. Mxico D.F: Limusa, 1978. 466 p

    ANDERSON David, SWEENEY Dennis J, WILLIAMS Thomas, Estadistica

    para Administracin y Economia sptima edicin ed: ThomsonInternacional

    SCHEAFFER, Richard L.; MENDENHALL, William y OTT, Lyman.Elementos de muestreo. Mxico D.F: Grupo editorial iberoamrica, 1986.321 p.

  • 7/27/2019 Introduccion a Estadistica Inferencial

    45/45

    MARTINEZ Bencardino Ciro, Estadistica y muestreo Onceava edicin ed:Ecoe ediciones

    LIND Douglas A, MARCHAL William, MASON Robert, Estadistica paraAdministracion y Economia Undecima edicion ed: Alfaomega

    STEVENSON, William J. Estadstica para administracin y economa,conceptos y aplicaciones. Mxico D.F.: Harla, 1981. 585 p.

    Universidad Nacional de Colombia Curso de estadistica IIwww.virtual.unal.edu.co