2.3.intervalos

60
9. Estimaci´on por intervalos de confianza Estad ´ıstica Ingenier´ıa Inform´atica Curso 2009- 2010

Upload: miguelquispezelada

Post on 06-Nov-2015

226 views

Category:

Documents


7 download

DESCRIPTION

estadistica

TRANSCRIPT

9. Estimacin por intervalos de confianza

9. Estimacion por intervalos de confianza

Estadstica

Ingeniera Informatica

Curso 2009-2010

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-20101 / 23

Contenidos

1 Estimacion por intervalos de confianza

2 Estimacion por intervalos bajo normalidadEstimacion de la media poblacional . Varianza conocidaDeterminacion del tamano muestral para controlar el error de estimacionEstimacion de la media poblacional . Varianza desconocidaDeterminacion del tamano muestral para controlar el error de estimacionEstimacion de la diferencia de mediasA. Varianzas conocidasB. Varianzas desconocidas e igualesEstimacion de la varianzaEstimacion del cociente de varianzas

3 Estimacion por intervalos en poblaciones no normalesEstimacion de la media. Varianza conocidaEstimacion de la media en poblaciones no normales. Varianza desconocidaEstimacion de la proporcion en distribuciones binomiales

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-20102 / 23

Estimacion por intervalos de confianza

Estimacion por intervalos

La estimacion por intervalos de un parametro desconocido proporciona informacion acerca de los valores de los parametros que estamosestimandouna indicacion del nivel de confianza que se le puede dar a los posibles valores de los parametros

Un intervalo de confianza para es de la forma L U, donde losextremos inferior y superior L y U dependen del valor numerico obtenidoen una muestra para un cierto estadstico T , escogido segun el parametro que queremos estimar.

L y U son variables aleatorias (distintas muestras producen distintos valores de L y U)

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-20103 / 23

Estimacion por intervalos de confianza

A partir de la distribucion de T , y para un valor , 0 < < 1, determinamos los valores de L y U que hacen queP(L U) = 1

hay probabilidad 1 de que al seleccionar la muestra, esta produzcaun intervalo que contenga el verdadero valor de

El intervalo resultante, IC100(1) %, se denomina intervalo de confianza del 100(1 ) % para

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-20104 / 23

Estimacion por intervalos de confianza

Interpretacion del IC100(1) % :

Si obtenemos un numero elevado (infinito) de muestras aleatorias y calculamos para cada una de ellas el correspondiente IC100(1) % para ,entonces el 100(1 ) % de estos intervalos contendran el verdadero valorde .

En la practica solo se obtiene una muestra aleatoria, y calculamos unintervalo de confianza.Este intervalo contendra o no al verdadero valor del parametro no tiene sentido atribuir una probabilidad al hecho de que s lo contenga se dice que el intervalo contiene a con una confianza de 100(1 ) % (y no con una probabilidad de 100(1 ) %)

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-20105 / 23

Estimacion por intervalos de confianza

Longitud y precision

La longitud de un intervalo de confianza, U L, es una importante medida de la calidad de la informacion obtenida de la muestra.

La mitad de esta longitud se conoce como precision.cuanto mayor sea la longitud de un intervalo, mayor confianza tendremos en que contenga al verdadero valor del parametrocuanto mayor sea la longitud del intervalo, tendremos menos informacion acerca del verdadero valor del parametro

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-20106 / 23

Estimacion por intervalos de confianza

Intervalos bilaterales y unilaterales

Este intervalo de confianza se denomina intervalo bilateral (proporciona los dos extremos del intervalo)

Puede resultar conveniente el calculo de un intervalo unilateral para el extremo inferiorL con L tal que P(L ) = 1 ,

o intervalo unilateral para el extremo superior

Ucon U tal que P( U) = 1

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-20107 / 23

Estimacion por intervalos de confianza

Cantidades pivotales (I)Dada una m.a.s. (X1, ..., Xn) de una poblacion X con distribucion F , siendo = (1, ..., k ), se llama cantidad pivotal para i a una funcion de la muestra (por tanto, es v.a.) y de i , C (X1, ..., Xn; i ), donde i es la unica cantidad desconocida y cuya distribucion no depende de i , ni de ningun otro parametro desconocido.Ejemplo. X N(, ):Sabemos que

X N

.. .,

,o tambien:

X

= n

X

N(0, 1)

n/ n

por tanto, si conocemos ,C (X1, ..., Xn; ) = n

es una cantidad pivotal para .

X

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-20108 / 23

Estimacion por intervalos de confianza

Cantidades pivotales (II)

Elegida una cantidad pivotal C (X1, ..., Xn; i ), podemos construir un intervalo de confianza para i de la siguiente manera:Elegimos dos valores c1 y c2 tales queP (c1 C (X1, ..., Xn; i ) c2) = 1

Despejamos i en ambas desigualdades para obtener los extremos del intervalo L y U.

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-20109 / 23

Estimacion por intervalos bajo normalidadEstimacion de la media poblacional . Varianza conocidaEstimacion de la media. X N(, ), conocida

Queremos estimar a partir de (X1, ..., Xn) mediante un IC del 100(1 ) %

X tiene distribucion N

. ., n

Z = N(0, 1)X /n(cantidad pivotal para )

area =

Area = a22

za/2z/20

z/2

Area = a 2area =

za/22

P(z/2 Z z/2) = P

.z/2

X ./n z/2

= 1

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201010 / 23

Estimacion por intervalos bajo normalidadEstimacion de la media poblacional . Varianza conocidaEstimacion de la media. X N(, ), conocida

Queremos estimar a partir de (X1, ..., Xn) mediante un IC del 100(1 ) %

X tiene distribucion N

. ., n

Z = N(0, 1)X /n(cantidad pivotal para )

area =

Area = a22

za/2z/20

z/2

Area = a 2area =

za/22

. .

PX z/2 n X + z/2 n

= 1

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201010 / 23

Estimacion por intervalos bajo normalidadEstimacion de la media poblacional . Varianza conocidaEstimacion de la media. X N(, ), conocida

Queremos estimar a partir de (X1, ..., Xn) mediante un IC del 100(1 ) %

X tiene distribucion N

. ., n

Z = N(0, 1)X /n(cantidad pivotal para )

area =

Area = a22

za/2z/20

z/2

Area = a 2area =

za/22

L = X z/2 nyU = X + z/2 n

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201010 / 23

Estimacion por intervalos bajo normalidadEstimacion de la media poblacional . Varianza conocida Estimacion de la media. X N(, ), conocida Ejemplo:Cuando una senal que tiene valor es enviada desde un punto A aun punto B, el valor recibido tiene distribucion normal de media y varianza 4 (es decir, al transmitir la senal, se anade un ruido aleatorio de distribucion N(0, 2)). Para reducir el error, se enva el mismo valor 9 veces, de manera que el valor medio recibido esx = 9. Calculemos el intervalo de confianza del 95 % para .

Se tiene: z/2 = z0,05/2 = z0,025 = 1,96, = 2 y n = 9 el intervalo para es.22 .

9 1,96 3 , 9 + 1,96 3

= (7,69, 10,31)

Tenemos una confianza del 95 % de que el verdadero valor enviado este entre 7,69 y 10,31.

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201011 / 23

Estimacion por intervalos bajo normalidadEstimacion de la media poblacional . Varianza conocida Estimacion de la media. X N(, ), conocida Determinacion del tamano muestral para controlar el error deestimacionLongitud del IC100(1) % para :

L = 2 z/2 n

cuanto mayor sea el nivel de confianza, para n y fijos, mayor sera LError que cometemos al estimar un parametro mediante su estimador:

E =| X |

si podemos controlar el tamano muestral, podemos escoger n para tener una confianza del 100(1 ) % de que E sea menor que unacierta cota s:

n = .z/2

.2s

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201012 / 23

Estimacion por intervalos bajo normalidadEstimacion de la media poblacional . Varianza conocidaEstimacion de la media. X N(, ), conocida

Se quiere medir la velocidad de un nuevo modelo de procesador, y para ello se va a ejecutar un programa de simulacion en algunos ordenadores, con dicho modelo incorporado. Suponiendo que la variable aleatoria X , tiempo de ejecucion, es normal, de varianza 9, obtener el tamano muestral necesario para obtener un intervalo de longitud 2 y de nivel de confianza 95 % para el tiempo medio de ejecucion del programa de simulacion.Como la longitud del intervalo es

32

2z/2 n = 2 1,96 n = 1 n = 1,96

9 = 34,57

es decir, n ha de ser 35 para asegurarse una confianza de al menos el 95 %.

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201013 / 23

Estimacion por intervalos bajo normalidadEstimacion de la media poblacional . Varianza desconocida

X /nEstimacion de la media. X N(, ), desconocida Queremos estimar a partir de (X1, ..., Xn) mediante un IC100(1) % Z = no es cantidad pivotal, pues es funcion de dos parametros desconocidos.X

t =sn1/ n

tiene distribucion tn1, ya que:

X

X

2

sn12

X

/n

/n N(0, 1),(n 1)

2 n1,t = s

n1

/n = .

s2

2(n 1) n1n 1

t es una cantidad pivotal para

P(tn1;/2 t tn1 ;/2) = P

.tn1;/2 s

X .

/ n= 1 tn1;/2 n1

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201014 / 23

Estimacion por intervalos bajo normalidadEstimacion de la media poblacional . Varianza desconocida

X /nEstimacion de la media. X N(, ), desconocida Queremos estimar a partir de (X1, ..., Xn) mediante un IC100(1) % Z = no es cantidad pivotal, pues es funcion de dos parametros desconocidos.X

t =sn1/ n

tiene distribucion tn1, ya que:

X

X

2

sn12

X

/n

/n N(0, 1),(n 1)

2 n1,t = s

n1

/n = .

s2

2(n 1) n1n 1

t es una cantidad pivotal para

sn1

sn1

L = X tn1;/2 nyU = X + tn1;/2 n

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201014 / 23

Estimacion por intervalos bajo normalidadEstimacion de la media poblacional . Varianza desconocidaEstimacion de la media. X N(, ), desconocida

Determinacion del tamano muestralLongitud del IC100(1) % para :

sn1

L = 2 tn1;/2 n

Error de estimacion E menor que s si tomamos:

.S .2n =tn1;/2 s

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201015 / 23

Estimacion por intervalos bajo normalidadEstimacion de la diferencia de medias

Estimacion de la diferencia de medias. Poblaciones normales independientes. Varianzas conocidas

(X1, ..., XnX ), (Y1, ..., YnY ) m.a.s. de dos poblaciones normales independientes N(X , X ) y N(Y , X ), respectivamente, con varianzas conocidas.Queremos construir un IC para la diferencia X Y .X Y ( X Y )

Z =.

X 22+ Ynxny

N(0, 1) es cantidad pivotal para la

diferencia X Y .

. 22

. 22

L = X Y z/2

X + YnXnY

yU = X Y + z/2

X + YnXnY

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201016 / 23

Estimacion por intervalos bajo normalidadEstimacion de la diferencia de medias

Estimacion de la diferencia de medias. Poblaciones normales independientes. Varianzas desconocidas e iguales(X1, ..., XnX ) m.a.s. N(X , X ). con 22

(Y1, ..., YnY ) m.a.s. N(Y , X )

X y Y desconocidas e iguales.

Queremos construir un IC para la diferencia X Y .X Y (X Y )

Cantidad pivotal: t =

. 11Sp+nXnY

tnX +nY 2

.con S 2 = (nX 1)sn 1;X +(nY 1)sn 1;Y .

22pn +n 2XY

. 11

nnL = X Y tnX +nY 2;/2 Sp+XY

. 11

U = X Y + tnX +nY 2;/2 Sp

+nXnY

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201017 / 23

Estimacion por intervalos bajo normalidadEstimacion de la diferencia de medias

Ejemplo:Se piensa que los estudiantes de licenciatura de periodismo pueden esperar un mayor salario promedio en su primer trabajo que el que esperan los estudiantes de administracion, y para comprobarlo, se desea construir un intervalo de confianza del 90 % para la diferencia de medias, suponiendo que la varianza en ambos salarios es la misma.Se obtienen dos muestras aleatorias simples de ambos grupos, que proporcionan los siguientes datos:

n1;PnP = 10, xP = 16250, s2

n1;AnA = 14, xA = 15400, s2

= 1187222,22,= 1352307,69.

Se obtiene que Sp = 1133,48, y puesto que tnP +nA2;0,05 = 1,717, se tiene que el intervalo de confianza para la diferencia entre los salarios es(44,135, 1655,865).

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201018 / 23

Estimacion por intervalos bajo normalidadEstimacion de la varianzaEstimacion de la varianza. X N(, ), desconocidaQueremos estimar a partir de (X1, ..., Xn) de una poblacionN(, ), con y desconocidos, mediante un IC del 100(1 ) %

s2Cantidad pivotal para : (n 1) n1 2

2n 1

area = 2

area = 2

2 2n1;1/2n1;/2

.P2

(n 1)

s2n1 2

.= 1

n1;1/2

2n1;/2

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201019 / 23

Estimacion por intervalos bajo normalidadEstimacion de la varianzaEstimacion de la varianza. X N(, ), desconocidaQueremos estimar a partir de (X1, ..., Xn) de una poblacionN(, ), con y desconocidos, mediante un IC del 100(1 ) %

s2Cantidad pivotal para : (n 1) n1 2

2n 1

area = 2

area = 2

2 2n1;1/2n1;/2

L = (n 1)

2

sn12

yU = (n 1) 2

2

sn1

n1;/2

n1;1/2

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201019 / 23

Estimacion por intervalos bajo normalidadEstimacion del cociente de varianzas

Estimacion del cociente de varianzas. Poblaciones normales independientes

(X1, ..., XnX ) y (Y1, ..., YnY ) m.a.s. de dos poblaciones normales independientes N(X , X ) y N(Y , X ), respectivamente.Queremos construir un IC para el cociente 2 /2 .

s2

Cantidad pivotal para : F =Y2n1;X2s2

X/2 2

Y Fn

X

X 1;n

Y 1

X n1;Y /Y

s2 12

yU =FL = n1;Y

sn1;Y

s2n1;X

FnY

1,n

X 1;/2

s2n1;X

nX 1,nY 1;/2

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201020 / 23

Estimacion por intervalos en poblaciones no normalesEstimacion de la media. Varianza conocida

Estimacion de la media. Varianza conocida

Poblacion no normal con varianza conocidaQueremos estimar la media mediante un IC del 100(1 ) %Si tomamos una m.a. (X1, ..., Xn), con n 30, segun el TeoremaCentral del Lmite:

X Z =

n N(0, 1)

/ n

IC asintotico (o aproximado) para :L = X z/2 nyU = X + z/2 n

Para tamanos muestrales pequenos, el intervalo asintotico no es apropiado

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201021 / 23

Estimacion por intervalos en poblaciones no normales desconocida

Estimacion de la media. Varianza desconocida

Poblacion no normal con varianza desconocidaQueremos estimar la media mediante un IC del 100(1 ) %

No podemos utilizar directamente el TCL porque es desconocida, pero si tomamos una m.a.s. (X1, ..., Xn), con n 30, se cumple que:

X t = s2

N(0, 1)

nn1/ n

Intervalo asintotico (o aproximado) para :sn1

sn1

L = X z/2 nyU = X + z/2 n

Para tamanos muestrales pequenos, el intervalo asintotico no es apropiado

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201022 / 23

Estimacion por intervalos en poblaciones no normalesEstimacion de la proporcion en distribuciones binomiales

Estimacion de la proporcion. Poblaciones binomiales

Poblacion binomial con parametro p desconocidoQueremos construir un IC para p

Para una muestra (X1, ..., Xn) el estadstico p = verifica (teorema de DeMoivre-Laplace):

X

, con XB(n, p)n

p p. p(1 p)n

n

N(0, 1)

P p p

.z/2

p(1 p)n

z/2

1

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201023 / 23

Estimacion por intervalos en poblaciones no normalesEstimacion de la proporcion en distribuciones binomiales

Estimacion de la proporcion. Poblaciones binomiales

Poblacion binomial con parametro p desconocidoQueremos construir un IC para p

Para una muestra (X1, ..., Xn) el estadstico p = verifica (teorema de DeMoivre-Laplace):

X

, con XB(n, p)n

p p. p(1 p)n

.. p(1 p)

n

N(0, 1)

. p(1 p) .

Pp z/2

n p p + z/2n

1

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201023 / 23

Estimacion por intervalos en poblaciones no normalesEstimacion de la proporcion en distribuciones binomiales

Estimacion de la proporcion. Poblaciones binomiales

Poblacion binomial con parametro p desconocidoQueremos construir un IC para p

Para una muestra (X1, ..., Xn) el estadstico p = verifica (teorema de DeMoivre-Laplace):

X

, con XB(n, p)n

p p. p(1 p)n

.. p(1 p)

n

N(0, 1)

. p(1 p) .

Pp z/2

n p p + z/2n

1

los lmites del intervalo contienen el parametro desconocido p

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201023 / 23

Estimacion por intervalos en poblaciones no normalesEstimacion de la proporcion en distribuciones binomiales

Estimacion de la proporcion. Poblaciones binomiales

Poblacion binomial con parametro p desconocidoQueremos construir un IC para p

Para una muestra (X1, ..., Xn) el estadstico p = verifica (teorema de DeMoivre-Laplace):

X

, con XB(n, p)n

p p. p(1 p)n

n

N(0, 1)

Sustituyendo p por p:

. p(1 p)

. p(1 p)

L = p z/2

yU = p + z/2nn

Estadstica (Aurora Torrente) 9. Estimacion por intervalos de confianzaCurso 2009-201023 / 23