estadÍstica 1o cc. ambientales [3 mm] tema 3:...

43
ESTAD ´ ISTICA 1 o CC. Ambientales Tema 3: Estimaci´ on puntual y por intervalos I Muestra aleatoria. Inferencia estad´ ıstica param´ etrica I Estimaci´ on puntual I Intervalos de confianza I Distribuciones asociadas a la normal I Intervalos de confianza en poblaciones normales I Intervalos de confianza para otras distribuciones Estad´ ıstica (Ambientales). Profesora: Amparo Ba´ ıllo Tema 3: Estimaci´ on puntual y por intervalos 1

Upload: haduong

Post on 03-May-2018

215 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

ESTADISTICA1o CC. Ambientales

Tema 3: Estimacion puntualy por intervalos

I Muestra aleatoria. Inferencia estadıstica parametrica

I Estimacion puntual

I Intervalos de confianza

I Distribuciones asociadas a la normal

I Intervalos de confianza en poblaciones normales

I Intervalos de confianza para otras distribuciones

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 1

Page 2: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Muestra aleatoriaInferencia estadıstica parametrica

Inconveniente: La distribucion de probabilidad de la v.a. X deinteres suele ser desconocida.

Objetivo: Estudiar una v.a. numerica X en una poblacion a partirde la informacion contenida en una muestra aleatoria de individuosde esa poblacion.

Una muestra aleatoria (simple) de tamano n de X es una coleccionX1, . . . ,Xn tal que

• cada Xi tiene la misma distribucion de probabilidad que X ;

• las v.a. X1, . . . ,Xn son independientes entre sı.

Extraeremos informacion acerca de la distribucion de probabilidadde X , que es desconocida, a partir de la muestra X1, . . . ,Xn de X .

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 2

Page 3: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Simplificacion del problema → Estadıstica parametrica:

Supondremos que la distribucion de probabilidad de X pertenece auna familia parametrica de distribuciones concreta (Poisson,normal, . . . ). En este caso, para determinar totalmente ladistribucion de X solo queda especificar el valor de uno o variosparametros (λ para la Poisson, µ y σ para la normal).

Los parametros que nos van a interesar en este curso son:

• Media y Varianza poblacional (µ y σ2) cuando X ∼ N(µ, σ).

• Proporcion p de individuos de una poblacion que presentancierta caracterıstica.

• Media poblacional (λ) cuando X ∼ Poisson(λ).

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 3

Page 4: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Notacion en inferencia parametrica:

Parametro: θEspacio parametrico: Θ, conjunto de posibles valores del parametroSi X es discreta: funcion de masa Pθ.Si X es continua: funcion de densidad fθ.

Partes de la inferencia parametrica:

• Estimacion puntual: Estimar los parametros desconocidosa partir de la informacion de la muestra aleatoria X1, . . . ,Xn.

• Estimacion por intervalos de confianza

• Contrastes de hipotesis parametricas

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 4

Page 5: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Estimacion puntual

Un estimador puntual, θ, de un parametro θ es una funcion real dela muestra, X1, . . . ,Xn, que aproxima el valor de θ. Es aleatorio.

Una estimacion (puntual) es el valor numerico concreto que tomaun estimador al ser aplicado a una realizacion muestral x1, . . . , xnconcreta observada.

Tanto el estimador como la estimacion se denotan utilizando elsımbolo: (p.e. µ, σ, p, λ) .

Estimadores naturales de la media y varianza poblacional (µ y σ2):

• Media muestral: µ = X =X1 + · · ·+ Xn

n=

1

n

n∑i=1

Xi

• Varianza muestral: σ2 = S2 =1

n − 1

n∑i=1

(Xi − X )2

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 5

Page 6: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Determina en estos ejemplos el parametro poblacional de interes,su correspondiente estimador y la estimacion a partir de los datos.

Ejemplo 3.1: Se esta estudiando la presencia de ciertomicroorganismo letal en el aire. En uno de los experimentos seanalizaron 35 muestras aleatorias y se observo que 6 de ellascontenıan el germen.

Ejemplo 3.2: Un laboratorio examina el contenido de azufre enun yacimiento de carbon en Texas. Debido a imprecisiones en losaparatos, las medidas tienen distribucion normal. Se toman 10muestras aleatorias del yacimiento y se analizan. La mediaobservada es 0.88.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 6

Page 7: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Un mismo estimador puede tomar diferentes valores numericos(diferentes estimaciones), ya que su valor depende totalmente dela muestra concreta observada.

Ejemplo 3.2 (cont.): Los valores observados de azufre fueron:

0.73 0.80 0.90 1.24 0.82 0.72 0.57 1.18 0.54 1.30

x = s2 =

Se vuelve al mismo yacimiento y se recogen otras muestrasdiferentes, obteniendose los siguientes contenidos en azufre:

1.56 1.22 1.32 1.39 1.33 1.54 1.04 2.25 1.49 1.28

x = s2 =

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 7

Page 8: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Antes de la observacion:

X1, . . . ,Xn −→

XS2

T = T (X1, . . . ,Xn)son v.a.’s

Si tomo observaciones concretas de la poblacion:

x1, . . . , xn −→

xs2

t = T (x1, . . . , xn)son numeros.

Si tomo nuevas observaciones de la poblacion:

x1, . . . , xn −→

¯xs2

t = T (x1, . . . , xn)son otros numeros.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 8

Page 9: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Sea X1, . . . ,Xn una muestra aleatoria de una poblacion X cuyadistribucion de probabilidad es conocida pero depende de unparametro desconocido θ = (θ1, . . . , θk).

Objetivos de la estimacion puntual:

• Aproximar/estimar el valor de θ mediante estimadores θ.

• Estudiar metodos para hallar estimadores.

• Decidir que estimadores son razonables.

Si X es una v.a. discreta, la funcion de masa de la muestra es:

P(x1, . . . , xn) = P{X1 = x1, . . . ,Xn = xn} = P(x1) · · ·P(xn)

Si X es continua con densidad f , la funcion de densidad de lamuestra es:

f (x1, . . . , xn) = f (x1) · · · f (xn)

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 9

Page 10: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Construccion de estimadores puntuales

1. Metodo de los momentos

El estimador por el metodo de los momentos, θ = (θ1, . . . , θk), seobtiene al resolver el sistema

Eθ[X ] = 1n

∑ni=1 Xi ,

Eθ[X 2] = 1n

∑ni=1 X

2i ,

· · ·

Eθ[X k ] = 1n

∑ni=1 X

ki

Observacion: Presenta el inconveniente de que la solucion puedeno pertenecer al espacio parametrico.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 10

Page 11: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

2. Metodo de maxima verosimilitud (MV)

Dada la muestra x1, . . . , xn, la funcion de verosimilitud es

L(θ) = L(θ; x1, . . . , xn) =

{Pθ(x1) · · ·Pθ(xn) si X es discretafθ(x1) · · · fθ(xn) si X es continua

Mide lo verosımil que es el valor de un parametro θ = (θ1, . . . , θk)teniendo en cuenta la muestra observada.

El estimador de maxima verosimilitud (emv), θ = (θ1, . . . , θk), esel punto de maximo de la verosimilitud L(θ), que coincide con elpunto de maximo de log(L(θ)).

En la practica, para hallar el emv, resolvemos el sistema deecuaciones

∂ ln(L(θ))

∂θ1= 0 , . . . ,

∂ ln(L(θ))

∂θk= 0.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 11

Page 12: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplo 3.3: Un metodo para estudiar las sustancias que causanmutaciones consiste en matar a ratones hembra 17 dıas despues deaparearse y examinar sus uteros en busca de embriones muertos.La tabla que sigue proporciona datos de 309 hembras.

No embriones Recuentomuertos de hembras

0 1251 1132 523 134 45 16 1

7 o mas 0Total 309

No embriones Frecuencia Probabilidadmuertos relativa Poisson

0 0.405 eλ

1 0.366 eλλ

2 0.168 eλλ2/2

3 0.042 eλλ3/3!

4 0.013 eλλ4/4!

5 0.003 eλλ5/5!

6 0.003 eλλ6/6!

7 o mas 0 eλλ7/7!

0 1 2 3 4 5 6 7 8 9

0.0

0.1

0.2

0.3

0.4

Frecuencia relativa

Distribución de Poisson

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 12

Page 13: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplos importantes:

Distribucion de X emv

Bernoulli(p) p = x

Poisson(λ) λ = x

N(µ,σ) µ = x

σ2 =n − 1

ns2

Ejemplo 3.3 (cont.): λ = x = 0.91586

No embriones Frecuencia Probabilidadmuertos relativa Poisson

0 0.405 0.4001 0.366 0.3672 0.168 0.1693 0.042 0.0514 0.013 0.0125 0.003 0.0026 0.003 0.000

7 o mas 0 0.000

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 13

Page 14: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Sesgo y Error Cuadratico Medio

Una medida del comportamiento del estimador θ es su errorcuadratico medio (ECM)

E[(θ − θ)2

]= Vθ(θ) + (Sesgo(θ))2,

siendo Sesgo(θ) = E (θ)− θ.

Si E (θ) = θ se dice que el estimador θ es insesgado.

Sesgo

Sesgo(θ) = E(θ)− θ.Un buen estimador debe ser insesgado o tener un sesgo pequeno.

Estimador insesgado:

13.2. Insesgadez

Insesgadez

θ

5

θ

θ

Sesgo positivo:

13.2. Insesgadez

Insesgadez

θ

5

θ

θ

Sesgo negativo:

13.2. Insesgadez

Insesgadez

θ

5

θ

θ

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 14

Page 15: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Propiedades de la media muestral X :

Sea X1, . . . ,Xn una muestra aleatoria de una v.a. X con E (X ) = µy varianza V (X ) = σ2.

• Si X tiene distribucion normal, entonces la distribucion de losvalores que toma X es tambien normal.

Si X ∼ N(µ, σ) =⇒ X ∼ N

(µ,

σ√n

).

• Teorema central del lımite (TCL): Si n es grande, ladistribucion de X es aproximadamente normal aunque X nosea normal.

Si n es grande =⇒ Xaprox∼ N

(µ,

σ√n

).

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 15

Page 16: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Distribucion de la media muestral

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 16

Page 17: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplo 3.4: De acuerdo con la Organizacion Mundial de laSalud un individuo tiene sobrepeso si su ındice de masa corporal(IMC) es superior a 25. Se sabe que el IMC de una poblacion esuna variable con distribucion normal de media µ = 26 y desviaciontıpica σ = 6. Si se seleccionan aleatoriamente 100 individuos y secalcula la media de sus IMC, ¿cual es la probabilidad de que estamedia sea superior a 25.5?

Otras propiedades: Sea X1, · · · ,Xn una muestra aleatoria de unav.a. X con media y varianza poblacional µ y σ2 respectivamente

• La media muestral X es un estimador insesgado de la mediade la poblacion: E (X ) = µ.

• La varianza muestral S2X es un estimador insesgado de la

varianza de la poblacion: E (S2X ) = σ2.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 17

Page 18: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Error tıpico o relativo

El error tıpico de un estimador es su desviacion tıpica (o unaestimacion de la misma).

El error tıpico de la media X es su desviacion tıpica,

se(X ) =σ√n

pero en la practica σ es un parametro poblacional desconocido.

Resulta natural estimar σ2 con la varianza muestral s2. Losprogramas informaticos proporcionan el siguiente error tıpico de lamedia muestral

se(X ) =s√n.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 18

Page 19: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplo 1.2 (cont.): Contaminacion por Hg en el pescado

Estadísticos descriptivos

N Mínimo Máximo MediaDesviación

estándar

Estadístico Estadístico Estadístico EstadísticoError

estándar Estadístico

LONG

N válido (por lista)

171 25,2 65,0 39,971 ,6513 8,5172

171

Página 1

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 19

Page 20: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplo 3.5: En SPSS se pueden generar observaciones aleatorias dealgunas distribuciones, por ejemplo, generamos una muestra de tamano20 de una N(2,1). Pinchamos en Transformar -> Calcular variable

Estadísticos descriptivos

N MediaDesviación

estándar

Estadístico EstadísticoError

estándar Estadístico

X

N válido (por lista)

20 1,6618 ,22998 1,02850

20

Página 1

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 20

Page 21: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Intervalos de confianza

Sea X1, . . . ,Xn una muestra aleatoria de una poblacion X confuncion de distribucion Fθ, siendo θ un parametro desconocido.

Fijamos 0 < α < 1. Sea (T1,T2) un intervalo tal queTi = Ti (X1, . . . ,Xn) para i = 1, 2 y

1− α = Pθ{T1(X1, . . . ,Xn) < θ < T2(X1, . . . ,Xn)}= Pθ{θ ∈ (T1,T2)}.

Entonces, para cada observacion (x1, . . . , xn) de la muestra, elintervalo IC0.95(θ) = (T1(x1, . . . , xn),T2(x1, . . . , xn)) es unintervalo de confianza para θ al nivel de confianza 1− α.

El nivel de significancia α es la probabilidad de equivocarnos alafirmar que el parametro se encuentra en el IC obtenido:

α = Pθ{θ /∈ (T1,T2)}.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 21

Page 22: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Construccion de un intervalo de confianza:

• Buscamos una cantidad pivotal para θ, que es una funcionC (X1, . . . ,Xn; θ) cuya distribucion no depende de θ.

Ejemplo 3.6: Sea (X1, . . . ,X10) una muestra aleatoria deX ∼ N(µ, 1). Entonces una cantidad pivotal para µ es

• A continuacion buscamos dos valores c1 y c2 tales que

Pθ{c1 < C (X1, . . . ,Xn; θ) < c2} = 1− α.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 22

Page 23: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplo 3.6 (cont.):

• Finalmente se despeja θ de la desigualdad c1<C (X1, . . . ,Xn; θ)<c2.

Ejemplo 3.6 (cont.):

Para la muestra 1.7 2.1 2.3 2.4 1.9 1.6 2.0 2.1 2.1 1.8tenemos x = e IC0.95(µ) =

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 23

Page 24: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Habitualmente se trabaja con niveles de confianza del 90 %(α = 0.1), del 95 % (α = 0.05) y del 99 % (α = 0.01).

Si se observan 100 muestras de tamano n de X ∼ Fθ y seconstruyen los correspondientes 100 intervalos de confianza para θ,IC1−α(θ), aproximadamente en (1− α)100 de ellos esta elparametro desconocido θ:

x(1)1 , . . . , x

(1)n → IC

(1)1−α(θ)

x(2)1 , . . . , x

(2)n → IC

(2)1−α(θ)

...

x(100)1 , . . . , x

(100)n → IC

(100)1−α (θ)

Ver fichero Excel 100Ics.xlxs.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 24

Page 25: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Distribuciones asociadas a la normal

Son distribuciones de probabilidad de ciertos estadısticosconstruidos a partir de muestras de distribuciones normales.

La distribucion χ2 de Pearson

Sean X1, . . . ,Xn v.a. independientes identicamente distribuidas(i.i.d.) con distribucion N(0, 1). La variable aleatoria

∑ni=1 X

2i

sigue una distribucion χ2 de Pearson con n grados de libertad:n∑

i=1

X 2i ∼ χ2

n

0 2 4 6 80

0.2

0.4

0.6

0.8

1

Densidad de la χ2n

χ21

χ22

χ23

χ24

χ25

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 25

Page 26: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

La distribucion t de Student

Sean Y ,X1, . . . ,Xn v.a.i.i.d. con distribucion N(0, 1). La variable

aleatoriaY√

1n

∑ni=1 X

2i

sigue una distribucion t de Student con n

grados de libertad, tn.

−5 0 50

0.1

0.2

0.3

0.4

Densidad de la t

N(0,1)t5

t2

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 26

Page 27: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

La distribucion F de Fisher

Sean X1, . . . ,Xm,Y1, . . . ,Yn v.a.i.i.d. con distribucion N(0, 1). Lav.a.

1m

∑mi=1 X

2i

1n

∑nj=1 Y

2j

sigue una distribucion F de Fisher con m y n grados de libertad,Fm,n.

0 1 2 3 4 5 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7Densidad de la F

F5,3

F4,6

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 27

Page 28: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Intervalos de confianza en poblaciones normales

Propiedad: Sea X1, . . . ,Xn una muestra aleatoria de X ∼ N(µ, σ).Entonces X y S2 son v.a. independientes,

X ∼ N

(µ,

σ√n

),

n − 1

σ2S2 ∼ χ2

n−1 yX − µ

S√n

∼ tn−1

• Sea x1, . . . , xn una muestra de X ∼ N(µ, σ). Si σ es conocido unintervalo de confianza para µ al nivel de confianza 1− α es

IC1−α(µ) =

(x − zα/2

σ√n, x + zα/2

σ√n

)=

(x ∓ zα/2

σ√n

).

• Si σ es desconocido, IC1−α(µ) =

(x ∓ tn−1;α/2

s√n

)y

IC1−α(σ2) =

((n − 1)s2

χ2n−1;α/2

,(n − 1)s2

χ2n−1;1−α/2

,

).

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 28

Page 29: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplo 3.7: El envenenamiento por DDT causa temblores yconvulsiones. En un estudio se ha administrado una dosis de DDTa 4 ratones y se ha medido posteriormente en cada uno el periodoabsolutamente refractario, es decir, el tiempo que tardan susnervios en recuperarse tras un estımulo:

1.7 1.6 1.8 1.9 (en milisegundos)

Asumiendo normalidad en los datos:

(a) Estima el periodo absolutamente refractario medio µ paratoda la poblacion de ratones de la misma cepa sujeta almismo tratamiento con DDT.

La estimacion de µ es la media muestral: µ ≈ µ = x

x =1.7 + 1.6 + 1.8 + 1.9

4= 1.75.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 29

Page 30: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplo 3.7 (cont.)

(b) Halla el error tıpico de la estimacion anterior.

s2 =(1.7− 1.75)2 + (1.6− 1.75)2 + (1.8− 1.75)2 + (1.9− 1.75)2

3= 0.017

Por tanto s =√

0.017 ≈ 0.13 y se(x)=sx√n

=0.13

2= 0.065.

(c) Calcula un intervalo de confianza para µ al 90 %.

IC90 %(µ) = [1.75∓t3;0.05·0.065] = [1.75∓2.353·0.065] = [1.597 , 1.903]

es decir, 1.597 ≤ µ ≤ 1.903 con un nivel de confianza del 90 %.

(d) Calcula otro intervalo, pero ahora con un nivel del 95 %.

IC95 %(µ) = [1.75∓t3;0.025·0.065] = [1.75∓3.182·0.065] = [1.543 , 1.957]

es decir, 1.543 ≤ µ ≤ 1.957 con un nivel de confianza del 95 %.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 30

Page 31: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplo 3.8: Un aumento de la concentracion de colesterol en lasangre contribuye a dificultar su circulacion y, a la larga, producirenfermedades cardıacas y circulatorias graves. Se ha recogido unamuestra aleatoria de siete personas con niveles de Colesterol LDL

1.5 2.1 1.9 2.3 2.5 3.2 3.0 (dg/dl)

Utilizando estos datos, construye un intervalo de confianza al 90 %para la desviacion tıpica.Nota: suponer normalidad en los datos.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 31

Page 32: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplo 3.5 (cont.): Con SPSS calculamos un IC de la mediapara los datos generados de una normal

Descriptivos

Estadístico Error estándar

X Media

95% de intervalo de confianza para la media

Límite inferior

Límite superior

Media recortada al 5%

Mediana

Varianza

Desviación estándar

Mínimo

Máximo

Rango

Rango intercuartil

Asimetría

Curtosis

1,6618 ,22998

1,1805

2,1432

1,6366

1,6712

1,058

1,02850

,14

3,63

3,49

1,53

,305 ,512

-,523 ,992

Página 1

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 32

Page 33: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

• Sean x1, . . . , xm e y1, . . . , yn muestras independientes deX ∼ N(µ1, σ) e Y ∼ N(µ2, σ) respectivamente (σ desconocido).Entonces

IC1−α(µ1 − µ2) =

(x − y ∓ tm+n−2;α/2 sp

√1

m+

1

n

),

donde la varianza combinada

s2p =

(m − 1)s21 + (n − 1)s2

2

m + n − 2

es una media ponderada de las cuasivarianzas muestrales

s21 =

1

m − 1

m∑i=1

(xi − x)2 y s22 =

1

n − 1

n∑i=1

(yi − y)2.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 33

Page 34: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplo 3.9: Se quiere comparar la grasa corporal (en kg) entrenadadoras y corredoras olımpicas. Se observan los siguientes datos:

Corredoras Nadadoras11.2 7.6 8.2 9.2 14.1 12.7 9.2 10.710.1 7.3 3.7 5.5 15.1 13.7 8.7 14.3

9.4 6.9 8.3 5.0 11.4 11.9

Suponiendo que estas variables siguen distribuciones normaleshomocedasticas, calcular un intervalo de confianza para ladiferencia media de grasa entre ambos tipos de deportistas.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 34

Page 35: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

• Sean x1, . . . , xm e y1, . . . , yn muestras aleatorias independientesde X ∼ N(µ1, σ1) e Y ∼ N(µ2, σ2) respectivamente (σ1 y σ2

desconocidas). Entonces

IC1−α

(σ2

1

σ22

)=

(s2

1/s22

Fm−1;n−1;α/2,

s21/s

22

Fm−1;n−1;1−α/2

).

Observacion: Fm;n;1−α =1

Fn;m;α

Ejemplo 3.9 (cont.): Suponiendo que la distribucion de la grasacorporal en nadadoras y corredoras es normal con distintas mediasy distintas varianzas, calcular un intervalo de confianza al 90 %para el cociente de las varianzas.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 35

Page 36: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

• Datos emparejados: Sea (X1,Y1), . . . , (Xn,Yn) una muestraaleatoria de (X ,Y ) donde X e Y no son independientes, pero lospares (Xi ,Yi ) son independientes entre sı.

Denotemos E (X ) = µ1 y E (Y ) = µ2 y supongamos queD = X − Y ∼ N(µ = µ1 − µ2, σ). EntoncesD1 = X1 − Y1, . . . ,Dn = Xn − Yn es una muestra aleatoria de D.

Podemos construir intervalos de confianza para µ = µ1 − µ2 y paraσ como se indico en la pagina 28.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 36

Page 37: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplo 3.10: Ensayo clınico cruzado. Se quiere comparar elefecto X de un nuevo medicamento con el efecto Y de otro yacomercializado. Se administran ambos a 14 personas coninsuficiencia respiratoria, asignando aleatoriamente a cada pacienteun tratamiento, y manteniendolo durante un mes. Luego se le da eltratamiento alternativo durante otro mes. En la cuarta semana decada tratamiento se observa FEV1 (forced expiratory volume), elvolumen de aire que un paciente expulsa en un segundo, tras unainhalacion profunda.

Paciente X Y D Paciente X Y D1 2.9 3.9 -1.0 8 3.9 2.4 1.52 4.0 3.9 0.1 9 2.5 3.6 -1.13 3.4 3.3 0.1 10 6.5 2.1 4.44 3.2 4.3 -1.1 11 5.5 4.0 1.55 3.8 3.2 0.6 12 4.0 3.9 0.16 5.2 3.5 1.7 13 5.3 4.0 1.37 3.9 2.7 1.2 14 4.3 2.3 2.0

Calcular un intervalo de confianza al 90 % para la diferencia mediade FEV1 con ambos medicamentos.Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 37

Page 38: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Intervalos de confianza para otras distribuciones

Intervalo de confianza para el parametro p de una Bernoulli

Sea x1, . . . , xn una muestra de X∼Bernoulli(p). Entonces

IC1−α(p) =

(x ∓ zα/2

√x(1− x)

n

)(para n grande)

Intervalo para diferencia de proporciones de Bernoullis

Sean x1, . . . , xm e y1, . . . , yn muestras de X ∼ Bernoulli(p1) eY ∼ Bernoulli(p2) respectivamente, tal que p1 = x y p2 = y .Entonces, para m y n grandes,

IC1−α(p1 − p2) =

(x − y ∓ zα/2

√x(1− x)

m+

y(1− y)

n

)

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 38

Page 39: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplo 3.11: Koshy et al. (2010)1 estudian el efecto deltabaquismo de los padres sobre el ındice de masculinidad, tambienllamado razon de sexo, la razon de hombres por mujeres en undeterminado territorio, expresada en tanto por ciento. Para ellotoman una muestra de 363 nacimientos de padres fumadorescronicos (ambos) en la que 158 bebes fueron varones y el restoninas. Calcular un intervalo de confianza para la proporcion devarones nacidos de ambos padres fumadores cronicos.

1Koshy et al. (2010). Parental smoking and increased likelihood of femalebirths. Annals of Human Biology.Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 39

Page 40: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplo 3.12: Un laboratorio farmaceutico desarrolla un nuevomedicamento para prevenir los resfriados. La companıa afirma queel producto es igual de efectivo en hombres que en mujeres. Paracomprobarlo observan una muestra de 100 mujeres y 200 hombressobre los que prueban el medicamento. Al final del estudio un 38 %y un 51 % respectivamente de las mujeres y hombres de la muestrase habıan resfriado.Calcular un intervalo de confianza al 95 % para la diferencia entrela proporcion de mujeres y la de hombres que se resfrıan aunhabiendo tomado el medicamento.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 40

Page 41: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Intervalo de confianza para el parametro λ de una Poisson

Sea x1, . . . , xn una muestra de X ∼ Pois(λ). Recordemos queE (X ) = V (X ) = λ y λ = x . Entonces, para n grande,

IC1−α(λ) =

(x ∓ zα/2

√x

n

).

Ejemplo 3.3 (cont.): Calcular un intervalo de confianza al 95 %para el parametro λ.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 41

Page 42: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Mınimo tamano muestral

El error cometido al estimar un parametro θ mediante un intervalode confianza IC1−α(θ) es la semi-amplitud del intervalo.

Observacion: Esta definicion tiene sentido principalmente enintervalos del tipo IC1−α(θ) = (θ ∓ semilongitud).

Objetivo: Determinar el mınimo tamano muestral n necesario paraque el error cometido al estimar θ mediante un intervalo deconfianza sea menor que una cierta cantidad.

Motivacion: Queremos que la estimacion por intervalo deconfianza tenga una determinada precision.

El valor de n obtenido debe tomarse como orientativo,especialmente cuando la semilongitud del intervalo dependa de lamuestra observada.

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 42

Page 43: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional

Ejemplo 3.13: Se quiere estimar la proporcion de manatıes en elCaribe que han sido heridos por helices de barcos. ¿A cuantosmanatıes tendremos que examinar para asegurar que la estimaciontiene un error maximo del 10 % con un nivel de confianza del95 %?

Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 43