tema 4: variables aleatorias ii - uahestadística- biología sanitaria tema 4: variables aleatorias...

12
Tema 4: Variables aleatorias II Estadística- Biología sanitaria Marcos Marvá Ruiz Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 1 / 12

Upload: others

Post on 31-Aug-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Tema 4: Variables aleatorias II - UAHEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 8/12 ElTeoremaCentraldelLímite(1ª versión). Explicacomo

Tema 4: Variables aleatorias II

Estadística- Biología sanitaria

Marcos Marvá Ruiz

Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 1 / 12

Page 2: Tema 4: Variables aleatorias II - UAHEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 8/12 ElTeoremaCentraldelLímite(1ª versión). Explicacomo

Objetivos

Relacionar las variables aleatorias binomial y normal.Presentar la función de densidad de probabilidad de una v.a. continua.Cálculo de probabilidades con una v.a. normal.

Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 2 / 12

Page 3: Tema 4: Variables aleatorias II - UAHEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 8/12 ElTeoremaCentraldelLímite(1ª versión). Explicacomo

¿Qué sucede con la binomial cuando n se hace grande y p es moderado?

GeoGebra

Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 3 / 12

Page 4: Tema 4: Variables aleatorias II - UAHEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 8/12 ElTeoremaCentraldelLímite(1ª versión). Explicacomo

La curva normalde Moivre se preguntó en el s. XVII por la distribución binomial X ∼ B(n, p) cuando:

n grande0 << p << 1

Descubrió que:

P(X = x) ∼ 0 conforme n crece, pero∑n

x=0 P(X = x) = 1.Por eso tiene más sentido preguntarse por P(a ≤ X ≤ b).Hay una función que aproxima muy bien los valores de P(X = x):

P(X = x) ≈ fµ,σ(x) = 1σ√2π

e−12 ( x−µ

σ )2

donde µ = np y σ =√

np(1− p) son el valor esperado y la desviación típica de lavariable binomial X .

Es la distribución normal y su gráfica se llama campana de GaussEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 4 / 12

Page 5: Tema 4: Variables aleatorias II - UAHEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 8/12 ElTeoremaCentraldelLímite(1ª versión). Explicacomo

Función de probabilidad: la normal

La función normal con media µ y desviación típica σ se define:

fµ,σ(x) = 1σ√2π

e−12 ( x−µ

σ )2⇔ X ∼ N(µ, σ)

La gráfica de fµ,σ se llama campana de Gauss

Es simétrica respecto de µCuanto menor es σ el área bajo la curva está menos dispersa.Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 5 / 12

Page 6: Tema 4: Variables aleatorias II - UAHEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 8/12 ElTeoremaCentraldelLímite(1ª versión). Explicacomo

Función de probabilidad: ¿dónde aparece curva la normal?Presión diastólica Framingham

60 80 100 120 140

0.00

0.05

60 80 100 120 140

0.00

0.05

Longitud caparazón "crabs"

10 20 30 40 50

0.00

0.05

10 20 30 40 50

0.00

0.05

Aparentemente, ambas distribuciones son “normales”. . . volveremos sobre esto

Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 6 / 12

Page 7: Tema 4: Variables aleatorias II - UAHEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 8/12 ElTeoremaCentraldelLímite(1ª versión). Explicacomo

La curva normalA la vez, Newton trataba de calcular el área que hay bajo la curva y = f (x)

Demostró que eso es posible y que se puede hacer como límite de la suma de rectánguloscada vez más pequeños que aproximan dicho área. GeoGebra

IDEA: aproximar la prob. binomial (suma) por el área bajo la curva normal (integral)

Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 7 / 12

Page 8: Tema 4: Variables aleatorias II - UAHEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 8/12 ElTeoremaCentraldelLímite(1ª versión). Explicacomo

Si X ∼ B(100, 1/2) y f50, 5(x) es la normal con µ = 50 y σ = 5.

P(39 ≤ X ≤ 46) = P(X = 39) + · · ·+ P(X = 46) ≈∫ 46

39f50, 5(x)dx

sum(dbinom(39:46, size = 100, prob = 0.5))

## [1] 0.2315698

pnorm(46, mean = 50, sd = 5) - pnorm(39, mean = 50, sd = 5)

## [1] 0.197952

Discreto vs continuo: la corrección de Yates

pnorm(46.5, mean = 50, sd = 5) - pnorm(38.5, mean = 50, sd = 5)

## [1] 0.2312395

Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 8 / 12

Page 9: Tema 4: Variables aleatorias II - UAHEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 8/12 ElTeoremaCentraldelLímite(1ª versión). Explicacomo

El Teorema Central del Límite (1ª versión).Explica como aproximar una binomial X ∼ B(n, p) por normal Y ∼ N(µ, σ), donde

µ = n · p, σ = √n · p · q

Entonces, siempre que se cumpla

n · p > 5, n · q > 5

1 La probabilidad puntual

P(X = k) ≈ P(k − 0.5 ≤ Y ≤ k + 0.5)

2 La probabilidad de un intervalo

P(k1 ≤ X ≤ k2) ≈ P(k1 − 0.5 ≤ Y ≤ k2 + 0.5)

3 Del mismo modo

P(X ≤ k) ≈ P(Y ≤ k + 0.5) P(X ≥ k) ≈ P(Y ≤ k − 0.5)

Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 9 / 12

Page 10: Tema 4: Variables aleatorias II - UAHEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 8/12 ElTeoremaCentraldelLímite(1ª versión). Explicacomo

Función de probabilidad y v.a. continua

Una función continua f (x) sirve para calcular probabilidades si estas condiciones:Es no negativa: f (x) ≥ 0 para todo x

El área total bajo la gráfica de f (x) es 1:∫ +∞

−∞f (x)dx = 1

y en ese caso se llama función de densidad de probabilidad.

Si f (x) que cumple las propiedades enteriores se dice que f define una variablealeatoria continua X con función de densidad f .En tal caso la probabilidad de que X pertenezca a un intervalo (a, b) se define así

P(a ≤ X ≤ b) = área bajo la gráfica de f =∫ b

af (x) dx .

Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 10 / 12

Page 11: Tema 4: Variables aleatorias II - UAHEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 8/12 ElTeoremaCentraldelLímite(1ª versión). Explicacomo

Función de probabilidad

Ejemplo: La función f (x) =√2

(6

((x − 3)4 + 1) + 3((x + 5)4 + 1)

)es una función de

densidad continua. Comprueba que su integral de −∞ a ∞ es 1 con Wolfram Alpha:

integrate f(x) = (sqrt(2) / (9 pi)) * (6 / ((x - 3)^4 + 1) + 3 / ((x + 5)^4 + 1)) from -oo to oo

La gráfica de esta función es:

Usemos Wolfram Alpha para calcular tres probabilidades:

P(−6 < x < 4) ≈ 0.26034. Usa este enlaceP(1 < x < 5) ≈ 0.642484. Usa este enlaceP(−2 < x < 0) ≈ 0.0043287. Usa este enlaceEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 11 / 12

Page 12: Tema 4: Variables aleatorias II - UAHEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 8/12 ElTeoremaCentraldelLímite(1ª versión). Explicacomo

Ejemplo: cálculo de probabilidades con la curva normalEn crabs, la media es 32.1 y la desviación típica 7.1.

Si X=“longitud del caparazón de un cangrejo elegido al azar” ∼ N(µ = 32.1, σ = 7.1)

Cálculo con GeoGebra

Cálculo con R

pnorm(32, mean = 32.1, sd = 7.12) - pnorm(20, mean = 32.1, sd = 7.12)

## [1] 0.4497787

Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 12 / 12