análisis de extremos -...

Post on 02-Jul-2018

217 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Análisis de extremos

Referencias

• Wilks (sección 4.4.5): “dice mucho, explica poco”

• Coles (2001) “An Introduction to StatisticalModeling of Extreme Values”

Introducción

• Objetivo del análisis de extremos: cuantificar el comportamiento aleatorio de un determinado proceso para valores atípicamente altos o bajos.

• 1ª dificultad se busca estimar la probabilidad de ocurrencia de eventos mayores (o menores) a los observados; i.e. se requieren modelos para “extrapolar” los datos

• Por ejemplo:

Variable aleatoria: “Máxima velocidad de viento anual”:

Máxima velocidad de viento media en 10 min a 10 m de altura registrada cada 1 hora en una determinada estación durante 34 años

0 5 10 15 20 25 30 3510

15

20

25

Años

V [

m/s

]

Se puede estimar la distribución empírica como:

100

101

102

10

15

20

25

Tr = 1/(1-F)

V [

m/s

]

Período de retorno de un valor Zs es el número esperado de observaciones de Z entre dos excedencias consecutivas de Zs.

Si la serie es de datos anuales entonces Tr está en años.

100

101

102

10

15

20

25

Tr = 1/(1-F)

V [

m/s

]

)(1

1

SZZPTr

Interés social: ¿qué valores es esperable que ocurran con alto período de retorno? (inundaciones, sequías, olas de calor, vientos…)

Valores objetivo típicos corresponden a entre 100 y 10.000 años.

100

101

102

10

15

20

25

Tr = 1/(1-F)

V [

m/s

]

?

Introducción

• Objetivo del análisis de extremos: cuantificar el comportamiento aleatorio de un determinado proceso para valores atípicamente altos o bajos.

• 2ª dificultad La información disponible es escasa; por definición se está trabajando con valores atípicos (poco probables).

• Por ejemplo:

De una determinada variable tenemos datos horarios durante varios años

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

x 104

0

10

20

30

0 5 10 15 20 250

500

1000

1500

Introducción

• 2ª dificultad La información disponible es escasa; por definición se está trabajando con valores atípicos (poco probables).

• Muy importante:1) Maximizar el uso de la información

2) Calcular intervalos de

Introducción

• Existen dos aproximación “clásicas” al cálculo de extremos:

(1) Análisis de los máximos alcanzados en un período de tiempo fijo (típicamente máximos anuales)

(2) Análisis de los máximos alcanzados en cada uno de los “eventos extremos” registrados (picos sobre el umbral)

El análisis (1) considera un “evento extremo” por año de registro; en el análisis (2) puede haber años con más de un “evento extremo” y años sin “eventos extremos”.

Máximos anuales

• Coles (2001) capítulo 3 (+ algo de capítulo 2)

Máximos anuales

• Nuestra variable aleatoria va a ser Mn:

con X1,…,Xn una secuencia de variables aleatorias independientes con la misma distribución F(x).

Típicamente Xi son los valores obtenidos al medir un determinado proceso con una frecuencia fija (e.g. datos de viento horarios), y n es la cantidad de datos en una año (e.g. 365 x 24).

Máximos anuales

• En principio la distribución de Mn podría derivarse de la distribución F(x):

… pero pequeños errores en el ajuste de la cola superior se traducen en grandes errores en la distribución de máximos anuales

• Por ejemplo:

De una determinada variable tenemos datos horarios durante varios años se puede ajustar una distribución F(x)

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

x 104

0

10

20

30

0 5 10 15 20 250

500

1000

1500

f(x)

18 20 22 24 26 28 30 32

0

5

10

15

20

¡?

Máximos anuales

• ¿Alternativa? Extremal Type Theorem

Dice que…

…el máximo Mn de n observaciones independientes de Xi tiende a una distribución de probabilidad G(z) fija cuando n tiende a infinito, independientemente de cuál sea la distribución F(x)

La distribución G(z) se denomina distribución generalizada de extremos (GEV distribution).

Máximos anuales

• En la realidad:• n no tiende a infinito

• Las observaciones no son independientes

• La distribución F(x) no necesariamente es estacionaria

• A pesar de lo cual el uso de la distribución GEV a probado ser una herramienta valiosa en el análisis de extremos …

• … siempre y cuando se tenga una comprensión suficiente de los procesos físicos que subyacen a los datos analizados, de modo de aplicar la GEV “con criterio”

Máximos anuales

• Distribución GEV

con

siendo:mu parámetro de posiciónsigma parámetro de escalaxi parámetro de forma

Máximos anuales

• El parámetro de forma (xi) determina si la distribución está acotada o no…

xi = 0 Distribución Tipo I (Gumbel) no acotada

xi > 0 Distribución Tipo II (Frechet o Fisher-Tippett II) con límite inferior

xi < 0 Distribución Tipo III (Weibull) con límite superior

Máximos anuales

• Cálculo de cuantiles

Parea calcular el cuantil de probabilidad de excedencia p (zp), se invierte la distribución G(z), obteniéndose:

Cuando se trabaja con máximos anuales el período de retorno es Tr = 1/p

Máximos anuales• Papel de Gumbel:

Si se define la variable , siendo p la probabilidad de excedencia de zp (G(zp) = 1-p ), entonces el gráfico log(yp) – zp será lineal en el caso de la distribución de Gumbel (xi = 0)

Tipo I: Gumbel

Tipo II: Frechet

Tipo III: Weibull

Máximos anuales

• Ejemplo GEV:

100

101

102

103

10

15

20

25

Período de retorno [años]

Velo

cid

ad d

e v

iento

VW

[m

/s]

Máximos anuales

• Ajuste de los parámetros de la distribución GEV

(1) Máxima verosimilitud

(2) Probability Weighted Moments (PWM; combinación lineal de momentos de la distribución)

Máximos anuales

• Ajuste parámetros GEV mediante máxima verosimilitud

Da resultados adecuados cuando xi>-0,5 (habitual en la práctica) y cuando el número de datos disponible es “grande”

Se buscan los parámetros que maximizan el logaritmo de la función de verosimilitud.

Máximos anuales

En MATLAB el comando es: gevfit

Máximos anuales

• Ajuste parámetros GEV mediante PWM

Da mejor ajuste cuando el número de datos disponible es “chico”

Equivalente al método de los momentos, pero se igualan combinaciones lineales de momentos en lugar de igualar momentos.

Máximos anuales

• Ajuste parámetros GEV mediante PWM

El método no está programado en MATLAB pero es de fácil programación.

Máximos anuales

100

101

102

103

10

15

20

25

Período de retorno [años]

Velo

cid

ad d

e v

iento

VW

[m

/s]

data1

ML

PWM

¿?

Máximos anuales

• Cálculo de intervalos de confianza

(1) Método Delta

(2) Perfil de verosimilitud (profile likelihood)

(3) Métodos basados en Bootstrapping paramétrico (muestreo aleatorio y simulación)

Máximos anuales

• Intervalos de confianza: Método Delta

Asigna a los cuantiles una distribución normal intervalos de confianza simétricos en torno al valor estimado…

… no es realista cuando se extrapola a altos períodos de retorno: se corre el riesgo de subestimar límite superior.

No está programado en MATLAB; puede programarse con cierta facilidad siguiendo Coles (2001, Cap.2)

Máximos anuales

• Intervalos de confianza: Perfil de Verosimilitud

Máximos anuales

• Intervalos de confianza: Perfil de Verosimilitud

Máximos anuales

• Intervalos de confianza: Perfil de Verosimilitud

Máximos anuales

• Intervalos de confianza: Perfil de Verosimilitud

Para usar el perfil de verosimilitud para estimar los intervalos de confianza de los cuantiles de la GEV es necesario expresar uno de los parámetros de la distribución en función del valor del cuantil (ver Coles 2001, Cap 3).

Máximos anuales

• Intervalos de confianza: Perfil de Verosimilitud

Máximos anuales

• Intervalos de confianza: Perfil de Verosimilitud

No está programado en MATLAB

Es posible programarlo siguiendo Coles (2001) capítulos 2 y 3, pero requiere usar funciones de optimización (búsqueda de mínimos) para construir los perfiles de verosimilitud.

Máximos anuales

• Intervalos de confianza: Bootstrapping paramétrico

• Aproximación tradicional; dada GEV ajustada con datos originales:

(1) se simulan N series de igual duración que la serie original

(2) a cada serie se le ajusta una GEV y se calcula el cuantil de interés

(3) se estiman intervalos de confianza a partir de datos generados

Máximos anuales

• Intervalos de confianza: Bootstrapping paramétrico

• Aproximación alternativa; dada GEV ajustada con datos originales:

(1) se estima matriz de covarianza de los parámetros

(2) se simulan N conjuntos de parámetros usando la matriz de covarianza

(3) Se estima el cuantil objetivo con cada conjunto de parámetros

(4) se estiman intervalos de confianza a partir de datos generados

Máximos anuales

• Intervalos de confianza: Bootstrapping paramétrico

No están programados en MATLAB pero son de sencilla programación una vez que se tiene la matriz de covarianza

Máximos anuales

• Intervalos de confianza: Bootstrapping paramétrico

Matriz de covarianza de los parámetros para ajuste ML: función gevlike

Matriz de covarianza de los parámetros para ajuste PWM hay que programarla usando

Máximos anuales

100

101

102

103

10

15

20

25

30

Período de retorno [años]

Velo

cid

ad d

e v

iento

VW

[m

/s]

data1

ML

PWM

Máximos anuales

• Ejemplo: análisis de extremos de la altura de ola significante en la costa de Rocha

X (UTM zona 22H)

Y (

UT

M z

on

a 2

2H

)

ADCP

B11

Profundidad (mWh)

Condición de borde

15

10

20

22.5

20

15

2025

25

22.5

201510

5

25

1510

1.9 2 2.1 2.2 2.3 2.4 2.5 2.6

x 105

6.15

6.16

6.17

6.18

6.19

6.2

6.21

x 106

0

5

10

15

20

25

Máximos anuales

1980 1985 1990 1995 2000 2005 20100

2

4

6

Año

Máxim

o H

m0 A

nual [m

]

Máximos anuales

100

101

102

103

3

4

5

6

7

8

9

Período de retorno [años]

Altura

de o

la s

ignific

ante

espectr

al H

m0 [

m]

Distribución de extremos GEV de Hm0 (Omnidireccional)

Máximos anuales

100

102

2

4

6

8

10

Período de retorno [años]

Altura

de o

la s

ignific

ante

espectr

al H

m0 [

m]

ENE

100

102

2

4

6

8

10

Período de retorno [años]

Altura

de o

la s

ignific

ante

espectr

al H

m0 [

m]

E

100

102

2

4

6

8

10

Período de retorno [años]

Altura

de o

la s

ignific

ante

espectr

al H

m0 [

m]

ESE

100

102

2

4

6

8

10

Período de retorno [años]

Altura

de o

la s

ignific

ante

espectr

al H

m0 [

m]

SE

100

102

2

4

6

8

10

Período de retorno [años]

Altura

de o

la s

ignific

ante

espectr

al H

m0 [

m]

SSE

100

102

2

4

6

8

10

Período de retorno [años]

Altura

de o

la s

ignific

ante

espectr

al H

m0 [

m]

S

100

102

2

4

6

8

10

Período de retorno [años]

Altura

de o

la s

ignific

ante

espectr

al H

m0 [

m]

SSW

Máximos anuales

100

101

102

103

3

4

5

6

7

8

9

10

11

Período de retorno [años]A

ltura

de o

la s

ignific

ante

espectr

al H

m0 [

m]

Distribución de extremos GEV de Hm0 (Direccional)

100

101

102

103

3

4

5

6

7

8

9

Período de retorno [años]

Altura

de o

la s

ignific

ante

espectr

al H

m0 [

m]

Distribución de extremos GEV de Hm0 (Omnidireccional)

top related