modelizaciÓn de distribuciones
DESCRIPTION
MODELIZACIÓN DE DISTRIBUCIONES. 1 . FUNCIONES DE PROBABILIDAD. 1.1 DISTRIBUCIONES DE PROBABILIDAD. 1.2 RELACIONES ENTRE DISTRIBUCIONES DE PROBABILIDAD ESPECÍFICAS. Normal: n N(, 2 ) Normal estándar: z N(0,1) Chi-cuadrado: x X 2 (g) Si z i N(0,1) son independientes => - PowerPoint PPT PresentationTRANSCRIPT
RATS
MODELIZACIÓN DE MODELIZACIÓN DE DISTRIBUCIONES DISTRIBUCIONES
RATS
11. FUNCIONES DE . FUNCIONES DE PROBABILIDAD PROBABILIDAD
RATS
1.1 DISTRIBUCIONES DE PROBABILIDAD
• F u n c i ó n d e D e n s i d a d f ( x ) :– V a r i a b l e a l e a t o r i a d i s c r e t a :
f ( x 0 ) = P r o b ( x = x 0 )– V a r i a b l e a l e a t o r i a c o n t i n u a :
1
0
)(10
x
xdxxfxxxProb
• F u n c i ó n d e D i s t r i b u c i ó n F ( x ) :– V a r i a b l e a l e a t o r i a d i s c r e t a :
0
)( )( 00xx
xfxxProbxF
– V a r i a b l e a l e a t o r i a c o n t i n u a :
0
)( )( 00
xxfxxProbxF
RATS
1.2 RELACIONES ENTRE DISTRIBUCIONES DE PROBABILIDAD
ESPECÍFICAS• Normal: nN(, 2)
• Normal estándar: zN(0,1)
• Chi-cuadrado: x X2(g) Si zi N(0,1) son independientes =>
• F-snedecor: f F(g1 , g2)
Si xi X2(gi ) son independientes =>
• t-student: t t(g) Si z N(0,1) y x X2(g ) son independientes =>
n
z
g
iizx
1
2
22
11
/
/
gx
gxf
gx
zt
/
RATS
1.3 FUNCIONES DE DISTRIBUCIÓN EMPÍRICAS NO PARAMÉTRICAS
• Histograma: Diagrama de frecuencia relativas. No es una función continua (no se solapan los intervalos) y depende del número de puntos (o unidad de medida) en que centremos cada estimación x0.
– En dónde I(·) es la función Indicador:
;2
1
2
11)(ˆ
1000
N
ii xxxI
Nxf
falsaessicondiciónlaciertaessiI 0;1
RATS
• Mediante funciones núcleo (Kernel): La
función K(·) supone una medida de la densidad o “importancia” relativa de las observaciones entorno al punto de referencia x0.
• La función se va desplazando por el número de puntos de la muestra (N), de forma que consigue una curva continua.
N
i
i
h
xxK
Nhxf
1
00
1)(ˆ
RATS
• Respecto a la ponderación de los puntos de la muestra
que entran en
1.- Depende del tamaño de la ventana (h).
Conforme , más alisada será la forma de la curva de , pero estará menos ponderada la importancia del punto de referencia x0 (estará menos concentrada la probabilidad entorno al punto x0), con lo cual será menos exacta. Existe un trade-off entre exactitud y suavidad de la curva.
2.- El tipo de ponderación depende del tipo de núcleo o Kernel K(·).
)(ˆ0xf
h)(ˆ
0xf
RATS
• Algunos tipos de núcleo o Kernel K(v);
N O M B R E F O R M A F U N C I O N A L
E p a n e c h n i k o v 1175,0)( 2 vIvvk
C u a d r á t i c o 1116
15)(
22 vIvvk
T r i a n g u l a r 11)( vIvvk
G a u s s i a n o o N o r m a l 2
2
1
2
1)(
vevk
U n i f o r m e o R e c t a n g u l a r 1
2
1)( vIvk
h
xxv i 0
RATS
Tipos de núcleos o Kernels:
1: Cuadrático;
2: Triangular;
3: Epanechnikov;
4: Gaussiano o Normal;
5: Uniforme o rectangular.
RATS
• Respecto a la elección del tipo de núcleo o Kernel K(·), cabe decir que se ha demostrado que aquel más eficiente es el de Epanechnikov, pero la diferencia de la entre una u otra forma funcional, no resulta tan relevante en la práctica.
)(ˆ0xf
RATS
• No pasa lo mismo con la elección del tamaño de la ventana h, que puede producir una estimación de sesgada o con una alta variablidad. Silverman propone un tamaño de h óptimo que pretende equilibrar dicho trade-off:
– Dónde RIQ en es rango intercuartílico (diferencia entre la observación del percentil 75 y del percentil 25), y es la desviación típica de la serie x.
– Nota: el h que se utiliza por defecto en RATS no depende de N,
; en EViews utiliza el h de Silverman, ponderado con un parámetro que difiere entre K(·).
)(ˆ0xf
5
1
RIQ1.34
1 ,σ̂9.0
Nminh n
σ̂
RIQ41h
RATS
2.2. MODELIZACIÓN DE MODELIZACIÓN DE DISTRIBUCIONES DISTRIBUCIONES
USANDOUSANDO WinRATSWinRATS v5.0 v5.0
RATS
Instrucción DENSITY:DENSITY (opciones) serie inicio fin nombre_serie_eje
nombre_serie_densidad
• Estima la función de densidad de una serie aleatoria de datos. Puede ser mediante la utilización de funciones Kernel o un Histograma.– Opciones:
» TYPE=[EPANECHNIKOV]/TRIANGULAR/GAUSSIAN/
/HISTOGRAM » BANDWITH=h » Por defecto:
» GRID=[AUTOMATIC] » Escalona el eje de ordenadas en 100 unidades
equidistantes que representan la amplitud de la muestra. /INPUT » Serie que se introduzca
RIQ41h
RATS
Instrucción ACCUMULATE:ACCUMULATE(Opciones) serie inicio fin nueva_serie nuevo_inicio
• Realiza la suma la parcial de serie y guarda los resultados en nueva_serie .
– Opciones:» SCALE/[NOSCALE] » Divide los datos de entrada de la
nueva_serie por la suma total, de forma que acaba con el valor 1.0
RATS
FUNCIONES
• %RAN(s) » Junto con la instrucción SET genera una serie de datos ‘aleatorios’ de distribución normal con media 0 desviación típica s nN(0, s 2)
• SQRT(x) » Devuelve el valor de la raíz cuadrada de x
RATS
3.1 Normal estándar: zN(0,1) input_z.prg
* Instrucción para operar con series de datos sin fechas y con un tamaño de
* muestra N=1000:
ALLOCATE 1000
*Para generar una serie aleatoria N(0,1):
SET Z1 = %RAN(1)
GRAPH 1
# Z1
*Vemos algunos estadísticos descriptivos:
TABLE / Z1
STATISTICS Z1
RATS
*Para calcular su Función de Densidad Empírica (Histograma
*y mediante núcleo o Kernel de Epanechnikov)
DENSITY(TYPE=EPANECHNIKOV) z1 / EGRIDZ EDENSZ
DENSITY(TYPE=HISTOGRAM) z1 / HGRIDZ HDENSZ
SCATTER(STYLE=BARGRAPH,OVERLAY=LINE,$
HEADER= ’FDE DE UNA N(0,1)', KEY=UPLEFT) 2
# HGRIDZ HDENSZ
# EGRIDZ EDENSZ
*Para calcular su Función de Distribución Empírica (Acumulación de la estimación
*de la FDE medinate núcleo o Kernel de Epanechnikov)
ACCUMULATE(SCALE) EDENSZ / EDISTRIZ
GRAF 1
# EDISTRIZ
RATS
Normal estándar: zN(0,1)
Series Obs Mean Std Error Minimum MaximumZ1 1000 -0.0030477023 1.0173309898 -3.1715377196 3.8485497781
Statistics on Series Z1Observations 1000Sample Mean -0.0030477023 Variance 1.034962Standard Error 1.0173309898 SE of Sample Mean 0.032171t-Statistic -0.09473 Signif Level (Mean=0) 0.92454435Skewness -0.04086 Signif Level (Sk=0) 0.59837281Kurtosis -0.09030 Signif Level (Ku=0) 0.56132486Jarque-Bera 0.61808 Signif Level (JB=0) 0.73415167
RATS
Normal estándar: zN(0,1)
RATS
3.2 Chi-cuadrado: x X2(3) input_x.prg
* Instrucción para operar con series de datos sin fechas y con un tamaño de
* muestra N=1000:
ALLOCATE 1000
*Para generar una serie aleatoria x X2(3)
SET Z1 = %RAN(1)
SET Z2 = %RAN(1)
SET Z3 = %RAN(1)
SET X = (Z1**2)+(Z2**2)+(Z3**2)
GRAPH 1
# X
TABLE / X
STATISTICS X
RATS
*Para calcular su Función de Densidad Empírica (Histograma
*y mediante núcleo o Kernel de Epanechnikov)
DENSITY(TYPE=EPANECHNIKOV) X / EGRIDX EDENSX
DENSITY(TYPE=HISTOGRAM) X / HGRIDX HDENSX
SCATTER(STYLE=BARGRAPH,OVERLAY=LINE,$
HEADER= ’FDE DE UNAX(3)', KEY=UPLEFT) 2
# HGRIDX HDENSX
# EGRIDX EDENSX
*Para calcular su Función de Distribución Empírica (Acumulación de la estimación
*de la FDE medinate núcleo o Kernel de Epanechnikov)
ACCUMULATE(SCALE) EDENSX / EDISTRIX
GRAF 1
# EDISTRIX
RATS
Chi-cuadrado: x X2(3)
Series Obs Mean Std Error Minimum MaximumX 1000 3.0782714711 2.5028280911 0.0092591082 20.0198238661
Statistics on Series XObservations 1000Sample Mean 3.07827147105 Variance 6.264148Standard Error 2.50282809114 SE of Sample Mean 0.079146t-Statistic 38.89340 Signif Level (Mean=0) 0.00000000Skewness 1.77806 Signif Level (Sk=0) 0.00000000Kurtosis 4.79507 Signif Level (Ku=0) 0.00000000Jarque-Bera 1484.94398 Signif Level (JB=0) 0.00000000
RATS
Chi-cuadrado: x X2(3)
RATS
3.3 F-snedecor: f F(3 ,2) input_f.prg
* Instrucción para operar con series de datos sin fechas y con un tamaño de
* muestra N=1000:
ALLOCATE 1000
*Para generar una serie aleatoria f ?F(3 ,2)
SET Z1 = %RAN(1)
SET Z2 = %RAN(1)
SET Z3 = %RAN(1)
SET Z4 = %RAN(1)
SET Z5 = %RAN(1)
SET X1 = (Z1**2)+(Z2**2)+(Z3**2)
SET X2 = (Z4**2)+(Z5**2)
SET F = (X1/3)/(X2/2)
GRAPH 1
# F
TABLE / F
STATISTICS F
RATS
*Para calcular su Función de Densidad Empírica (Histograma
*y mediante núcleo o Kernel de Epanechnikov)
DENSITY(TYPE=EPANECHNIKOV) F / EGRIDF EDENSF
DENSITY(TYPE=HISTOGRAM) F / HGRIDF HDENSF
SCATTER(STYLE=BARGRAPH,OVERLAY=LINE,$
HEADER= ’FDE DE UNA F(3,2)', KEY=UPLEFT) 2
# HGRIDF HDENSF
# EGRIDF EDENSF
*Para calcular su Función de Distribución Empírica (Acumulación de la estimación
*de la FDE medinate núcleo o Kernel de Epanechnikov)
ACCUMULATE(SCALE) EDENSF / EDISTRIF
GRAF 1
# EDISTRIF
RATS
F-snedecor: f F(3 ,2)
Series Obs Mean Std Error Minimum MaximumF 1000 5.810238071 23.699459256 0.007862182 504.124912038
Statistics on Series FObservations 1000Sample Mean 5.8102380711 Variance 561.664369Standard Error 23.6994592563 SE of Sample Mean 0.749443t-Statistic 7.75274 Signif Level (Mean=0) 0.00000000Skewness 12.96581 Signif Level (Sk=0) 0.00000000Kurtosis 226.67497 Signif Level (Ku=0) 0.00000000Jarque-Bera 2168916.35184 Signif Level (JB=0) 0.00000000
RATS
F-snedecor: f F(3 ,2)
RATS
3.4 t-student: t t(3) input_t.prg
* Instrucción para operar con series de datos sin fechas y con un tamaño de
* muestra N=1000:
ALLOCATE 1000
*Para generar una serie aleatoria t t(3)
SET Z1 = %RAN(1)
SET Z2 = %RAN(1)
SET Z3 = %RAN(1)
SET Z4 = %RAN(1)
SET X = (Z1**2)+(Z2**2)+(Z3**2)
SET TS = Z4/(SQRT(X/3))
GRAPH 1
# TS
TABLE / TS
STATISTICS TS
RATS
*Para calcular su Función de Densidad Empírica (Histograma
*y mediante núcleo o Kernel de Epanechnikov)
DENSITY(TYPE=EPANECHNIKOV)TS / EGRIDT EDENST
DENSITY(TYPE=HISTOGRAM) TS / HGRIDT HDENST
SCATTER(STYLE=BARGRAPH,OVERLAY=LINE,$
HEADER= ’FDE DE UNA t(3)', KEY=UPLEFT) 2
# HGRIDT HDENST
# EGRIDT EDENST
*Para calcular su Función de Distribución Empírica (Acumulación de la estimación
*de la FDE medinate núcleo o Kernel de Epanechnikov)
ACCUMULATE(SCALE) EDENST / EDISTRIT
GRAF 1
# EDISTRIT
RATS
t-student: t t(3)
Series Obs Mean Std Error Minimum MaximumTS 1000 0.071069498 1.526850132 -11.279162151 9.758813299
Statistics on Series TSObservations 1000Sample Mean 0.07106949844 Variance 2.331271Standard Error 1.52685013190 SE of Sample Mean 0.048283t-Statistic 1.47193 Signif Level (Mean=0) 0.14135502Skewness -0.19858 Signif Level (Sk=0) 0.01047413Kurtosis 6.96155 Signif Level (Ku=0) 0.00000000Jarque-Bera 2025.87015 Signif Level (JB=0) 0.00000000
RATS
t-student: t t(3)