karoll gomez [email protected] ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 ·...

Microeconometrıa

Karoll [email protected]

http://karollgomez.wordpress.com

Primer semestre 2019

III. Modelos Censurados yTruncados

Truncamiento y censura I

Datos truncados y censurados:

Observaciones incompletas (i.e. el rango de la variable dependienteesta restringida en algun modo)

• Regla de observacion para definir truncamiento y censura: y es elvalor observado de la variable dependiente latente y∗,

y = g(y∗),

donde g(·) es alguna funcion especificada.

Truncamiento I

Datos truncados:

I Suponga que y∗ es la variable original no truncada. La variableesta truncada cuando algunas observaciones de y no se observandao que tampoco puedo observar a x .

I es decir, algunas veces es necesario tratar a y como truncada yaque algunos valores de las varibles explicativas no se observan enalgun punto de la distribucion de y .

I O se excluyen observaciones basados en las caracterısticas de y ,ie. de acuerdo con las varibles explicativas

I Es decir, y∗ es observada de forma incompleta, ya que lasobservaciones son missing o son borradas de la muestra a partirde cierto umbral.

I El truncamiento es un problema derivado del muestreo.

Truncamiento II

I Ejemplo 1:

Consider a situation in which you want to study the relationshipbetween earnings and firm size but firm size is not available for thoseearning above 500,000 euros a year.In this case, although the actual distribution of earnings might not betruncated, the distribution of those observations that you can use forthe analysis - i.e. those that have valid earnings and firm sizeinformation - is in fact truncated

I Ejemplo 2:

Data on wage rates may be obtainable only for those who are in thelabor force.The decision to be in the labor force is a function of a reservation wageat which people join or don’t join the labor force. Thus, the sample istruncated by the decision to be in the labor force.

Truncamiento III

Tipos de truncamiento:

• Truncamiento por izquierda

y = y∗ si y∗ > L, y = missing e.o.c

• Truncamiento por derecha

y = y∗ si y∗ < U, y = missing e.o.c

• Truncamiento por derecha e izquierda

y = y∗ si L < y∗ < U, y = missing e.o.c

Truncamiento IV

0 1 2 3 4 5 6

0

2

4

6

8

10

Sin censura y truncamiento

x

y

Truncamiento V

0 1 2 3 4 5 6

0

2

4

6

8

10

Truncamiento por izquierda

x

y

0 1 2 3 4 5 6

0

2

4

6

8

10

Truncamiento por derecha

x

y

Truncamiento VI

−3 −2 −1 0 1 2 3

0.0

0.5

1.0

1.5

Truncamiento por izquierda

y*

f(y

* )

−3 −2 −1 0 1 2 3

0.0

0.5

1.0

1.5

Truncamiento por derecha

y*

f(y

* )

Truncamiento VII

Truncamiento VIII

Caracterısticas claves:

X Se da cuando se intentan hacer inferencias sobre una poblaciongrande a partir de una muestra de una subpoblacion.

X Es una caracterıstica de la distribucion donde se obtiene lamuestra.

Ejemplo:

• Muestra de personas con ingreso de al menos L = $100.000US/anual.

Media y varianza de una v.a. normal truncada I

Theorem 1. Sea X ∼ N (µ, σ2) y c una constante. Entonces,

E(X |Truncamiento) = µ+ σλ(α)

Var(X |Truncamiento) = σ2 [1− δ(α)] ,

donde, α = (c − µ)/σ, δ(α) = λ(α) [λ(α)− α] y

λ(α) =

{φ(α)/ [1− Φ(α)] si x > c

−φ(α)/Φ(α) si x < c .

X Si el truncamiento es por debajo (i.e, λ > 0), entonces la media de lavariable truncada es mayor que la media de la variable original.

X Si el truncamiento es por arriba (i.e, λ < 0), entonces la media de lavariable truncada es menor que la media de la variable original.

X Reduce la varianza con respecto a la de la distribucion no truncada,dado que 0 < δ < 1.

Censura I

Datos censurados:

I Suponga que y∗ es la variable original no censurada. Sin embargo, lavariable esta artificalmente codificada, por arriba o por debajo, a unnivel especıfico.

I Ejemplo: la muestra de personas con ingreso muy altos son todascodificadas a un nivel maximo de L = $500.000 US/anual. El BR solointerviene si la tasa de cambio alcanza el nivel maximo o mınimo de labanda cambiaria.

I Tambien se presenta por alguna caracterıstica particular del problema(natural censoring).

I Ejemplo: Donaciones. Algunas personas deciden no donar por lo que ladistribucion de las donaciones mostrara una masa de probabilidadimportante al nivel cero, y sera una distribucion continua para valorespositivos.

I La informacion sobre y no es observada (oculta), pero si sobre x .

I La censura es un problema de medicion de las variables.

Censura II

Tipos de censura:

• Censura por debajo (o por izquierda)

y =

{y∗ si y∗ > L

L si y∗ ≤ L.

• Censura por arriba (o por derecha)

y =

{y∗ si y∗ < U

U si y∗ ≥ U.

X y∗ es latente cuando y∗ ≤ L (o y∗ ≥ U), pero se sabe quey∗ < L (o y∗ > U), y por simplicidad se fija y = L (o y = U).

Censura III

0 1 2 3 4 5 6

0

2

4

6

8

10

Censura por arriba

x

y

0 1 2 3 4 5 6

0

2

4

6

8

10

Censura por abajo

x

y

Censura IV

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Censura por izquierda

y*

f(y

* )

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Censura por derecha

y*

f(y

* )

Censura V

Censura VI

Censura VII

Ejemplos:

X Personas de todos los niveles de ingreso son incluıdos en lamuestra, pero por confidencialidad las de ingreso alto sonreportadas como personas que exceden cierto umbral (e.g.U = 100.000 US/anual).

X Horas laborales deseadas anuales. Valores negativos son fijadas aL = 0 porque personas con horas deseadas de trabajo negativaseligen no trabajar.

X Compra de bienes durables (L = 0).

X Numero de relaciones extramaritales (L = 0).

X Gastos en vacaciones (L = 0).

Media y varianza de una v.a. normal censurada I

Theorem 2. Si y∗ ∼ N (µ, σ2) y y = y∗ si y∗ > L, o y = L siy∗ ≤ L. Entonces,

E(y) = Φ(α)L + [1− Φ(α)] [µ+ σλ(α)]

Var(y) = σ2 [1− Φ(α)]{

[1− δ(α)] + [α− λ(α)]2 Φ(α)},

donde λ(α) = φ(α)/ [1− Φ(α)], δ(α) = λ2(α)− αλ(α) yα = (L− µ)/σ.

Truncamiento + censura

Algunos datos pueden estar censurados y truncados:

Example:

Data on wage rates may be obtainable only for those who are in thelabor force.The decision to be in the labor force is a function of a reservationwage at which people join or don’t join the labor force. Thus, thesample is truncated by the decision to be in the labor force.

Then the dependent variable would start at 0 for these individualsand then jump to the lowest wage respondent and remain continuousfor the employed workers. This is the case of lower censored data.

Resumen

I Censored regressions: Values of the dependent variable arereported at some limit, but you can include the censoredobservations in the regression.

I Truncated regressions: A subset of observations are dropped,thus, only the truncated data are available for the regression.

Why do we have truncation?

1. Truncation by survey design: Studies of poverty. By survey’sdesign, families whose incomes are greater than that thresholdare dropped from the sample.

2. Incidental Truncation: Wage offer married women. Only thosewho are working has wage information. It is the people’s decision,not the survey’s design, that determines the sample. selection.

Implicaciones de la censura y el truncamiento en OLS I

• El truncamiento y la censura llevan a estimadores sesgados (aunasintoticamente).

• El truncamiento y la censura llevan a estimadores no lineales aunsi el modelo original tenga media condicional lineal.

Considerese el modelo de regresion lineal:

y∗ = x>β + u, u|x ∼ N (0, σ2),

bajo los supuesto de exogeneidad, normalidad del termino de error ydemas supestos estandar.

Implicaciones de la censura y el truncamiento en OLS II

Implicaciones de la censura y el truncamiento en OLS III

1. Truncamiento con umbral igual cero:

y =

{y∗ si y∗ > 0

. si y∗ ≤ 0.

2. Censura con umbral igual cero:

y =

{y∗ si y∗ > 0

0 si y∗ ≤ 0.

Implicaciones de la censura y el truncamiento en OLS I

• La propiedad de insesgamiento del estimador MCO aplicado amodelos truncados depende de:

A. Insesgado si:

(A1) La muestra es aleatoriamente seleccionada.(A2) La seleccion de la muestra es determinada por algun valorde una de las variables independientes.Ejemplo: suppose that x is age. Then if you select sample if age isgreater than 20 years old, this OLS is unbiased.

La estimacion se podrıa hacer en estos dos casos usando OLS.

Implicaciones de la censura y el truncamiento en OLS II

B. Sesgado si:

(B1) La seleccion de la muestra es determinada por el valor de lavariable y .Example: y is family income. We select the sample if y is greaterthan certain threshold. Then this OLS is biased.

La estimacion se hace en este caso usando Truncated MLE Model.

(B2) La seleccion muestral esta correlacionada con el termino deerror.In practice, this situation happens when the selection is based onthe survey participant’s decision. Since the decision to participateis likely to be based on unobserved factors which are contained inε, the selection is likely to be correlated with los errores.

La estimacion se hace en este caso usando Heckman SampleSelection Model.

Funcion Log-Verosimil variable truncada por izquierda I

La funcion de distribucion de probabilidad se deriva usando elconcepto de pdf condicional.

Variable truncada por la izquierda:

• De la formula de probabilidad condicional,

P(A|B) = P(A ∩ B)/P(B),

Asi, la funcion de densidad de probabilidad de y condicional a x ,esta dada por

f (y |x ,θ) = f ∗(y |y > L, x ,θ) =f ∗(y |x ,θ)

P(y > L|x ,θ)

=f ∗(y |x ,θ)

1− P(y < L|x ,θ)

=f ∗(y |x ,θ)

1− F ∗(L|x ,θ).

Funcion Log-Verosimil variable truncada por izquierda II

• La funcion de verosimilitud esta dada por

Ln(θ) =n∏

i=1

f (yi |x i ,θ)

=n∏

i=1

f ∗(yi |x i ,θ)

1− F ∗(L|x i ,θ).

• La funcion log-verosimil correspondiente es

log Ln(θ) =n∑

i=1

{log f ∗(yi |x i ,θ)− log [1− F ∗(L|x i ,θ)]} .

Funcion Log-Verosimil variable truncada por derecha II


log Ln(θ) =n∑

i=1

{log f ∗(yi |x i ,θ)− log F ∗(U|x i ,θ)} .

Funcion Log-Verosimil variable censurada por debajo I

La funcion de distribucion de probabilidad se deriva usando una pdfmixta (pdf dicreta mas pdf continua).

Variable censurada por la debajo:

• Para y > L, y = y∗. Por lo tanto,

f (y |x ,θ) = f ∗(y |x ,θ).

• Para y = L, f (y |x ,θ) es discreta. Por lo tanto,

f (y |x ,θ) = P(y∗ ≤ L) = F ∗(L|x ,θ).

• Ası, la funcion de densidad de y condicional a x esta dada por

f (y |x ,θ) =

{f ∗(y |x ,θ) si y > L

F ∗(L|x ,θ) si y ≤ L.

Funcion Log-Verosimil variable censurada por debajo II


Ln(θ) =∏y∗i >L

f ∗(yi |x i ,θ)∏y∗i ≤L

F ∗(L|x i ,θ)

=n∏

i=1

[f ∗(yi |x i ,θ)]di [F ∗(L|x i ,θ)]1−di ,

donde

di =

{1 si yi > L

0 si yi ≤ L.


log Ln(θ) =n∑

i=1

{di log f ∗(yi |x i ,θ) + (1− di ) log F ∗(L|x i ,θ)} .

Funcion Log-Verosimil variable censurada por arriba I

Variable censurada por la arriba:

• Para y < U, y = y∗. Por lo tanto,

f (y |x ,θ) = f ∗(y |x ,θ).

• Para y = U, f (y |x ,θ) es discreta. Por lo tanto,

f (y |x ,θ) = P(y∗ ≥ U) = 1− F ∗(U|x ,θ).

• Ası, la funcion de densidad de y condicional a x esta dada por

f (y |x ,θ) =

{f ∗(y |x ,θ) si y < U

1− F ∗(U|x ,θ) si y ≥ U.

Funcion Log-Verosimil variable censurada por arriba II


Ln(θ) =∏

y∗i <U

f ∗(yi |x i ,θ)∏

y∗i ≥U[1− F ∗(U|x i ,θ)]

=n∏

i=1

[f ∗(yi |x i ,θ)]di [1− F ∗(U|x i ,θ)]1−di ,

donde

di =

{1 si yi < U

0 si yi ≥ U.


log Ln(θ) =n∑

i=1

{di log f ∗(yi |x i ,θ) + (1− di ) log [1− F ∗(U|x i ,θ)]} .

Modelo Tobit I

• Si la densidad de y∗ condicional a x , f ∗(y∗|x ,θ), θ ∈ Θ ⊂ Rp,es especificada, entonces θ puede estimarse por maximaverosimilitud con base en la densidad condicional de y (truncadao censurada), f (y |x ,θ), dado que y = g(y∗).

I El modelo Tobit censurado o trauncado surge bajo el supuestode normalidad de los errores.

• El estimador MV truncado y censurado de θ es consistente yasintoticamente normal, sı f (·) esta especificada correctamente,lo cual requiere de una correcta especificacion de f ∗(·).

• El truncamiento y la censura cambian la densidad (y por lotanto, la media) condicional de y .

Modelo Tobit Censurado I

• Modelo censurado por debajo con L = 0, donde la variable y∗ eslineal en los parametros con errores aditivos i.i.d normal

y∗ = x>β + ε, ε|x ∼ N (0, σ2),

independiente de x = (x1, . . . , xp)>.

y =

{y∗ si y∗ > 0

0 si y∗ ≤ 0.

• Tambien se acostumbra escribir como

y =

{x>β + ε si ε > −x>β0 si ε ≤ −x>β,

donde ε|x ∼ N (0, σ2), e independiente de x .

Estimacion I

• La funcion de densidad de y condicional a x esta dada por

f (y |x ,β) =

1σφ(yi−x>i β

σ

)si y > 0

F ∗(0|x ,β) si y = 0,

donde

F ∗(0|x ,β) = P(y∗ ≤ 0|x ,β)

= P(x>β + ε ≤ 0|x ,β)

= P(ε ≤ −x>β)

= Φ(−x>β/σ) por el supuesto ε ∼ N (0, σ2)

= 1− Φ(x>β/σ) por simetrıa de Φ(·).

Estimacion II


Ln(β, σ2) =∏y∗i >0

1

σφ

(yi − x>i β

σ

) ∏y∗i ≤0

[1− Φ

(x>i βσ

)]

=n∏

i=1

[1

σφ

(yi − x>i β

σ

)]di [1− Φ

(x>i βσ

)]1−di=

n∏i=1

[1√

2πσ2exp

{− 1

2σ2

(yi − x>i β

)2}]di×[

1− Φ

(x>i βσ

)]1−di,

donde

di =

{1 si yi > 0

0 si yi ≤ 0.

Estimacion III

• La correspondiente funcion log-verosımil esta dada por

log Ln(β, σ2) =∑y∗i >0

[−1

2log 2π − 1

2log σ2 − 1

2σ2

(yi − x>i β

)2]

+∑y∗i ≤0

log

[1− Φ

(x>i βσ

)]

=n∑

i=1

{di

[−1

2log 2π − 1

2log σ2 − 1

2σ2

(yi − x>i β

)2]+ (1− di ) log

[1− Φ

(x>i βσ

)]},

Estimacion IV

• Las condiciones de primer orden estan dadas por

∂ log Ln∂β

=1

σ2

n∑i=1

di

(yi − x>i β

)− (1− di )

σφ(

x>i βσ

)1− Φ

(x>i βσ

) x i = 0,

y

∂ log Ln∂σ2

=n∑

i=1

di

− 1

2σ2+

(yi − x>i β

)22σ4

+ (1− di )

φ(

x>i βσ

)x>β

1− Φ(

x>i βσ

) 1

2σ3

= 0.

• Para la derivacion de la distribucion y varianza lımite delestimador de MV vease ? y ?.

Modelo Tobit Truncado I

• Modelo truncado por izquierda con L = 0, donde y = y∗ siy∗ > 0 es lineal en los parametros con errores aditivos i.i.dnormal

y = y∗ = x>β + ε, ε|x ∼ N (0, σ2),

independiente de x = (x1, . . . , xp)>.

• Tambien se acostumbra escribir como

y = x>β + ε si ε > −x>β.

Modelo Tobit Truncado II

Modelo Tobit Truncado III

Media y varianza del modelo Tobit II

• Media condicional (censurada)

E(y |x) = P(y = 0|x)× E(y |x , y = 0) + P(y > 0|x)× E(y |x , y > 0)

= P(y∗ ≤ 0|x)× 0 + P(y∗ > 0|x)× E(y∗|x , y∗ > 0)

= P(y∗ > 0|x)× E(y∗|x , y∗ > 0)

= [1− P(y∗ ≤ 0|x)]× E(y∗|x , y∗ > 0)

=[1− P

(ε ≤ −x>β, x

)]×[x>β + E

(ε|ε > −x>β, x

)]=[1− Φ

(−x>β/σ

)]×[x>β + σφ

(x>βσ

)/Φ

(x>βσ

)]= Φ

(x>β/σ

)×[x>β + σφ

(x>βσ

)/Φ

(x>βσ

)]= Φ

(x>β/σ

)x>β + σφ

(x>βσ

)Ver Tambien el teorema 2.

Efectos marginales I

• Efectos marginales sobre y∗

∂E(y∗|x)

∂xj= βj .

• Efectos marginales (modelo truncado)

∂E(y |x , y > 0)

∂xj= βj +

∂E(ε|y∗ > 0)

∂xj

= βj + σ∂λ

∂xj

= βj + σ[zλ(z)− λ2(z)]

(−βjσ

)=[1− zλ(z)− λ2(z)

]βj .

Efectos marginales II

• Efectos marginales (modelo censurado)

∂E(y |x)

∂xj= Φ(z)βj .

• Efectos marginales sobre la probabilidad

∂P(y > 0|x)

∂xj= φ(z)βj/σ

donde λ(z) = φ(z)/Φ(z) con z = x>β/σ.

Seleccion muestral I

• Se presenta cuando se tiene Truncamiento incidental, que serefiere al hecho de que los encuestados se autoseleccionan en lamuestra al tomar o no una decision.

• Fuentes de datos microeconomicos observados:

X Encuestas de hogaresX EmpresasX Datos de mercadeo (ventas al por menor)X InternetX Datos gubernamentales.X Censos.

• Si una muestra aleatoria es obtenida correctamente, lasdistribuciones de probabilidad de los datos y de la poblacion soniguales.

• Desviaciones del muestreo causan divergencia entre ambasdistribuciones ⇒ sesgo muestral.

Seleccion muestral II

• Las desviaciones son generadas por incorrectos esquemas demuestrales ⇒ la muestra no es representativa de la poblacion.

Ejemplo:

− Un encuestado puede elegir no responder ciertas preguntas (i.e.nivel de ingreso) o no responder el cuestionario.

− Una solucion serıa usar los encuestados con respuestas completas.− Pero, si el interes es el ingreso medio de la poblacion, la media

muestral estarıa sesgada hacia abajo al no tener en cuenta laspersonas de ingreso alto.

• El problema de seleccion muestral puede provenir de:

X Auto-seleccion (participacion voluntaria de los individuos)X Seleccion muestral (individuos participantes en el estudio

sobre-muestreados)X Censura de la variable dependiente.

Seleccion muestral III

• En la practica, el problema de seleccion muestral parece ser masla regla que la excepcion.

• Hay tantos modelos de seleccion muestral como fuentes delproblema de seleccion de la muestra.

• Modelos de seleccion mas populares:

X Modelo bivariado de Heckman (1979)

X Modelo de Roy

X...

Modelo de seleccion bivariado de Heckman I

El modelo de Heckman se considera una generalizacion al modeloTobit, ya que se modelan dos decisiones.

• Sea y∗2 la variable latente de interes.

• En el modelo truncado estandar, y∗2 es observada si y∗2 > 0.

• El modelo considera una regla de observacion de y∗2 diferente,acorde con una nueva variable latente y∗1 :

y2 = y∗2 si y∗1 > 0.

• Esto es, y∗2 es observada cuando y∗1 > 0, y no cuando y∗1 ≤ 0.

Ejemplo: y∗1 > 0 determina la decision de si trabajar o no, y y∗2 ,cuanto tiempo trabajar, o el salario.

Modelo de seleccion bivariado de Heckman II

• El modelo se especifica en terminos de dos ecuaciones:

X Ecuacion de participacion (o seleccion):

y1 =

{1 si y∗1 > 0

0 si y∗1 ≤ 0.

X Ecuacion de resultado:

y2 = y∗2 si y∗1 > 0.

• El modelo estandar especifica un modelo lineal con erroresaditivos:

y∗1 = x>1 β1 + ε1, ε1|x1 ∼ N (0, 1)

y∗2 = x>2 β2 + ε2, ε2|x2 ∼ N (0, σ22),

donde Cov(ε1, ε2) = σ12.

Modelo de seleccion bivariado de Heckman III

• El modelo se conoce tambien como: modelo Tobit tipo 2,modelo Tobit generalizado,...

• Para y∗1 > 0, y∗2 es observada con probabilidad:

f ∗(y∗2 |y∗1 > 0)P(y∗1 > 0)

• Para y∗1 ≤ 0, lo unico que se observa es la probabilidad delevento

P(y∗1 ≤ 0)


Ln =n∏

i=1

{[P(y∗1i ≤ 0)]1−y1i × [f ∗(y∗2 |y∗1 > 0)P(y∗1 > 0)]y1i

}donde

y1i =

{1 si y∗1i > 0

0 si y∗1i ≤ 0.

Modelo de seleccion bivariado de Heckman IV

• Ln es aplicable a modelos mas generales, no solo a modeloslineales con errores conjuntamente Gaussianos.

• Medias condicionales:

E(y2|x , y∗1 > 0) = E(y∗2 |x , y∗1 > 0)

= E(x>2 β2 + ε2|x>1 β1 + ε1 > 0

)= x>2 β2 + E

(ε2|ε1 > −x>1 β1

)= x>2 β2 + E

(σ12ε1 + ζ|ε1 > −x>1 β1

)= x>2 β2 + σ12E

(ε1|ε1 > −x>1 β1

)= x>2 β2 + σ12φ

(x>1 β1

)/Φ(x>1 β1

),

teniendo en cuenta que, dado que la distribucion normal conjunta(z1

z2

)∼ N

[(µ1

µ2

),

(Σ11 Σ12

Σ21 Σ22

)]

Modelo de seleccion bivariado de Heckman V

implica que la distribucion condicional

z2|z1 ∼ N[µ2 + Σ21Σ−111 (z1 − µ1) ,Σ22 −Σ21Σ−111 Σ12

],

entonces

z2 = µ2 + Σ21Σ−111 (z1 − µ1) + ζ

donde ζ ∼ N(0,Σ22 −Σ21Σ−111 Σ12

), independiente de z1.

El resultado de la ultima lınea es por Teorema 1.

Modelo de seleccion bivariado de Heckman VI

• La regresion de MCO de y2 sobre x2 usando solamente losvalores positivos de y2 lleva a una estimacion inconsistente de β2

a menos que los errores esten incorrelacionados σ12 = 0.

• Heckman propuso un procedimiento de estimacion en dos etapasque es ineficiente (dada la dificultad de la estimacion usando MVla cual es eficiente):

1. Obtener un estimador β1 de la regresion binomial probit de y 1

sobre x1 dado que P(y∗1 > 0|x1) = Φ(x>1 β1

).

Usando el estimador β1 se obtienen la razon inversa de Mills, lacual captura el sesgo de seleccion y esta dada por:

φ(x>1i β1

)/Φ(x>1i β1

)2. Regresar los valores positivos de y 2 sobre x2 y la razon inversa de

Mills:

y2i = x>2iβ2 + σ12φ(x>1i β1

)/Φ(x>1i β1

)+ υi ,

karoll gomez [email protected] ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 ·...

Documents