karoll gomez [email protected] ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 ·...

57
Microeconometr´ ıa Karoll GOMEZ [email protected] http://karollgomez.wordpress.com Primer semestre 2019

Upload: others

Post on 03-Apr-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Microeconometrıa

Karoll [email protected]

http://karollgomez.wordpress.com

Primer semestre 2019

Page 2: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

III. Modelos Censurados yTruncados

Page 3: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Truncamiento y censura I

Datos truncados y censurados:

Observaciones incompletas (i.e. el rango de la variable dependienteesta restringida en algun modo)

• Regla de observacion para definir truncamiento y censura: y es elvalor observado de la variable dependiente latente y∗,

y = g(y∗),

donde g(·) es alguna funcion especificada.

Page 4: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Truncamiento I

Datos truncados:

I Suponga que y∗ es la variable original no truncada. La variableesta truncada cuando algunas observaciones de y no se observandao que tampoco puedo observar a x .

I es decir, algunas veces es necesario tratar a y como truncada yaque algunos valores de las varibles explicativas no se observan enalgun punto de la distribucion de y .

I O se excluyen observaciones basados en las caracterısticas de y ,ie. de acuerdo con las varibles explicativas

I Es decir, y∗ es observada de forma incompleta, ya que lasobservaciones son missing o son borradas de la muestra a partirde cierto umbral.

I El truncamiento es un problema derivado del muestreo.

Page 5: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Truncamiento II

I Ejemplo 1:

Consider a situation in which you want to study the relationshipbetween earnings and firm size but firm size is not available for thoseearning above 500,000 euros a year.In this case, although the actual distribution of earnings might not betruncated, the distribution of those observations that you can use forthe analysis - i.e. those that have valid earnings and firm sizeinformation - is in fact truncated

I Ejemplo 2:

Data on wage rates may be obtainable only for those who are in thelabor force.The decision to be in the labor force is a function of a reservation wageat which people join or don’t join the labor force. Thus, the sample istruncated by the decision to be in the labor force.

Page 6: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Truncamiento III

Tipos de truncamiento:

• Truncamiento por izquierda

y = y∗ si y∗ > L, y = missing e.o.c

• Truncamiento por derecha

y = y∗ si y∗ < U, y = missing e.o.c

• Truncamiento por derecha e izquierda

y = y∗ si L < y∗ < U, y = missing e.o.c

Page 7: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Truncamiento IV

0 1 2 3 4 5 6

0

2

4

6

8

10

Sin censura y truncamiento

x

y

Page 8: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Truncamiento V

0 1 2 3 4 5 6

0

2

4

6

8

10

Truncamiento por izquierda

x

y

0 1 2 3 4 5 6

0

2

4

6

8

10

Truncamiento por derecha

x

y

Page 9: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Truncamiento VI

−3 −2 −1 0 1 2 3

0.0

0.5

1.0

1.5

Truncamiento por izquierda

y*

f(y

* )

−3 −2 −1 0 1 2 3

0.0

0.5

1.0

1.5

Truncamiento por derecha

y*

f(y

* )

Page 10: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Truncamiento VII

Page 11: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Truncamiento VIII

Caracterısticas claves:

X Se da cuando se intentan hacer inferencias sobre una poblaciongrande a partir de una muestra de una subpoblacion.

X Es una caracterıstica de la distribucion donde se obtiene lamuestra.

Ejemplo:

• Muestra de personas con ingreso de al menos L = $100.000US/anual.

Page 12: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Media y varianza de una v.a. normal truncada I

Theorem 1. Sea X ∼ N (µ, σ2) y c una constante. Entonces,

E(X |Truncamiento) = µ+ σλ(α)

Var(X |Truncamiento) = σ2 [1− δ(α)] ,

donde, α = (c − µ)/σ, δ(α) = λ(α) [λ(α)− α] y

λ(α) =

{φ(α)/ [1− Φ(α)] si x > c

−φ(α)/Φ(α) si x < c .

X Si el truncamiento es por debajo (i.e, λ > 0), entonces la media de lavariable truncada es mayor que la media de la variable original.

X Si el truncamiento es por arriba (i.e, λ < 0), entonces la media de lavariable truncada es menor que la media de la variable original.

X Reduce la varianza con respecto a la de la distribucion no truncada,dado que 0 < δ < 1.

Page 13: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Censura I

Datos censurados:

I Suponga que y∗ es la variable original no censurada. Sin embargo, lavariable esta artificalmente codificada, por arriba o por debajo, a unnivel especıfico.

I Ejemplo: la muestra de personas con ingreso muy altos son todascodificadas a un nivel maximo de L = $500.000 US/anual. El BR solointerviene si la tasa de cambio alcanza el nivel maximo o mınimo de labanda cambiaria.

I Tambien se presenta por alguna caracterıstica particular del problema(natural censoring).

I Ejemplo: Donaciones. Algunas personas deciden no donar por lo que ladistribucion de las donaciones mostrara una masa de probabilidadimportante al nivel cero, y sera una distribucion continua para valorespositivos.

I La informacion sobre y no es observada (oculta), pero si sobre x .

I La censura es un problema de medicion de las variables.

Page 14: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Censura II

Tipos de censura:

• Censura por debajo (o por izquierda)

y =

{y∗ si y∗ > L

L si y∗ ≤ L.

• Censura por arriba (o por derecha)

y =

{y∗ si y∗ < U

U si y∗ ≥ U.

X y∗ es latente cuando y∗ ≤ L (o y∗ ≥ U), pero se sabe quey∗ < L (o y∗ > U), y por simplicidad se fija y = L (o y = U).

Page 15: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Censura III

0 1 2 3 4 5 6

0

2

4

6

8

10

Censura por arriba

x

y

0 1 2 3 4 5 6

0

2

4

6

8

10

Censura por abajo

x

y

Page 16: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Censura IV

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Censura por izquierda

y*

f(y

* )

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Censura por derecha

y*

f(y

* )

Page 17: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Censura V

Page 18: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Censura VI

Page 19: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Censura VII

Ejemplos:

X Personas de todos los niveles de ingreso son incluıdos en lamuestra, pero por confidencialidad las de ingreso alto sonreportadas como personas que exceden cierto umbral (e.g.U = 100.000 US/anual).

X Horas laborales deseadas anuales. Valores negativos son fijadas aL = 0 porque personas con horas deseadas de trabajo negativaseligen no trabajar.

X Compra de bienes durables (L = 0).

X Numero de relaciones extramaritales (L = 0).

X Gastos en vacaciones (L = 0).

Page 20: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Media y varianza de una v.a. normal censurada I

Theorem 2. Si y∗ ∼ N (µ, σ2) y y = y∗ si y∗ > L, o y = L siy∗ ≤ L. Entonces,

E(y) = Φ(α)L + [1− Φ(α)] [µ+ σλ(α)]

Var(y) = σ2 [1− Φ(α)]{

[1− δ(α)] + [α− λ(α)]2 Φ(α)},

donde λ(α) = φ(α)/ [1− Φ(α)], δ(α) = λ2(α)− αλ(α) yα = (L− µ)/σ.

Page 21: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Truncamiento + censura

Algunos datos pueden estar censurados y truncados:

Example:

Data on wage rates may be obtainable only for those who are in thelabor force.The decision to be in the labor force is a function of a reservationwage at which people join or don’t join the labor force. Thus, thesample is truncated by the decision to be in the labor force.

Then the dependent variable would start at 0 for these individualsand then jump to the lowest wage respondent and remain continuousfor the employed workers. This is the case of lower censored data.

Page 22: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Resumen

I Censored regressions: Values of the dependent variable arereported at some limit, but you can include the censoredobservations in the regression.

I Truncated regressions: A subset of observations are dropped,thus, only the truncated data are available for the regression.

Why do we have truncation?

1. Truncation by survey design: Studies of poverty. By survey’sdesign, families whose incomes are greater than that thresholdare dropped from the sample.

2. Incidental Truncation: Wage offer married women. Only thosewho are working has wage information. It is the people’s decision,not the survey’s design, that determines the sample. selection.

Page 23: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Implicaciones de la censura y el truncamiento en OLS I

• El truncamiento y la censura llevan a estimadores sesgados (aunasintoticamente).

• El truncamiento y la censura llevan a estimadores no lineales aunsi el modelo original tenga media condicional lineal.

Considerese el modelo de regresion lineal:

y∗ = x>β + u, u|x ∼ N (0, σ2),

bajo los supuesto de exogeneidad, normalidad del termino de error ydemas supestos estandar.

Page 24: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Implicaciones de la censura y el truncamiento en OLS II

Page 25: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Implicaciones de la censura y el truncamiento en OLS III

1. Truncamiento con umbral igual cero:

y =

{y∗ si y∗ > 0

. si y∗ ≤ 0.

2. Censura con umbral igual cero:

y =

{y∗ si y∗ > 0

0 si y∗ ≤ 0.

Page 26: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Implicaciones de la censura y el truncamiento en OLS I

• La propiedad de insesgamiento del estimador MCO aplicado amodelos truncados depende de:

A. Insesgado si:

(A1) La muestra es aleatoriamente seleccionada.(A2) La seleccion de la muestra es determinada por algun valorde una de las variables independientes.Ejemplo: suppose that x is age. Then if you select sample if age isgreater than 20 years old, this OLS is unbiased.

La estimacion se podrıa hacer en estos dos casos usando OLS.

Page 27: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Implicaciones de la censura y el truncamiento en OLS II

B. Sesgado si:

(B1) La seleccion de la muestra es determinada por el valor de lavariable y .Example: y is family income. We select the sample if y is greaterthan certain threshold. Then this OLS is biased.

La estimacion se hace en este caso usando Truncated MLE Model.

(B2) La seleccion muestral esta correlacionada con el termino deerror.In practice, this situation happens when the selection is based onthe survey participant’s decision. Since the decision to participateis likely to be based on unobserved factors which are contained inε, the selection is likely to be correlated with los errores.

La estimacion se hace en este caso usando Heckman SampleSelection Model.

Page 28: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Funcion Log-Verosimil variable truncada por izquierda I

La funcion de distribucion de probabilidad se deriva usando elconcepto de pdf condicional.

Variable truncada por la izquierda:

• De la formula de probabilidad condicional,

P(A|B) = P(A ∩ B)/P(B),

Asi, la funcion de densidad de probabilidad de y condicional a x ,esta dada por

f (y |x ,θ) = f ∗(y |y > L, x ,θ) =f ∗(y |x ,θ)

P(y > L|x ,θ)

=f ∗(y |x ,θ)

1− P(y < L|x ,θ)

=f ∗(y |x ,θ)

1− F ∗(L|x ,θ).

Page 29: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Funcion Log-Verosimil variable truncada por izquierda II

• La funcion de verosimilitud esta dada por

Ln(θ) =n∏

i=1

f (yi |x i ,θ)

=n∏

i=1

f ∗(yi |x i ,θ)

1− F ∗(L|x i ,θ).

• La funcion log-verosimil correspondiente es

log Ln(θ) =n∑

i=1

{log f ∗(yi |x i ,θ)− log [1− F ∗(L|x i ,θ)]} .

Page 30: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Funcion Log-Verosimil variable truncada por derecha I

Variable truncada por la derecha:

• La funcion de densidad de y condicional a x esta dada por

f (y |x ,θ) = f ∗(y |y < U, x ,θ) =f ∗(y |x ,θ)

P(y < U|x ,θ)

=f ∗(y |x ,θ)

F ∗(U|x ,θ).

• La funcion de verosimilitud esta dada por

Ln(θ) =n∏

i=1

f (yi |x i ,θ)

=n∏

i=1

f ∗(yi |x i ,θ)

F ∗(U|x i ,θ).

Page 31: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Funcion Log-Verosimil variable truncada por derecha II

• La funcion log-verosimil correspondiente es

log Ln(θ) =n∑

i=1

{log f ∗(yi |x i ,θ)− log F ∗(U|x i ,θ)} .

Page 32: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Funcion Log-Verosimil variable censurada por debajo I

La funcion de distribucion de probabilidad se deriva usando una pdfmixta (pdf dicreta mas pdf continua).

Variable censurada por la debajo:

• Para y > L, y = y∗. Por lo tanto,

f (y |x ,θ) = f ∗(y |x ,θ).

• Para y = L, f (y |x ,θ) es discreta. Por lo tanto,

f (y |x ,θ) = P(y∗ ≤ L) = F ∗(L|x ,θ).

• Ası, la funcion de densidad de y condicional a x esta dada por

f (y |x ,θ) =

{f ∗(y |x ,θ) si y > L

F ∗(L|x ,θ) si y ≤ L.

Page 33: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Funcion Log-Verosimil variable censurada por debajo II

• La funcion de verosimilitud esta dada por

Ln(θ) =∏y∗i >L

f ∗(yi |x i ,θ)∏y∗i ≤L

F ∗(L|x i ,θ)

=n∏

i=1

[f ∗(yi |x i ,θ)]di [F ∗(L|x i ,θ)]1−di ,

donde

di =

{1 si yi > L

0 si yi ≤ L.

• La funcion log-verosimil correspondiente es

log Ln(θ) =n∑

i=1

{di log f ∗(yi |x i ,θ) + (1− di ) log F ∗(L|x i ,θ)} .

Page 34: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Funcion Log-Verosimil variable censurada por arriba I

Variable censurada por la arriba:

• Para y < U, y = y∗. Por lo tanto,

f (y |x ,θ) = f ∗(y |x ,θ).

• Para y = U, f (y |x ,θ) es discreta. Por lo tanto,

f (y |x ,θ) = P(y∗ ≥ U) = 1− F ∗(U|x ,θ).

• Ası, la funcion de densidad de y condicional a x esta dada por

f (y |x ,θ) =

{f ∗(y |x ,θ) si y < U

1− F ∗(U|x ,θ) si y ≥ U.

Page 35: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Funcion Log-Verosimil variable censurada por arriba II

• La funcion de verosimilitud esta dada por

Ln(θ) =∏

y∗i <U

f ∗(yi |x i ,θ)∏

y∗i ≥U[1− F ∗(U|x i ,θ)]

=n∏

i=1

[f ∗(yi |x i ,θ)]di [1− F ∗(U|x i ,θ)]1−di ,

donde

di =

{1 si yi < U

0 si yi ≥ U.

• La funcion log-verosimil correspondiente es

log Ln(θ) =n∑

i=1

{di log f ∗(yi |x i ,θ) + (1− di ) log [1− F ∗(U|x i ,θ)]} .

Page 36: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Modelo Tobit I

• Si la densidad de y∗ condicional a x , f ∗(y∗|x ,θ), θ ∈ Θ ⊂ Rp,es especificada, entonces θ puede estimarse por maximaverosimilitud con base en la densidad condicional de y (truncadao censurada), f (y |x ,θ), dado que y = g(y∗).

I El modelo Tobit censurado o trauncado surge bajo el supuestode normalidad de los errores.

• El estimador MV truncado y censurado de θ es consistente yasintoticamente normal, sı f (·) esta especificada correctamente,lo cual requiere de una correcta especificacion de f ∗(·).

• El truncamiento y la censura cambian la densidad (y por lotanto, la media) condicional de y .

Page 37: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Modelo Tobit Censurado I

• Modelo censurado por debajo con L = 0, donde la variable y∗ eslineal en los parametros con errores aditivos i.i.d normal

y∗ = x>β + ε, ε|x ∼ N (0, σ2),

independiente de x = (x1, . . . , xp)>.

y =

{y∗ si y∗ > 0

0 si y∗ ≤ 0.

• Tambien se acostumbra escribir como

y =

{x>β + ε si ε > −x>β0 si ε ≤ −x>β,

donde ε|x ∼ N (0, σ2), e independiente de x .

Page 38: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Estimacion I

• La funcion de densidad de y condicional a x esta dada por

f (y |x ,β) =

1σφ(yi−x>i β

σ

)si y > 0

F ∗(0|x ,β) si y = 0,

donde

F ∗(0|x ,β) = P(y∗ ≤ 0|x ,β)

= P(x>β + ε ≤ 0|x ,β)

= P(ε ≤ −x>β)

= Φ(−x>β/σ) por el supuesto ε ∼ N (0, σ2)

= 1− Φ(x>β/σ) por simetrıa de Φ(·).

Page 39: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Estimacion II

• La funcion de verosimilitud esta dada por

Ln(β, σ2) =∏y∗i >0

1

σφ

(yi − x>i β

σ

) ∏y∗i ≤0

[1− Φ

(x>i βσ

)]

=n∏

i=1

[1

σφ

(yi − x>i β

σ

)]di [1− Φ

(x>i βσ

)]1−di=

n∏i=1

[1√

2πσ2exp

{− 1

2σ2

(yi − x>i β

)2}]di×[

1− Φ

(x>i βσ

)]1−di,

donde

di =

{1 si yi > 0

0 si yi ≤ 0.

Page 40: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Estimacion III

• La correspondiente funcion log-verosımil esta dada por

log Ln(β, σ2) =∑y∗i >0

[−1

2log 2π − 1

2log σ2 − 1

2σ2

(yi − x>i β

)2]

+∑y∗i ≤0

log

[1− Φ

(x>i βσ

)]

=n∑

i=1

{di

[−1

2log 2π − 1

2log σ2 − 1

2σ2

(yi − x>i β

)2]+ (1− di ) log

[1− Φ

(x>i βσ

)]},

Page 41: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Estimacion IV

• Las condiciones de primer orden estan dadas por

∂ log Ln∂β

=1

σ2

n∑i=1

di

(yi − x>i β

)− (1− di )

σφ(

x>i βσ

)1− Φ

(x>i βσ

) x i = 0,

y

∂ log Ln∂σ2

=n∑

i=1

di

− 1

2σ2+

(yi − x>i β

)22σ4

+ (1− di )

φ(

x>i βσ

)x>β

1− Φ(

x>i βσ

) 1

2σ3

= 0.

• Para la derivacion de la distribucion y varianza lımite delestimador de MV vease ? y ?.

Page 42: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Modelo Tobit Truncado I

• Modelo truncado por izquierda con L = 0, donde y = y∗ siy∗ > 0 es lineal en los parametros con errores aditivos i.i.dnormal

y = y∗ = x>β + ε, ε|x ∼ N (0, σ2),

independiente de x = (x1, . . . , xp)>.

• Tambien se acostumbra escribir como

y = x>β + ε si ε > −x>β.

Page 43: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Modelo Tobit Truncado II

Page 44: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Modelo Tobit Truncado III

Page 45: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Media y varianza del modelo Tobit I

• Media condicional (truncada)

E(y |x) = E(y∗|x , y∗ > 0)

= E(x>β + ε|x , x>β + ε > 0

)= E

(x>β|x , x>β + ε > 0

)+ E

(ε|x , x>β + ε > 0

)= x>β + E

(ε|ε > −x>β, x

)= x>β + σφ

(x>βσ

)/Φ

(x>βσ

)= x>β + σλ

Ver teorema 1

Page 46: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Media y varianza del modelo Tobit II

• Media condicional (censurada)

E(y |x) = P(y = 0|x)× E(y |x , y = 0) + P(y > 0|x)× E(y |x , y > 0)

= P(y∗ ≤ 0|x)× 0 + P(y∗ > 0|x)× E(y∗|x , y∗ > 0)

= P(y∗ > 0|x)× E(y∗|x , y∗ > 0)

= [1− P(y∗ ≤ 0|x)]× E(y∗|x , y∗ > 0)

=[1− P

(ε ≤ −x>β, x

)]×[x>β + E

(ε|ε > −x>β, x

)]=[1− Φ

(−x>β/σ

)]×[x>β + σφ

(x>βσ

)/Φ

(x>βσ

)]= Φ

(x>β/σ

)×[x>β + σφ

(x>βσ

)/Φ

(x>βσ

)]= Φ

(x>β/σ

)x>β + σφ

(x>βσ

)Ver Tambien el teorema 2.

Page 47: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Efectos marginales I

• Efectos marginales sobre y∗

∂E(y∗|x)

∂xj= βj .

• Efectos marginales (modelo truncado)

∂E(y |x , y > 0)

∂xj= βj +

∂E(ε|y∗ > 0)

∂xj

= βj + σ∂λ

∂xj

= βj + σ[zλ(z)− λ2(z)]

(−βjσ

)=[1− zλ(z)− λ2(z)

]βj .

Page 48: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Efectos marginales II

• Efectos marginales (modelo censurado)

∂E(y |x)

∂xj= Φ(z)βj .

• Efectos marginales sobre la probabilidad

∂P(y > 0|x)

∂xj= φ(z)βj/σ

donde λ(z) = φ(z)/Φ(z) con z = x>β/σ.

Page 49: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Seleccion muestral I

• Se presenta cuando se tiene Truncamiento incidental, que serefiere al hecho de que los encuestados se autoseleccionan en lamuestra al tomar o no una decision.

• Fuentes de datos microeconomicos observados:

X Encuestas de hogaresX EmpresasX Datos de mercadeo (ventas al por menor)X InternetX Datos gubernamentales.X Censos.

• Si una muestra aleatoria es obtenida correctamente, lasdistribuciones de probabilidad de los datos y de la poblacion soniguales.

• Desviaciones del muestreo causan divergencia entre ambasdistribuciones ⇒ sesgo muestral.

Page 50: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Seleccion muestral II

• Las desviaciones son generadas por incorrectos esquemas demuestrales ⇒ la muestra no es representativa de la poblacion.

Ejemplo:

− Un encuestado puede elegir no responder ciertas preguntas (i.e.nivel de ingreso) o no responder el cuestionario.

− Una solucion serıa usar los encuestados con respuestas completas.− Pero, si el interes es el ingreso medio de la poblacion, la media

muestral estarıa sesgada hacia abajo al no tener en cuenta laspersonas de ingreso alto.

• El problema de seleccion muestral puede provenir de:

X Auto-seleccion (participacion voluntaria de los individuos)X Seleccion muestral (individuos participantes en el estudio

sobre-muestreados)X Censura de la variable dependiente.

Page 51: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Seleccion muestral III

• En la practica, el problema de seleccion muestral parece ser masla regla que la excepcion.

• Hay tantos modelos de seleccion muestral como fuentes delproblema de seleccion de la muestra.

• Modelos de seleccion mas populares:

X Modelo bivariado de Heckman (1979)

X Modelo de Roy

X...

Page 52: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Modelo de seleccion bivariado de Heckman I

El modelo de Heckman se considera una generalizacion al modeloTobit, ya que se modelan dos decisiones.

• Sea y∗2 la variable latente de interes.

• En el modelo truncado estandar, y∗2 es observada si y∗2 > 0.

• El modelo considera una regla de observacion de y∗2 diferente,acorde con una nueva variable latente y∗1 :

y2 = y∗2 si y∗1 > 0.

• Esto es, y∗2 es observada cuando y∗1 > 0, y no cuando y∗1 ≤ 0.

Ejemplo: y∗1 > 0 determina la decision de si trabajar o no, y y∗2 ,cuanto tiempo trabajar, o el salario.

Page 53: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Modelo de seleccion bivariado de Heckman II

• El modelo se especifica en terminos de dos ecuaciones:

X Ecuacion de participacion (o seleccion):

y1 =

{1 si y∗1 > 0

0 si y∗1 ≤ 0.

X Ecuacion de resultado:

y2 = y∗2 si y∗1 > 0.

• El modelo estandar especifica un modelo lineal con erroresaditivos:

y∗1 = x>1 β1 + ε1, ε1|x1 ∼ N (0, 1)

y∗2 = x>2 β2 + ε2, ε2|x2 ∼ N (0, σ22),

donde Cov(ε1, ε2) = σ12.

Page 54: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Modelo de seleccion bivariado de Heckman III

• El modelo se conoce tambien como: modelo Tobit tipo 2,modelo Tobit generalizado,...

• Para y∗1 > 0, y∗2 es observada con probabilidad:

f ∗(y∗2 |y∗1 > 0)P(y∗1 > 0)

• Para y∗1 ≤ 0, lo unico que se observa es la probabilidad delevento

P(y∗1 ≤ 0)

• La funcion de verosimilitud esta dada por

Ln =n∏

i=1

{[P(y∗1i ≤ 0)]1−y1i × [f ∗(y∗2 |y∗1 > 0)P(y∗1 > 0)]y1i

}donde

y1i =

{1 si y∗1i > 0

0 si y∗1i ≤ 0.

Page 55: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Modelo de seleccion bivariado de Heckman IV

• Ln es aplicable a modelos mas generales, no solo a modeloslineales con errores conjuntamente Gaussianos.

• Medias condicionales:

E(y2|x , y∗1 > 0) = E(y∗2 |x , y∗1 > 0)

= E(x>2 β2 + ε2|x>1 β1 + ε1 > 0

)= x>2 β2 + E

(ε2|ε1 > −x>1 β1

)= x>2 β2 + E

(σ12ε1 + ζ|ε1 > −x>1 β1

)= x>2 β2 + σ12E

(ε1|ε1 > −x>1 β1

)= x>2 β2 + σ12φ

(x>1 β1

)/Φ(x>1 β1

),

teniendo en cuenta que, dado que la distribucion normal conjunta(z1

z2

)∼ N

[(µ1

µ2

),

(Σ11 Σ12

Σ21 Σ22

)]

Page 56: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Modelo de seleccion bivariado de Heckman V

implica que la distribucion condicional

z2|z1 ∼ N[µ2 + Σ21Σ−111 (z1 − µ1) ,Σ22 −Σ21Σ−111 Σ12

],

entonces

z2 = µ2 + Σ21Σ−111 (z1 − µ1) + ζ

donde ζ ∼ N(0,Σ22 −Σ21Σ−111 Σ12

), independiente de z1.

El resultado de la ultima lınea es por Teorema 1.

Page 57: Karoll GOMEZ kgomezp@unal.edu.co ://karollgomez.files.wordpress.com/2019/06/... · 2019-06-12 · CensuraI Datos censurados: I Suponga que y es la variable original no censurada

Modelo de seleccion bivariado de Heckman VI

• La regresion de MCO de y2 sobre x2 usando solamente losvalores positivos de y2 lleva a una estimacion inconsistente de β2

a menos que los errores esten incorrelacionados σ12 = 0.

• Heckman propuso un procedimiento de estimacion en dos etapasque es ineficiente (dada la dificultad de la estimacion usando MVla cual es eficiente):

1. Obtener un estimador β1 de la regresion binomial probit de y 1

sobre x1 dado que P(y∗1 > 0|x1) = Φ(x>1 β1

).

Usando el estimador β1 se obtienen la razon inversa de Mills, lacual captura el sesgo de seleccion y esta dada por:

φ(x>1i β1

)/Φ(x>1i β1

)2. Regresar los valores positivos de y 2 sobre x2 y la razon inversa de

Mills:

y2i = x>2iβ2 + σ12φ(x>1i β1

)/Φ(x>1i β1

)+ υi ,