pc1 econometría
TRANSCRIPT
-
5/23/2018 PC1 Econometr a
1/19
PONTIFICIA UNIVERSIDAD CATLICA DEL PER
PROGRAMA DE MAESTRA EN ECONOMA
SOLUCIONARIO DE LOS EJERCICIOS DE ECONOMETRA INTERMEDIA
MODELO CLSICO DE REGRESIN LINEAL - MDULO I
CURSO : ECONOMETRA INTERMEDIA
PROFESOR : Rodolfo Cermeo
ALUMNOS : - Mayo Urtecho, Herbert (20126484)
- Huacca Huanacuni, Diana (20133577)
- Cisneros Prado, Jimson (20136494)
Lima, Abril del 2014
-
5/23/2018 PC1 Econometr a
2/19
TRABAJO PRCTICO DE ECONOMETRA INTERMEDIA
Asignacin obligatoria
1. Obtenga una muestra aleatoria de 200 observaciones de la base de datos
referida y haga un breve anlisis descriptivo de las variables. Explique
brevemente el procedimiento empleado para obtener la muestra aleatoria.
Para realizar este ejercicio se utiliza la base de datos proporcionada en el Salarios.xlsx, el cual
contiene 1000 observaciones sobre la variable dependiente salario y sus determinantes, la cual
utilizaremos para obtener una muestra aleatoria de 200 observaciones.
Los pasos para realizar ello son los siguientes:
i) Abrimos la base de datos a travs del programa Eviews 8, a travs del siguiente
comando: wfopen C:\Users\hmayo\Desktop\Salarios.xlsx
Esto crea un archivo .wf con el nombre de salarios, con un tamao de 1000
observaciones y contiene las siguientes variables logsalario edad educacin estado
tiempo experiencia sindicalizado sidicalto.
ii) Para poder obtener la muestra de 200 observaciones a partir de la base de datos se hautilizado un program de eviews , el cual a travs de un comando permite obtener una
muestra aleatoria:
pagecopy(page=muestra, wf=workfile2, rndobs=200)
De esta forma creamos un nuevo workfile: workfile2 que tiene 200 observaciones
aleatorias como tamao de muestra.
iii) Finalmente guardo el nuevo archivo de trabajo creado (workfile2) a travs del siguiente
comando:
wfsaveC:\Users\hmayo\Desktop\workfile2
Las variables que tenemos en la muestra son los siguientes:
Logsalario: Aqu estn los valores del logaritmo del salario de los individuos.
Edad: Representa la edad de los individuos.
Educacin: Representa a los aos de educacin que tienen los individuos.
Experiencia: Representa los aos de experiencia de los individuos.
Estado: Es una variable dummy, en la cual casado=1 y no casado=0.
Sindicalizado: Es una variable dummy, en la cual, si est sindicalizados=1 y no
sindicalizados=0.
-
5/23/2018 PC1 Econometr a
3/19
Tiempo: Es una variable dummy, en la cual, si trabaja a tiempo parcial=1 y no=0.
Sidicalto: Es una variable dummy, en la cual si trabaja en una empresa altamente
sindicalizada=1 y no=0.
Para las variables Cuantitativas
Tabla N 1.1
EDAD EDUCACION EXPERIENCIA
Mean 35.38500 12.98000 17.40500
Median 32.50000 12.00000 15.00000
Maximum 64.00000 18.00000 55.00000
Minimum 17.00000 4.000000 1.000000
Std. Dev. 12.47014 2.494134 12.64756
Skewness 0.521818 0.030611 0.698713
Kurtosis 2.233677 3.416574 2.564916
Jarque-Bera 13.97022 1.477348 17.85083Probability 0.000926 0.477747 0.000133
Sum 7077.000 2596.000 3481.000
Sum Sq. Dev. 30945.36 1237.920 31832.20
Observations 200 200 200
De acuerdo a la Tabla N 1.1 apoyados en la prueba de Jarque-Bera se observa que slo la
variable Educacin presenta distribucin normal, mientras que las variables Edad y Experiencia
presentan distribucin No normal, lo cual indican dispersin relativamente alta en los datos, si
bien estos constituyen un problema para las regresiones que vamos a hacer ms adelante,
igual continuaremos pero teniendo en cuenta estos inconvenientes.
Panel N 1
Variables Cualitativas
-
5/23/2018 PC1 Econometr a
4/19
El Panel N 1 nos muestra la distribucin de observaciones para cada valor especfico que adoptan las
dummies.
2. Especifique una funcin de salarios apropiada para responder a la pregunta (4)
y estime los parmetros por el mtodo de mnimos cuadrados.
Especificaremos como funcin de salarios apropiada a un modelo con Dummies
multiplicativas, de tal forma que nos ayude a responder las preguntas en la parte 4).
. . . . . . . . . . . . . (1)Donde:
{
Estimando el modelo por el Mtodo de Mnimos Cuadrados:
-
5/23/2018 PC1 Econometr a
5/19
Cuadro N 4.1
Dependent Variable: LOGSALARIO
Method: Least Squares
Sample: 1 200
Included observations: 200
Variable Coefficient Std. Error t-Statistic Prob.
C 0.362673 0.196586 1.844857 0.0666
EXPERIENCIA 0.018418 0.002635 6.988695 0.0000
EDUCACION 0.117149 0.013906 8.424085 0.0000
SINDICALIZADO 1.364188 0.590132 2.311667 0.0218
SINDICALIZADO*EDUCACION -0.085612 0.047383 -1.806807 0.0723
R-squared 0.374319 Mean dependent var 2.259360
Adjusted R-squared 0.361484 S.D. dependent var 0.575383
S.E. of regression 0.459773 Akaike info criterion 1.308513
Sum squared resid 41.22122 Schwarz criterion 1.390971
Log likelihood -125.8513 Hannan-Quinn criter. 1.341882
F-statistic 29.16508 Durbin-Watson stat 1.921021
Prob(F-statistic) 0.000000
Por lo tanto la regresin estimada sera:
3. Interprete cada uno de los coeficientes obtenidos y evale su significancia
individual y conjunta.
El modelo especificado es un modelo Log-Lin el cual muestra la sensibilidad porcentual de los
salarios ante cambios unitarios en nivel en las variables explicativas, en este sentido cada uno
de los coeficientes recoge esa sensibilidad, suponiendo que el resto de las variables
permanecen constantes (Ceteris Paribus).
Interpretacin: De la regresin realizada en el Cuadro N 4.1, todos los parmetros estimados
son estadsticamente significativos para un nivel de 5% a excepcin del intercepto y de laDummy multiplicativa, En este sentido, un ao adicional de experiencia en las personas les
permite incrementar su sueldo promedio en 1.8%.
En cuanto a los retornos de la educacin, muestran que un ao adicional de educacin
incrementa sus sueldos en promedio un 11.7%.
Mientras que la diferencial de los sueldos de las personas que son sindicalizadas con respecto
a las personas que no lo son es 136.4% ms en promedio, y finalmente la diferencial de los
sueldos de las personas que se encuentran en un sindicato y que adems tienen ms aos de
educacin con respecto a los que no lo son y tienen pocos aos de educacin es de 8.5%
menos en promedio (pero cabe recalcar que este ltimo no es estadsticamente significativo).
-
5/23/2018 PC1 Econometr a
6/19
La columna de la desviacin estndar recoge la desviacin tpica estimada de los estimadores
y mide, siempre que los estimadores sean insesgados, la precisin con la que son estimados los
parmetros. O dicho de otro modo, nos indican el grado de confianza que podemos depositar
nuestras estimaciones.
Prueba de Significancia Individual (t):
El estadstico calculado:
Tabla N 1.1
Hiptesis t-Statistic Prob.
1.844.857 0.0666 6.988.695 0.0000 8.424.085 0.0000 2.311.667 0.0218 -1.806.807 0.0723
Como mencionamos lneas arriba, todos los parmetros estimados son estadsticamente
significativos para un nivel de 5% a excepcin del intercepto y de la Dummy multiplicativa.
El P-value asociado al estadstico t-Student es menor al 5% para los coeficientes asociados a
las variables Experiencia, Educacin y la variable Dummy: Sindicalizado, por lo que no
encontramos evidencia suficiente para afirmar que los coeficientes de manera individual son
iguales a cero, entonces rechazamos y concluimos que slo los coeficientes ( )estimados son estadsticamente significativos.
Prueba de Significancia Conjunta (F):
El estadstico calculado se obtendr a partir de:
( )
-
5/23/2018 PC1 Econometr a
7/19
De acuerdo a este estadstico, el P-value asociado al estadstico F-Snedecor es menor al 5%
por lo que no encontramos evidencia suficiente para afirmar que los coeficientes en su
conjunto son iguales a cero, por lo que rechazamos y concluimos los coeficientes estimadosson estadsticamente significativos.
4. Evale las siguientes hiptesis:
i. Un ao adicional de experiencia produce el mismo crecimiento del salario que un ao
adicional de educacin.
De acuerdo a nuestro modelo (1), planteamos la Prueba de Hiptesis:
Para que un ao adicional de experiencia produzca el mismo crecimiento de salarios que un
ao adicional de Educacin, entonces debemos de probar que los coeficientes asociados a las
variables Experiencia y Educacin ( ) son iguales.Prueba de Significancia Individual: Prueba t -Student
Lo obtendremos a partir de la Prueba de Wald, dado que nos d los estadsticos de la prueba t-
Student.
Cuadro N 4.2 Test de Wald
Wald Test:Equation: EQ1
Test Statistic Value df Probability
t-statistic -7.137527 195 0.0000
F-statistic 50.94430 (1, 195) 0.0000
Chi-square 50.94430 1 0.0000
Null Hypothesis: C(2)-C(3)=0
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) - C(3) -0.098731 0.013833
De acuerdo al cuadro N 4.2 podemos ver que el P-value asociado al estadstico t-student es
menor al 5% por lo que no encontramos evidencia suficiente para afirmar que el coeficiente
son iguales a cero, por lo que rechazamos
y concluimos que un ao adicional de
experiencia produce un incremento de salarios porcentual distinto que un ao adicional de
-
5/23/2018 PC1 Econometr a
8/19
Educacin. Especficamente para este caso segn nuestro modelo, resulta que los retornos de
la educacin (0.117) son mayores que los retornos de la experiencia (0.018).
ii. El salario de entrada al mercado laboral es el mismo para sindicalizados y no
sindicalizados
De acuerdo a nuestro modelo (1), podemos obtener:
I) Funcin de salarios para trabajadores sindicalizados
II) Funcin de salarios para trabajadores No sindicalizados.
Planteamos la hiptesis:
Para que el salario de entrada al mercado laboral sea el mismo para sindicalizados y No
sindicalizados, entonces debemos de probar que el coeficiente asociado a la variable
Sindicalizados sea .Prueba de Significancia Individual: Prueba t -Student
.
De acuerdo al cuadro N 4.1 podemos ver que el P-value asociado al estadstico t-student es
menor al 5% por lo que no encontramos evidencia suficiente para afirmar que el coeficiente
es igual a cero, por lo que rechazamos y concluimos que el salario de entrada almercado laboral es distinto para sindicalizados y No sindicalizados.
iii. Un ao adicional de educacin produce el mismo crecimiento de los salarios tanto para
trabajadores sindicalizados como para no sindicalizados.
De las ecuaciones que obtuvimos en la pregunta anterior, continuando:
I) Funcin de salarios para trabajadores sindicalizados
II) Funcin de salarios para trabajadores No sindicalizados.
-
5/23/2018 PC1 Econometr a
9/19
Planteamos las hiptesis:
Para que un ao adicional de educacin produzca el mismo crecimiento de los salarios tanto
para trabajadores sindicalizados como para no sindicalizados, entonces debemos de probar
que el coeficiente asociado a la variable multiplicativa Sindicalizados*Educacin sea
.Prueba de Significancia Individual: Prueba t -Student
.
De acuerdo al cuadro N 4.1 podemos ver que el P-value asociado al estadstico t-student es
mayor al 5% por lo que aqu si encontramos evidencia suficiente para afirmar que el
coeficiente es igual a cero, por lo que No rechazamos y concluimos que un aoadicional de educacin produce un crecimiento porcentual de salarios similar en los
trabajadores sindicalizados respecto a no sindicalizados.
Pregunta 5.- Estime una funcin de salarios que incluya un intercepto y al menos 3 variables
explicativas. Evale las siguientes hiptesis:
i)La funcin de salarios es la misma para trabajadores jvenes (30 aos o menos) que para
trabajadores No jvenes (mayores de 30 aos).
Solucin:
i)Iniciaremos creando otra variable Dummy que nos represente a los trabajadores jvenes:
{
Sea nuestro modelo con 3 variables explicativas, con 2 dammies Aditivas:
. . . . . . . . . . . . . (1)Donde:
{
-
5/23/2018 PC1 Econometr a
10/19
Cuadro N 5.1
Dependent Variable: LOGSALARIO
Method: Least Squares
Sample: 1 200
Included observations: 200
Variable Coefficient Std. Error t-Statistic Prob.
C 1.338393 0.191323 6.995466 0.0000
EDUCACION 0.073900 0.013781 5.362349 0.0000
DUMMY -0.383158 0.075164 -5.097660 0.0000
ESTADO 0.191681 0.078291 2.448309 0.0152
R-squared 0.317305 Mean dependent var 2.259360
Adjusted R-squared 0.306856 S.D. dependent var 0.575383
S.E. of regression 0.479037 Akaike info criterion 1.385720
Sum squared resid 44.97739 Schwarz criterion 1.451686
Log likelihood -134.5720 Hannan-Quinn criter. 1.412415
F-statistic 30.36587 Durbin-Watson stat 1.946620
Prob(F-statistic) 0.000000
De acuerdo a nuestro modelo (1) podemos obtener varias funciones de salarios, las cuales
iremos evaluando si estas son las mismas para trabajadores Jvenes y NO jvenes segn su
estado civil (casados y no casados):
I) Funcin de salarios para trabajadores jvenes y casados.
II) Funcin de salarios para trabajadores No jvenes y casados.
Prueba de Hiptesis: La funcin de salarios es la misma para trabajadores jvenes que para
trabajadores No jvenes, ambos Casados?
Para que la funcin de salarios sea la misma, entonces debemos de probar que el coeficiente
asociado a la Dummy (Trabajador joven y joven) es no significativa.Prueba de Significancia Individual: Prueba t -Student
De acuerdo al cuadro N 5.1 podemos ver en el estadstico t-student y el P-value asociado a
este estadstico:
-
5/23/2018 PC1 Econometr a
11/19
Tabla N 1
t-Statistic Prob.
-5.097.660 0.0000
De manera que, para un nivel de significancia de 5% no encontramos evidencia suficiente para
afirmar que el coeficiente es igual a cero, por lo que rechazamos y concluimos que lasfunciones de salarios de trabajadores jvenes y no jvenes, ambos casados son distintas.
Grfica N 5.1
III) Funcin de salarios para trabajadores jvenes y NO casados.
IV) Funcin de salarios para trabajadores NO jvenes y NO casados.
Prueba de Hiptesis: La funcin de salarios es la misma para trabajadores jvenes que para
trabajadores No jvenes, ambos NO Casados?
De la misma forma que en el anterior caso tenemos que probar que el coeficiente asociadoa la Dummy (Trabajador joven y joven) es no significativa.
Dado que ya fue probada, entonces concluimos que las funciones de salarios de trabajadores
jvenes y no jvenes, ambos NO casados son distintas.
Grfica N 5.2
Educacin
LogSalarios (W)
-
5/23/2018 PC1 Econometr a
12/19
ii)Bajo la restriccin de que el intercepto es el mismo, las pendientes de la funcin de salario
son las mismas para trabajadores jvenes y no jvenes.
Solucin
Dado que en la ecuacin (1) especificamos un modelo nicamente con Dummies ADITIVAS y
no MULTIPLICATIVAS, entonces la pendiente de la grfica el cual nos muestra el efecto en los
salarios por cada ao adicional de educacin tanto en trabajadores jvenes como no jvenes
es el mismo.
PERO, si cambiamos la especificacin (1) a esta nueva, tendramos los siguientes resultados.
. . (2)
I) Funcin de salarios para trabajadores jvenes y NO casados.
II) Funcin de salarios para trabajadores NO jvenes y NO casados.
Educacin
LogSalarios (W)
-
5/23/2018 PC1 Econometr a
13/19
Cuadro N 5.2
Dependent Variable: LOGSALARIO
Method: Least Squares
Sample: 1 200
Variable Coefficient Std. Error t-Statistic Prob.
C 1.518787 0.224106 6.777079 0.0000
EDUCACION 0.060369 0.016329 3.696936 0.0003
DUMMY -0.971305 0.391199 -2.482895 0.0139
ESTADO 0.189636 0.078035 2.430133 0.0160
DUMMY*EDUCACION 0.045780 0.029887 1.531793 0.1272
R-squared 0.325422 Mean dependent var 2.259360
Adjusted R-squared 0.311585 S.D. dependent var 0.575383
S.E. of regression 0.477400 Akaike info criterion 1.383759
Sum squared resid 44.44262 Schwarz criterion 1.466217
Log likelihood -133.3759 Hannan-Quinn criter. 1.417128
F-statistic 23.51745 Durbin-Watson stat 1.948832
Prob(F-statistic) 0.000000
Prueba de Hiptesis: La funcin de salarios es la misma para trabajadores jvenes que para
trabajadores No jvenes, ambos NO Casados?
Para que la funcin de salarios sea la misma, entonces debemos de probar que el coeficiente
asociado a la variable interactiva (Trabajador joven y joven condeterminada cantidad de aos de educacin) es NO significativa.
Prueba de Significancia Individual: Prueba t -Student
De acuerdo al cuadro N 5.2 podemos ver en el estadstico t-student y el P-value asociado a
este estadstico:
Tabla N 2
t-Statistic Prob.
1.531793 0.1272
De manera que, para un nivel de significancia de 5% encontramos evidencia suficiente para
afirmar que el coeficiente es igual a cero, por lo que NO rechazamos y concluimos quelas funciones de salarios de trabajadores jvenes y no jvenes, ambos NO casados son las
mismas.
-
5/23/2018 PC1 Econometr a
14/19
Bajo la restriccin de que el intercepto es el mismo, osea , y en base a lo encontradoen la prueba de hiptesis , tenemos:
Grfica N 5.3
Asignacin Opcional:
Obtenga lo que se pide a continuacin utilizando su propia programacin con matrices, con los
datos de la muestra aleatoria.
(i) Estime el vector de parmetros estimado por MCO de una funcin de salarios que tenga
como mnimo un intercepto y 4 variables explicativas.
Solucin:
Especificamos el modelo con 4 variables explicativas y un intercepto:
. . . . . (3)Expresamos matricialmente:
Educacin
LogSalarios (W)
-
5/23/2018 PC1 Econometr a
15/19
[
]
Cuadro N 5.3
Dependent Variable: LOGSALARIO
Method: Least Squares
Sample: 1 200
Included observations: 200
Variable Coefficient Std. Error t-Statistic Prob.
C 0.537128 0.194567 2.760631 0.0063
EDAD 0.017047 0.002566 6.643613 0.0000
EDUCACION 0.085976 0.012799 6.717616 0.0000
TIEMPO -0.466791 0.109743 -4.253482 0.0000
SINDICALIZADO 0.270856 0.084019 3.223741 0.0015
R-squared 0.417855 Mean dependent var 2.259360
Adjusted R-squared 0.405914 S.D. dependent var 0.575383
S.E. of regression 0.443488 Akaike info criterion 1.236391
Sum squared resid 38.35293 Schwarz criterion 1.318849
Log likelihood -118.6391 Hannan-Quinn criter. 1.269760
F-statistic 34.99209 Durbin-Watson stat 1.809567
Prob(F-statistic) 0.000000
Vector de parmetros estimados:
Explicacin:
De la regresin, podemos ver que un ao adicional de edad en las personas les permite
incrementar su sueldo promedio en 1.7% ms.
En cuanto a los retornos de la educacin, muestran que un ao adicional de educacin
incrementa en promedio un 8.6% ms los sueldos, mientras que la diferencial de los sueldos
de las personas que trabajan a tiempo parcial con respecto a las personas que trabajan atiempo completo es 46,7% menos en promedio, y finalmente la diferencial de los sueldos de
-
5/23/2018 PC1 Econometr a
16/19
las personas que se encuentran en un sindicato con respecto a los que no se encuentran es de
27.1% ms en promedio.
Todos los parmetros estimados son estadsticamente significativos para un nivel de 5%
(ii) Obtenga el vector de valores estimados: y el de residuos estimados: Solucin:
Se sabe que elvector de variables endgenas (Y):
Dado:
Pero tambin se sabe: Ver los resultados de la estimacin de y con el archivo WorkFile del eviews:
(iii) Obtenga lo solicitado en (ii) utilizando las matrices P (proyeccin) y M (aniquiladora) y
comprelos con los resultados de (i).
Solucin:
De acuerdo a la geometra del MCO, y especficamente a las proyecciones Ortogonales,
tenemos:
Para :Sabemos que:
Donde:
;
-
5/23/2018 PC1 Econometr a
17/19
Donde M es una matriz simtrica e idempotente:
Ver los resultados de la estimacin de con el archivo WorkFile del eviews adjuntado:
Para :De:
Donde: Ver los resultados de la estimacin de con el archivo WorkFile del eviews adjuntado:
(iv) Obtenga la matriz de momentos y el valor estimado .
'Creacin de la matriz X'XMATRIX XX=@TRANSPOSE(X)*X
'Calculando el tamao de N y KSCALAR K=@COLUMNS(X)SCALAR N=@ROWS(Y)SCALAR L=N-K
'Clculo de sigma estimado
SCALAR SIGMA_E=(@TRANSPOSE(UEST)*UEST)/L
-
5/23/2018 PC1 Econometr a
18/19
(v) Obtenga la matriz de covarianza de los parmetros estimados.
'Calculamos la matriz de varianzas-covarianzasMATRIX Q=@INVERSE(XX)MATRIX VAR=SIGMA_E*SIGMA_E*Q
(vi) Obtenga el sub-vector de valores de los tres primeros parmetros de su modelo
utilizando regresin particionada y comprelo con los resultados de (i).
Supongamos que la regresin incluye dos conjuntos de variables
La solucin para el sistema de ecuaciones es el siguiente:
El programa utilizado para la resolver (vi):
'Formamos X1GROUP G2 i Edad Educacionstom(g2, X1) ' generamos la matriz X1
'Formamos X2
GROUP G3 tiempo Sindicalizadostom(g3, X2) ' generamos la matriz X2
'Generamos la matrix M1matrix i_1 = @identity(@rows(X1))MATRIX M1=i_1-X1*@INVERSE(@TRANSPOSE(X1)*X1)*@TRANSPOSE(X1)
'Generamos la matrix M2matrix i_2 = @identity(@rows(X2))MATRIX M2=i_2-X2*@INVERSE(@TRANSPOSE(X2)*X2)*@TRANSPOSE(X2)
'Calculamos los vectores beta1 y beta de las regresiones particionadasvector beta1 = @inverse(@transpose(X1)*M2*X1) * @transpose(X1)*M2*Yvector beta2 = @inverse(@transpose(X2)*M1*X2) * @transpose(X2)*M1*Y
-
5/23/2018 PC1 Econometr a
19/19
Observamos que los parmetros calculados a travs de regresiones particionadas es la misma
que la regresin original.