modelo de efeitos fixos - unicamp · efeitos não observados -conceito 6 q=2 q=2 q=4 q=4 q=6 q=6...
TRANSCRIPT
ModelodeEfeitosFixos
1
EmentaVariáveisOmitidasEfeitosfixos– One-Way,Two-Way,CoeficientesAngularesDinâmicosModelodePrimeiraDiferençaeAvaliaçãodeImpactos
Bibliografia
Wooldridge,J.M.2001. Econometricanalysisofcrosssectionandpaneldata.Cap.10.
CE731– EconometriaIIProf.AlexandreGoriMaiaInstitutodeEconomia- UNICAMP
DadoesemPainel - Definição
2
• Dadosempainelsãoumcasoespecíficodedadosempilhados:
Amostras independentes são coletadas em diferentes períodos de tempo. Assim, as observações não apresentam necessariamente a mesma distribuição ao longo do tempo, ou seja, as relações de causa e feito podem ser diferentes em cada momento histórico.t=
0 ...10X
00nX
...11X
11nXt=1
… …
Uma mesma amostra é observada em diferentes períodos do tempo. Assim, os indivíduos se repetem em todos os períodos e as amostras são de tamanhos semelhantes em todos os períodos.
t=0
...10X
0nX...11X
1nX
t=1 …
…
DadosemPainel - Exemplo
3
• Considereasinformaçõessobrerendamédiadotrabalhoetaxadedesempregoparaas5regiões(maisDF)noBrasilentre1995e2006(Obs:nãoháinformaçõesparaoanode2000):
• ImportandoaplanilhaDados_RendaDesemprego.XLScomasinformações:
DadosemPainel - Exemplo
4
• Podemos,inicialmente,ajustarummodelodedadosempilhados:
ititit eTDRenda ++= 10 bb
• Teríamos:
• ComoPROCGLM:
Estima-se que, para cada ponto percentual adicional à taxa de desemprego, a renda média no país tende a crescer 62,5 reais. Entretanto, este modelo desconsidera a heterogeneidade do comportamento da renda e da taxa de desemprego nas regiões do país. Em outras palavras, considera, por exemplo, que, dada uma taxa de desemprego, a renda média seria a mesma em todas as regiões. Da mesma forma, considera que a relação entre taxa de desemprego e renda do trabalho dada pelo coeficiente angular é a mesma em todas as regiões.
1,..,111,..,6 == ieiOnde
ViésdeOmissão- Conceito
5
• SuponhaqueaproduçãoY dependadaeficáciadeumfertilizanteFedaqualidadedosoloQ;
• Entretanto,senãotivermososdadosdaqualidadeQ dosolo,arelaçãodaproduçãoY comaquantidadeF deumfertilizantepodesertendenciosa;
Q=2 Q=2 Q=4 Q=4 Q=6 Q=6
Y=2000 Y=2200 Y=4000 Y=4000 Y=6200 Y=6000
F=2 F=4 F=6 F=8 F=10 F=12
iiii eQFY +++= 21 bba iii eFY ++= 1ba
F
Y
Q=4Q=6
Q=2F
Y
EfeitosnãoObservados- Conceito
6
Q=2 Q=2 Q=4 Q=4 Q=6 Q=6
Y=2000 Y=2200 Y=4000 Y=4000 Y=6200 Y=6000F=2 F=4 F=6 F=8 F=10 F=12
• CasoQ nãosejaobservado,podemosrepresentá-loporumefeitoc,chamadoefeitonãoobservado.
• Suponhaagoraquecadaparcela(i=1,2,3)sejaobservadaemdoisperíodosdistintos(t=0,1);
• Sesupormosqueaqualidadedosolosejadiferenteentreasparcelas,masconstantenotempo,podemoscontrolarseuefeitocombináriasparadiscriminarcadaparceladeterra(D1=1parai=1,D2=1parai=2,parcela3comoreferência);
i=1 i=1 i=2 i=2 i=3 i=3t=0 t=1 t=0 t=1 t=0 t=1
iiii eQFY +++= 21 bbaitiiitit eDcDcFY ++++= 21 21ba Q=4
Q=6
Q=2F
Y
D2=1D1=0;D2=0
D1=1iiii ecFY +++= 1ba
D1=1;D2=0 D1=0;D2=1 D1=0;D2=0
Ondecéumavariávelaleatórianãoobservada,tambémchamadadeefeitonãoobservado.Umapressuposiçãofrequente emanálisededadosempaineléqueoefeitodec sejaconstantenotempo.Assim,teríamosaseguinteespecificação:
ccyE += xβx ),|(
• Vamosassumirquearelaçãoentrey eX ≡(X1,X2,...,Xk)sejadadapor:
• Casoc nãosejacorrelacionadoàsvariáveisindependentes– Cov(Xj,c)=0–entãoc seráapenasmaisumdosfatoresnãoobserváveisacomporemoerrodomodeloderegressão.Nessesentido,podemosaplicarMQOdemaneiraanálogaàamostradedadosempilhados.Entretanto,casoCov(Xj,c)≠0,essasestimativastornar-se-ãoviesadas einconsistentes.
OndeE(et|xt,c)=0
VariáveisOmitidas- Definição
ttt ecy ++= βx
7
• Quandoi discriminaindivíduos,ci échamadodeefeitoindividualouheterogeneidadeindividual.Otermoeit édenominadoerroidiossincrático,jáquevariaaleatoriamenteparatodososindivíduoseperíodos.
• Omodelodeefeitosfixospressupõequeci representeparâmetrosdapopulaçãoaseremestimados(porissoonomeefeitofixo).Ummaneirasimplesdeestimarefeitosfixosédadopelaregressãocomvariáveisbinárias:
• Sejaomodelocomefeitosnãoobservadosdadopor:
itiitit ecY ++= βx
itnnkj jjit eIcIcXY
iiit+++++= å = ...2210 bb
OndeIji=1sej=i,Iji=0sej≠i.Osestimadoresdecj sãodenominadosestimadoresdevariáveisbinárias.Ointerceptob0 refere-seaoefeitoparaoindivíduoutilizadocomoreferência.Naespecificaçãoproposta,parai=1.Assim,cadacoeficientecj representaráadiferençaemrelaçãoàunidadedereferência(i=1).
• Alternativamente,pode-seconsiderarummodelosemintercepto.Nessecaso,variáveisbináriaisparatodasasunidadesdecortetransversaldeverãoserconsideradasecadacoeficientecj representaráointerceptodeseurespectivoindivíduo:
itnnkj jjit eIcIcIcXY
iiiit+++++=å =
...22111b
EfeitosFixos–One-Way
8
• VáriosprocedimentospodemestimarmodeloscomdadosempainelnoSAS:
One-Way - Exemplo
• PROCREG:exigeacriaçãopréviadevariáveisbináriaspararepresentarosefeitosindividuais(e/outemporais):
• PROCGLM:avariávelidentificandoosindivíduosdeveserdeclaradacomonominalnocomandoCLASS:
• PROCMIXED:procedimentoanálogoaodoPROCGLM:
• PROCPANEL:omaisapropriadoparadadosempainel.Alémdefacilitaramanipulaçãodosefeitosindividuais/temporais,realizaumasériedetesteseapresentagráficos(ODSGRAPHICS)paradadosempainel:
9
One-Way - Exemplo
10
• Ajustandoomodeloone-way comoprocedimentoPANELeaopçãoFIXONEteremos:
Além das estimativas dos efeitos individuais e coeficientes angulares, o PROC PANEL disponibiliza , através da comando ODS GRAPHICS, uma série de gráficos para analisar a qualidade do ajuste. A ordem das binárias é aquela que aparece na base de dados (CS1=CO, CS2=DF, CS3=NE, CS4=NO, CS5=SE e SU como referência).
Assim,os resultados sugerem, por exemplo, uma renda significativamente superior para o DF em relação às demais regiões, independente da taxa de desemprego (a renda média no DF é 678 reais superior à da região SU). Controlando-se os efeitos regionais, cada variação de 1 ponto percentual na taxa de desemprego tende a reduzir, em média, em 15 reais o rendimento médio na região.
• Omodelodeefeitosfixostwo-way consideraqueointerceptopossavariarentreasunidadesdecortetransversal(indivíduos)eentreosperíodos.Paraestimarosefeitosfixosporvariáveisbinárias,teríamosaseguinteespecificação:
EfeitosFixos– Two-Way
11
itTTnnkj jjit ePctPctIciIciXY
ttiiit++++++++= å = ...... 222210 bb
OndePji=1sej=t,Pji=0sej≠t.Ointerceptob0 refere-seaoefeitoparaoindivíduoeoperíodoutilizadocomoreferência.Naespecificaçãoproposta,parai=1et=1.
• Paraestimarmodelocomefeitoparaasunidadesdecortetransversal(i)etempo(t)noSAS,utilizamosarotinaPROCPANELcomaopçãoFIXTWO:
Two-Way - Exemplo
12
• Ajustandoomodelotwo-way comoprocedimentoPANELeaopçãoFIXTWOteremos:Este ajuste considera diferentes interceptos para cada região e ano.As estimativas sugerem que as rendas médias de todas as regiões se diferenciam significativamente da região Sul. Ademais, todos os anos tendem a se diferenciar negativa e significativamente de 2006, mantendo-se os demais fatores constantes. Em outras palavras, independente da taxa de desemprego, a renda média de cada região seria significativamente superior em 2006 em relação aos demais anos.
Variable DF EstimateStandard
Error t Value Pr > |t|CS1 1 -60.3401 18.0347 -3.35 0.0016CS2 1 658.0945 44.9168 14.65 <.0001CS3 1 -327.649 21.4338 -15.29 <.0001CS4 1 -97.1123 28.4451 -3.41 0.0013CS5 1 165.7803 27.7447 5.98 <.0001TS1 1 -82.1599 27.2929 -3.01 0.0041TS2 1 -61.7649 24.1449 -2.56 0.0137TS3 1 -49.1153 23.4820 -2.09 0.0417TS4 1 -58.7497 23.7023 -2.48 0.0167TS5 1 -101.867 26.6467 -3.82 0.0004TS6 1 -117.423 24.5088 -4.79 <.0001TS7 1 -18.7515 24.7444 -0.76 0.4522TS8 1 -82.8291 25.3132 -3.27 0.0020TS9 1 -78.9877 23.6331 -3.34 0.0016TS10 1 -48.5744 24.1776 -2.01 0.0501Intercept 1 887.6962 50.3144 17.64 <.0001TD 1 -11.9848 6.4443 -1.86 0.0689
• Podemosaindaconsiderardiferentesinterceptosecoeficientesangularesparaosindivíduos(e/ouperíodos),incorporandointeraçõesentreasbináriasquediscriminamosindivíduos(e/ouperíodos)eavariávelexplanatóriadeinteresse:
CoeficientesAngularesInterativos
13
• Modeloscomcoeficientesangularesinterativosmerecemcautela.Ainterpretaçãopodesetornarmuitocomplicadacasoonúmerodeinteraçõessejaelevado,alémdeconsumirmuitosgrausdeliberdade.
• ParaconsiderarmoscoeficientesangularesinterativosnoSAS,utilizamososímbolodeinteração“*”nocomandoMODELdoPROCPANEL:
itT
kitkk
n
jitjj
T
kkk
n
jjjitit eXTXIPctIciXY
titi++++++= åååå
==== 2222qdba
a incorporação do termo de interação será entre variáveis numéricas (X) e nominais (i ou t). No caso, é necessário especificar que as variáveis i ou t são de classificação com o comando CLASS.
• AplicandoaopçãodeinteraçãoentreaTDearegiãonoPROCPANEL:
CoeficientesInterativos- Exemplo
14
O produto entre a variável binária e TD representa coeficientes angulares interativos, ou seja, diferentes para cada região.Apenas os coeficientes angulares para o DF e a região SE são significativos. Em outras palavras, a relação negativa entre TD e renda seria significativa apenas nas duas regiões mais ricas. Esses resultados devem ser interpretados com cautela, já que o modelo consome um número relativamente elevados de graus de liberdade (muitas variáveis independentes).
Variable DF EstimateStandard
Error t Value Pr > |t|CS1 1 -211.971 206.9 -1.02 0.3102CS2 1 631.8122 166.4 3.80 0.0004CS3 1 -446.151 161.8 -2.76 0.0079CS4 1 -41.5961 189.5 -0.22 0.8271CS5 1 240.1328 162.8 1.47 0.1461Intercept 1 875.789 122.3 7.16 <.0001TD 0 0 . . .TDREGIAOCO 1 -0.04718 19.8584 -0.00 0.9981TDREGIAODF 1 -13.8032 7.9814 -1.73 0.0894TDREGIAONE 1 -4.98596 10.9893 -0.45 0.6519TDREGIAONO 1 -21.6682 12.9960 -1.67 0.1012TDREGIAOSE 1 -23.5122 9.7209 -2.42 0.0190TDREGIAOSU 1 -18.8185 16.0215 -1.17 0.2453
Algumasdasvantagensdetrabalharcomdadosempainel:
a)Permiteidentificarefeitosquenãoseriamdetectadosisoladamentecomdadosemcortetransversalousériestemporais:porexemplo,verificarsimultaneamentecomocaracterísticasdaempresa(cortetransversal)emudançastecnológicas(dadostemporais)afetamprodutividadedeindústrias;
b)maiornúmerodegrausdeliberdade:otamanhodaamostraéoprodutodonúmerodeobservaçõesindividuais(amostradedadostransversais)pelotamanhodasérietemporal;
c)diminuidificuldadesinerentesàsvariáveisomitidas:porexemplo,avariaçãonarendamédiapodeserdevidaacaracterísticasespecíficanãoobserváveis.Emumaregressãoconvencionalesseefeitoestariadiluídonamédia;emdadosempainelpodesercaptadoexclusivamentepeloscoeficientesindividuais;
DadosemPainel - Vantagens
15
Exercícios
16
1) OarquivoDados_PainelCO2contéminformaçõessobreasemissõesdeCO2,PIB,participaçãodosetorsecundárionoPIBdepaísesentre1980e2010.Sigaoseguinteroteiro.
a) AjusteummodelodedadosempilhadosparaologdoCO2 comofunçãodologdoPIBe%Setorsecundário;
b) CompareosresultadoscomummodeloOne-Waydeefeitosfixos;c) CompareosresultadoscomummodeloTwo-Waydeefeitosfixos;d) ComparearelaçãoPIBeCO2 entreosEUAeosdemaispaísesdo
mundo;