regresijos determinuotumas

18
Regresijos determinuotumas 2014-03-27 D.Gujaraty. Basic Econometrics., 3. Two variable Regression Model: The Problem of Estimation. 3.5 The Coefficient of Determination r 2 A measure of “Goodness of Fit“ 6.1 Regression through the Origin.

Upload: kasie

Post on 16-Jan-2016

36 views

Category:

Documents


0 download

DESCRIPTION

Regresijos determinuotumas. 20 14 -0 3 - 27. D.Gujaraty . Basic Econometrics., 3. Two variable Regression Model: The Problem of Estimation. 3.5 The Coefficient of Determination r 2 A measure of “Goodness of Fit“ 6.1 Regression through the Origin. Regresijos determinuotumas. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Regresijos determinuotumas

Regresijos determinuotumas

2014-03-27

D.Gujaraty. Basic Econometrics., 3. Two variable Regression Model: The Problem of Estimation. 3.5 The Coefficient of Determination r2A measure of “Goodness of Fit“

6.1 Regression through the Origin.

Page 2: Regresijos determinuotumas

Regresijos determinuotumas

Regresijos determinuotumo samprata

Regresijos statistinio reikšmingumo tikrinimas

Page 3: Regresijos determinuotumas

Regresijos determinuotumas

PVM pajamų priklauspmybė nuo bruto darbo užmokesčio

500

700

900

1100

1300

1500

1700

1900

2100

2300

2500

600 800 1000 1200 1400 1600 1800 2000

PV

M (

mln

)

Darbo užmokestis

DUt

PVMt XbbY 10

Page 4: Regresijos determinuotumas

Regresijos determinuotumas

PVM pajamų priklauspmybė nuo darbo užmokesčio

500

700

900

1100

1300

1500

1700

1900

2100

2300

2500

600 800 1000 1200 1400 1600 1800 2000

PV

M (

mln

)

Darbo užmokestis

=1264PVMtY

Page 5: Regresijos determinuotumas

Regresijos determinuotumas

PVM pajamų priklauspmybė nuo

500

700

900

1100

1300

1500

1700

1900

2100

2300

2500

600 800 1000 1200 1400 1600 1800 2000

PV

M (

mln

)

Darbo užmokestis

=1476PVMtY

PVMt

PVMt YY

PVMt

PVMti YYe ˆ

PVMt

PVMt YY ˆ

Page 6: Regresijos determinuotumas

Regresijos determinuotumas

Nagrinėjame atskirą stebėjimą

(yi -y) ( iy - y) + (yi - iy),

Bendras Regresija Nepaaiškinta nuokrypis paaiškinta dalis dalis

Atitinkamas visų stebėjimų dispersijos išskaidymas:

(yi -y)2 = ( iy -y)2 + (yI - iy)2

Visa Regresijos Regresijos dispersija reikšmių dispersija likučių dispersija

(paaiškinta dalis) (nepaaiškinta dalis)

TSS = ESS + RSS

Page 7: Regresijos determinuotumas

Regresijos determinuotumasRSSESSTSS

n

i YYTSS1

2)(

n

i YYESS1

2)ˆ(

n

ii YYRSS1

2)ˆ(

Page 8: Regresijos determinuotumas

Regresijos determinuotumas

Determinacijos koeficientas R2

2

2

YY

YYR

i

i

kur yi - faktinės priklausomojo kintamojo reikšmės - pagal regresijos lygtį apskaičiuotos priklausomojo kintamojo reikšmės - priklausomojo kintamojo vidurkio reikšmė

Y

10 2 RKai R2 1 regresijos lygties determinuotumas didėja

TSS

RSS

TSS

ESSR 12

iY

Page 9: Regresijos determinuotumas

Regresijos determinuotumas samprata

Regresinio ryšio determinuotumas parodo, kokią priklausomojo kintamojo reikšmių išsibarstymo apie vidurkį dalį paaiškina regresinė lygtis

Ryšio determinuotumas nustatomas tarpusavyje lyginant regresija ir vidurkiu paaiškinamą priklausomojo kintamojo reikšmių išsibarstymą

Page 10: Regresijos determinuotumas

Dauginės koreliacijos koeficientas

2..., 21

RrkXXXY

Dauginės koreliacijos koeficientas parodo, ryšio stiprumą tarp priklausomo kintamojo (nagrinėjamo reiškinio) ir visų nepriklausomų kintamųjų (įtakojančių veiksnių)

10 ..., 21

kXXXYr

Page 11: Regresijos determinuotumas

Koreguotas determinacijos koeficientas

22 11

11 R

kn

nR

2R - Koreguotas determinacijos koeficientas

Page 12: Regresijos determinuotumas

Pavyzdys: PVM

Dauginės determinacijos koef R2

Dauginės koreliacijos koef. ( r )

Koreguotas determinacijos koe f 2R

ESS RSS

TSS

SUMMARY OUTPUT

Regression StatisticsMultiple R 0,96R Square 0,91Adjusted R Square 0,91Standard Error 153,03Observations 47,00

ANOVA

df SS MS FSignifican

ce FRegression 3,00 10577326,24 3525775,41 150,56 0,00Residual 43,00 1006981,54 23418,18Total 46,00 11584307,77

Coefficients

Standard Error t Stat P-value

Lower 95%

Upper 95%

Lower 95,0%

Upper 95,0%

Intercept 1887,43 418,55 4,51 0,00 1043,35 2731,51 1043,35 2731,51Neto darbo užmokestis LT 1,43 0,46 3,09 0,00 0,50 2,36 0,50 2,36MIN alga 0,09 1,23 0,07 0,94 -2,39 2,57 -2,39 2,57Tarifas -117,64 30,15 -3,90 0,00 -178,44 -56,85 -178,44 -56,85

Page 13: Regresijos determinuotumas

Pavyzdys: Studentų ūgiai(1-2-3-4)

Dauginės determinacijos koef R2

Dauginės koreliacijos koef. ( r )

Koreguotas determinacijos koe f 2R

ESS RSS

TSS

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,37

R Square 0,14

Adjusted R Square 0,11

Standard Error 7,73

Observations 76,00

ANOVA

  df SS MS FSignificanc

e F

Regression 2,00 699,04 349,52 5,85 0,00

Residual 73,00 4357,95 59,70

Total 75,00 5056,99      

 Coefficient

sStandard

Error t Stat P-valueLower 95%

Upper 95%

Lower 95,0%

Upper 95,0%

Intercept 57,60 35,26 1,63 0,11 -12,67 127,87 -12,67 127,87

MŪ 0,60 0,19 3,19 0,00 0,22 0,98 0,22 0,98

TŪ 0,08 0,13 0,62 0,54 -0,17 0,33 -0,17 0,33

Page 14: Regresijos determinuotumas

)1/(

/

1/ˆ

/ˆ2

2

1,

knRSS

kESS

knYY

kYYF

ii

iknk

Atsitiktinis dydis

yra pasiskirstęs pagal F skirstinį su k skaitiklyje ir n-k-1 vardiklyje laisvės laipsnių

Regresijos statistinio reikšmingumo (patikimumo) tikrinimas

Page 15: Regresijos determinuotumas

Regresijos statistinio reikšmingumo tikrinimas

MSR

MSE

knRSS

kESSF knk

)1/(

/1,

k

YYMSE

n

i 1

2)ˆ(

1

)ˆ(1

2

kn

YYMSR

n

ii

Page 16: Regresijos determinuotumas

Regresijos determinuotumas

1. žingsnis. Iškeliame hipotezes: H0: visi j =0, (parametrai prie nepriklausomų kintamųjų yra lygūs 0 t.y., regresija yra nereikšminga, nes nė vienas veiksnys neįtakoja priklausomojo kintamojo)H1: bent vienas iš parametrų j nėra lygus 0 (regresija statistiškai reikšminga, nes yra bent vienas veiksnys, kuris įtakoja priklausomą kintamąjį) 2 žingsnis Apskaičiuojama pagal formulę F statistikos reikšmė ir laisvės laipsnių skaičius k, ir n-k-1.

)1/(

)/(

1/ˆ

/ˆ2

2

1,

knRSS

kESS

knYY

kYYF

ii

iknk

Page 17: Regresijos determinuotumas

Regresijos determinuotumas

3 žingsnis Apskaičiuotą faktinę F reikšmę lyginame su pasirinkto reikšmingumo, pvz., 5 proc. (=0,05), teorine Fk,n-k-1 reikšme iš F-skirstinio lentelių 4 žingsnis Išvada. Jeigu Fapskaičiuota > Fk,n-k-1 , tuomet su 95% pasikliovimo lygmeniu atmetame nulinę hipotezę, jog regresija yra statistiškai nereikšminga, ir priimame alternatyvią, kad bent vienas nepriklausomas kintamasis daro statistiškai reikšmingą poveikį priklausomam kintamajam. Jeigu yra priešingai ,t.y., Fapskaičiuota < Fk,n-k-1 , tuomet negalime atmesti nulinės hipotezės

Page 18: Regresijos determinuotumas

Pvz.

MSR

Fapskaičiuota

MSE

F3,47=2,84

SUMMARY OUTPUT

Regression StatisticsRMultiple 0,96R Square 0,92Adjusted R Square 0,91Standard Error 154,13Observations 51,00

ANOVA

df SS MS FSignificanc

e FRegression 3,00 12353166,92 4117722,31 173,34 0,00Residual 47,00 1116518,34 23755,71Total 50,00 13469685,26

CoefficientsStandard Error t Stat P-value Lower 95% Upper 95%Lower 99,0%

Upper 99,0%

Intercept 1826,73 400,71 4,56 0,00 1020,60 2632,85 751,00 2902,46

Neto darbo užmokestis LT 1,11 0,20 5,66 0,00 0,72 1,51 0,59 1,64MIN alga 0,95 0,48 1,96 0,06 -0,02 1,92 -0,35 2,24Tarifas -121,43 26,08 -4,66 0,00 -173,88 -68,97 -191,43 -51,42