metode regresijske analize

38
METODE REGRESIJSKE AN Fran Galetić

Upload: dkovacev

Post on 21-Jul-2015

84 views

Category:

Documents


0 download

TRANSCRIPT

METODE REGRESIJSKE ANALIZE

Fran Galeti

1. UVOD U REGRESIJU

Ako se dvije pojave javljaju zajedno, to ne mora znaiti da su one meusobno povezane. Da bi se ustanovila meusobna ovisnost jedne pojave o drugoj ili vie njih korist se regresijska analiza. U regresijskoj analizi pojave se predouju varijablama.

Varijable mogu biti nezavisne i zavisne. Zavisne varijable su one varijable ije se promjene objanjavaju pomou drugih varijabli. To su varijable koje se mijenjaju zbog promjene drugih varijabli. Nezavisne su one varijable kojima se objanjava promjena zavisne varijable.

Povezanost pojava moe biti funkcionalna (deterministika) i statistika (stohastika). Statistika povezanost je pod utjecajem stohastikih (=nepredvidivih) varijacija. Svaki regresijski model sadri stohastiku varijablu, i po tome se razlikuje od deterministikog modela. Regresijski model je jednadba ili skup jednadbi s konanim brojem varijabli.

Podaci za regresijsku analizu nastaju opaanjem ili mjerenjem u statistikim pokusima. U gospodarskim primjenama regresijskog modela podaci se javljaju kao

1. brojane vrijednosti pojava za odreene gospodarske ili prostorne jedinice 2. vremenske serije 3. kombinacija (1) i (2).

Podaci na temelju kojih se provode postupci ponekad se transformiraju kako bi bilo jednostavnije raunati. Najee se transformacija provodi logaritmiranjem. Regresijski model koji se sastoji od jedne jednadbe ima jednu zavisnu i jednu ili vie nezavisnih varijabli. Kada su u modelu jedna zavisna i jedna nezavisna varijabla, rije je o modelu jednostavne regresije. Viestruka (multipla) regresija sadri jednu zavisnu i dvije ili vie nezavisnih varijabli. Model je linearan ako svaka varijabla u modelu ima potenciju 1.

2. MODEL JEDNOSTAVNE LINEARNE REGRESIJE

Sadri jednu zavisnu i jednu nezavisnu varijablu. Primjenjuje se kada jedinino poveanje vrijednosti nezavisne varijable uzrokuje priblino istu linearnu promjenu vrijednosti zavisne varijable.

Regresijska jednadbayi = a + bxi + ui

Yi = + X i + i

y zavisna varijabla x nezavisna varijabla a,b nepoznati parametri koje treba procijeniti u sluajna varijabla

Procjenjivanje parametara = xi x yi y = xi yi n x y b 2 2 2 xi x xi n x

(

(

)(

)

)

a = y bx

Parametar b zove se regresijski koeficijent i pokazuje za koliko se u prosjeku mijenja zavisna varijabla ako se nezavisna varijabla promijeni za jedan. Regresijski koeficijent je najvaniji pokazatelj regresijske analize. Parametar a je konstanta i pokazuje vrijednost zavisne varijable u sluaju kada je nezavisna varijabla jednaka nuli.

Zadatak 1:xi 100 105 110 120 145 150 yi 26 29 33 36 41 43

Procijenite vrijednosti parametara regresijskog modela. Regresijsku funkciju prikaite dijagramom rasipanja. Izraunajte regresijske vrijednosti i vrijednosti rezidualnih odstupanja.

xi 100 105 110 120 145 150 730

yi 26 29 33 36 41 43 208

xi2 10000 11025 12100 14400 21025 22500 91050

xi yi 2600 3045 3630 4320 5945 6450 25990

yi 28,05567 29,58182 31,10797 34,16027 41,79102 43,31717 208,0139

= xi yi n x y = 25990 6 *121,67 * 34,67 = 680,2 = 0,30523 b 2 2 91050 6 *121,67 2 2228,47 xi n x a = y b x = 34,67 0,30523 *121,67 = 2,46733

yi = a + bxi + ui = 2,46733 + 0,30523 xi + ui

xi 100 105 110 120 145 150 730

yi 26 29 33 36 41 43 208

yi 28,0556729,58182 31,10797 34,16027 41,79102 43,31717 208,0139

ui -2,05567 -0,58182 1,89203 1,83973 -0,79102 -0,31717 0

y =yi

i

Zadatak 2:

Analiziraju se ukupni trokovi proizvodnje u poduzeu ABC. Na temelju kvartalnih podataka utvrene su koliine proizvodnje i ukupni trokovi proizvodnje. Podaci su dani u tablici.

(a) Nacrtajte dijagram rasipanja. to zakljuujete iz dijagrama? (b) Procijenite vrijednosti parametara regresijskog modela i protumaite njihovo znaenje. (c) Izraunajte regresijske vrijednosti. (d) Odredite vrijednosti rezidualnih odstupanja.

Proizvodnja 352 373 411 441 462 490 529 577 641 692 743

Uk trokovi 146 153 177 190 205 208 227 238 268 274 300

xi 352 373 411 441 462 490 529 577 641 692 743 5711

yi 146 153 177 190 205 208 227 238 268 274 300 2386

x i2 123904 139129 168921 194481 213444 240100 279841 332929 410881 478864 552049 3134543

xi yi 51392 57069 72747 83790 94710 101920 120083 137326 171788 189608 222900 1303333

5711 2386 x= = 519,1818 y= = 216,9091 11 11 = 1303333 11 * 519,1818 * 216,9091 = 64565 ,17 = 0,38092 b 3134543 11 * 519,1818 2 169495 ,84 a = 216,9091 0,38092 * 519,1818 = 19,14236 yi = 19,14236 + 0,38092 xi

xi 352 373 411 441 462 490 529 577 641 692 743 5711

yi 146 153 177 190 205 208 227 238 268 274 300 2386

xi2 123904 139129 168921 194481 213444 240100 279841 332929 410881 478864 552049

xi yi 51392 57069 72747 83790 94710 101920 120083 137326 171788 189608 222900

yi153,2262 161,2255 175,7005 187,1281 195,1274 205,7932 220,6490 238,9332 263,3121 282,7390 302,1659 2386,0001

ui -7,2262 -8,2255 1,2995 2,8719 9,8726 2,2068 6,3510 -0,9332 4,6879 -8,7390 -2,1659 0,0000

ui,rel -4,95% -5,38% 0,73% 1,51% 4,82% 1,06% 2,80% -0,39% 1,75% -3,19% -0,72% -

3134543 1303333

ANOVA (tabela analize varijance)( yi y ) 2 ST

= ( y i y ) + ( yi yi )2

2

=

SP

+

SR

ST suma kvadrata odstupanja vrijednosti varijable od njezine aritmetike sredine SP suma kvadrata odstupanja regresijskih vrijednosti varijable od njezine aritmetike sredine (odstupanja protumaena modelom) SR suma kvadrata odstupanja empirijskih vrijednosti varijable od regresijskih vrijednosti (odstupanja neprotumaena modelom)

Izvor varijacije

ss Zbroj kvadrataSredina kvadrata F-omjer SP SR ST SP SR/(n-2) SP/(SR/(n-2))

protumaen modelom 1 neprotumaen modelom-2 n Ukupno n-1

Standardna devijacija regresijey =

( y

i

yi )

2

n

pokazuje koliko je prosjeno odstupanje empirijskih vrijednosti zavisne varijable od njezinih regresijskih vrijednosti izraena je u istim mjernim jedinicama kao i zavisna varijabla

Koeficijent varijacijey Vy = 100 y

relativna mjera disperzije pokazuje omjer standardne devijacije regresije i aritmetike sredine zavisne varijable

Koeficijent determinacije( yi y ) 2 2 r = 2 ( yi y )

0 r2 1

omjer protumaenog i ukupnog zbroja kvadrata bolje je da je to vei, dakle to blii jedinici, jer je tada mala vrijednosti rezidualnog zbroja kvadrata alternativno se moe izraunati prema formuli:

r

2

( y y ) = 1 ( y y)i i i

2

2

Korigirani koeficijent determinacijen 1 (1 r 2 ) r = 1 n22

moe biti manji ili jednak od koeficijenta determinacije ovisi i o broju vrijednosti za koje se rauna nepovoljno obiljeje je to to moe biti manji od nule

Zadatak 3:Izraunajte elemente koji nedostaju u tabeli.Izvor varijacije ss Zbroj kvadrata Sredina kvadrata 7665,853 284,216 ? ? ? F-omjer ? protumaen modelom 1 neprotumaen modelom 6 Ukupno ?

Zatim odredite standardnu devijaciju regresije, koeficijent varijacije i koeficijent determinacije. Prilikom raunanja koristite podatak da je prosjena vrijednost zavisne varijable 33,4125.

Izvor varijacije

ss Zbroj kvadrata Sredina kvadrata 7665,853 284,216 7950,069 7665,853 47,369

F-omjer 161,833

protumaen modelom 1 neprotumaen modelom 6 Ukupno 7

y =

( y

i

yi )

2

n

284,216 = = 5,96 8

Prosjeno odstupanje stvarnih vrijednosti zavisne varijable od regresijskih vrijednosti je 5,96.

5,96 Vy = 100 = 100 = 17,838% y 33,4125

y

Stvarne vrijednosti zavisne varijable odstupaju od procijenjenih vrijednosti u prosjeku 17,838%.

r =2

i y ) 2 ( y

( yi y ) 2

7665,853 = = 0,9642 7950,069

Regresijskim modelom protumaeno je 96,42% odstupanja. Neprotumaeno je ostalo 3,58% odstupanja.

Zadatak 4 (DZ):

Istraivanjem su utvrene koliine potranje pri odreenim cijenama.(a) Nacrtajte dijagram rasipanja. (b) Kako glasi regresijska jednadba potranje? (c) Interpretirajte vrijednost regresijskog koeficijenta. (d) Odredite regresijske vrijednosti. (e) Kolika je standardna devijacija regresije?

Cijena 10 12 15 20 25 30

Potranja 704 662 597 511 408 302

Zadatak 5 (DZ):

Na temelju podataka o cijeni i koliini odredite:

Cijena 120 150 170 200 250 300

Ponuda 4500 5800 6700 8300 11000 14200

(a) dijagram rasipanja (b) regresijsku jednadbu ponude (c) rezidualna odstupanja

Zadatak 6 (DZ):Izraunajte elemente koji nedostaju u tabeli.Izvor varijacije ss Zbroj kvadrata Sredina kvadrata 15693 1243 ? ? ? F-omjer ? protumaen modelom 1 neprotumaen modelom 16 Ukupno ?

Odredite standardnu devijaciju regresije, i koeficijent determinacije. Je li ovaj model dobar?

3. MODEL VIESTRUKE REGRESIJE

Sastoji se od jedne zavisne i dvije ili vie nezavisnih varijbli, te sluajne varijable.

yi = a + b1 xi1 + b2 xi 2 + ... + bn xin + ei

Zadatak 7:

Sluba za marketing neke kompanije ispituje prodaju proizvoda A po segmentima trita. Pretpostavlja se da su glavni faktori koji utjeu na prodaju izdaci za reklamu (u tisuama ) i prodajna cijena (u tisuama ). Podaci o prodaji, izdaci za reklamu i prodajne cijene dani su u tablici:

Podruje

Prodaja (000 kom) yi 331 299 301 398 402 487 601 614 703 711 799 927 990 1015

Izdaci za reklamu (000 ) xi1 220 285 256 395 317 500 432 599 701 794 802 980 1021 1128

Prosjena cijena () xi2 129 138 121 139 127 111 103 122 101 110 100 99 97 95

1 2 3 4 5 6 7 8 9 10 11 12 13 14

Kako glasi model viestruke regresije za ovaj primjer? Interpretirajte znaenje regresijskih koeficijenata. Pri raunanju koristite sljedee meurezultate:n = 14

y

i

= 8578

xi1

i1

= 8430

xxi2

i2

= 1592

x

i1 i 2

x = 908482

x

yi = 61529582

yi = 9309672

yi = 60927222

xi1 = 6287366

xi 2 = 184126

Parametri se procjenjuju metodom najmanjih kvadrata, rjeavanjem sustava jednadbi: n + 1 xi1 + 2 xi 2 = yi2 xi1 +1 xi1 + 2 xi1 xi 2 = xi1 yi

2 xi 2 +1 xi 2 xi1 + 2 xi 2 = xi 2 yi

14 + 8430 1 + 1592 2 = 8578 8430 + 6287366 1 + 908482 2 = 6152958 1592 + 908482 + 184126 = 9309671 2

= 611,1702969 = 0,6693470841

2 = 3,530766379

y = 611,1702969 + 0,669347084 x1 3,530766379 x2

Ako se izdaci za reklamu poveaju za tisuu , vrijednost prodaje prosjeno se poveava za 0,66935 tisua komada, uz nepromijenjene cijene. Drugi regresijski koeficijent pokazuje da se prodaja u prosjeku smanjuje za 3,53077 tisua komada ako se cijene poveaju za 1, uz nepromijenjene izdatke za reklamu.