kapitel 2 nichtlineare funktionsformen - uibk.ac.at · pdf filefunktion yt = y0ert, wobei e =...

43
Kapitel 2 Nichtlineare Funktionsformen 2.1 Logarithmische Transformationen “The combination of some data and an aching desire for an answer does not ensure that a reasonable answer can be extracted from a given body of data.” (John Tukey) Wir haben uns bisher fast ausschließlich mit linearen Modellen der Art y = b 1 + b 2 x + b 3 x 3 befasst, in denen die Variablen additiv verkn¨ upft sind. H¨ aufig sind wir aber auch an Modellen interessiert, in denen die Variablen multiplikativ verkn¨ upft sind, wie z.B. bei der bekannten Cobb-Douglas Funktion Q = AK α L β , dem vermut- lich bekanntesten Beispiel einer Exponentialfunktion. Auch f¨ ur die Modellierung von Wachstumsprozessen spielen solche multiplikative Modelle eine große Rolle. Wir wer- den gleich sehen, dass solche Modelle mit Hilfe logarithmischer Funktionen einfach linearisiert und gesch¨ atzt werden k¨ onnen. Aber nachdem m¨ oglicherweise schon der Begriff ‘Logarithmus’ bei manchen Lesern eine leichte G¨ ansehaut verursacht, und nicht selten mit anderen unliebsamen Erinnerungen an die Schulzeit verdr¨ angt wird, beginnen wir mit einer kurzen Wiederholung. 2.1.1 Wiederholung Exponential- und Logarithmusfunktio- nen Als Potenz bezeichnet man einen Term der Art a x , wobei a Basis und x Exponent (Hochzahl) genannt wird. F¨ ur Potenzen gelten die bekannten Rechenregeln, wie z.B. a x a y = a x+y . Eine Exponentialfunktion hat die Form y = ca bx (bzw. x ca bx ) mit x R, wobei c und b beliebige Zahlen sind. Solche Exponentialfunktionen eignen sich u.a. zur Modellierung von Wachstumspro- zessen, bei denen sich eine Gr¨ oße y in gleich langen Zeitintervallen um einen kon- stanten Faktor ¨ andert. Angenommen, der Wert von y sei in der Ausgangsperiode y 0 , und dieser Wert nehme in jeder Zeitperiode um 5% zu. Wenn wir die Zeitperiode durch den Subindex ausdr¨ ucken folgt y 0 = y 0 (1 + 0.05) 0 ,y 1 = y 0 (1 + 0.05) 1 ,y 2 = 1

Upload: lyduong

Post on 07-Mar-2018

214 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Kapitel 2

Nichtlineare Funktionsformen

2.1 Logarithmische Transformationen

“The combination of some data andan aching desire for an answer doesnot ensure that a reasonable answercan be extracted from a given body ofdata.” (John Tukey)

Wir haben uns bisher fast ausschließlich mit linearen Modellen der Art y =b1+b2x+b3x3 befasst, in denen die Variablen additiv verknupft sind. Haufig sind wiraber auch an Modellen interessiert, in denen die Variablen multiplikativ verknupftsind, wie z.B. bei der bekannten Cobb-Douglas Funktion Q = AKαLβ , dem vermut-lich bekanntesten Beispiel einer Exponentialfunktion. Auch fur die Modellierung vonWachstumsprozessen spielen solche multiplikative Modelle eine große Rolle. Wir wer-den gleich sehen, dass solche Modelle mit Hilfe logarithmischer Funktionen einfachlinearisiert und geschatzt werden konnen. Aber nachdem moglicherweise schon derBegriff ‘Logarithmus’ bei manchen Lesern eine leichte Gansehaut verursacht, undnicht selten mit anderen unliebsamen Erinnerungen an die Schulzeit verdrangt wird,beginnen wir mit einer kurzen Wiederholung.

2.1.1 Wiederholung Exponential- und Logarithmusfunktio-

nen

Als Potenz bezeichnet man einen Term der Art ax, wobei a Basis und x Exponent(Hochzahl) genannt wird. Fur Potenzen gelten die bekannten Rechenregeln, wie z.B.axay = ax+y. Eine Exponentialfunktion hat die Form y = cabx (bzw. x 7→ cabx) mitx ∈ R, wobei c und b beliebige Zahlen sind.

Solche Exponentialfunktionen eignen sich u.a. zur Modellierung von Wachstumspro-zessen, bei denen sich eine Große y in gleich langen Zeitintervallen um einen kon-stanten Faktor andert. Angenommen, der Wert von y sei in der Ausgangsperiode y0,und dieser Wert nehme in jeder Zeitperiode um 5% zu. Wenn wir die Zeitperiodedurch den Subindex ausdrucken folgt y0 = y0(1 + 0.05)0, y1 = y0(1 + 0.05)1, y2 =

1

Page 2: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 2

y1(1 + 0.05) = y0(1 + 0.05)2, . . . , yt = y0(1 + 0.05)t. Diese Art des Wachstums kannalso durch eine einfache Exponentialfunktion beschrieben werden.

Fur dieses Beispiel haben wir diskrete Perioden gleicher Lange angenommen. Wennman die Periodenlange gegen Null gehen lasst erhalt man eine stetige Wachstums-funktion yt = y0e

rt, wobei e = 2.718281828459 . . . die Eulersche Zahl1 und r diestetige Wachstumsrate bezeichnet (siehe Appendix). Aufgrund dieser und einigerweiterer Eigenschaften wird e haufig als naturliche Basis bezeichnet und auch alsexp(·) geschrieben (d.h. exp(x) := ex). In der Okonometrie wird fast ausschließlichdie naturliche Basis e verwendet, deshalb werden wir uns in den weiteren Ausfuhrun-gen auf diese Basis beschranken.

Der naturliche Logarithmus ist die Losung der Exponentialfunktion y = ex nachx, d.h. die Logarithmusfunktion ist die Umkehrfunktion zur Exponentialfunktion.Deshalb ist x = ln(y) und ln(ex) = x.

Etwas salopp ausgedruckt sagt uns ln(y), wie oft wir die Basis e mit sich selbstmultiplizieren mussen um y zu erhalten. Man beachte, dass die Exponentialfunktionx 7→ ex die Menge der reellen Zahlen R in die positiven reellen Zahlen R+ abbildet,da e−x = 1/ex. Deshalb ist die Logarithmusfunktion nur fur die positiven reellenZahlen definiert, sie bildet R+ 7→ R ab; oder einfacher, der Logarithmus negativerZahlen ist nicht definiert!

Die Bedeutung der logarithmischen Transformation fur okonometrische Anwendun-gen folgt v.a. aus drei Eigenschaften:

1. Multiplikative Zusammenhange konnen durch Logarithmierung additiv darge-stellt werden, bzw. Exponentialfunktionen werden durch Logarithmierung zulinearen Funktionen

ln(xy) = ln(x) + ln(y) fur x, y > 0

Um dies zu zeigen definieren wir zwei Zahlen a und b derart, dass ln(x) = aund ln(y) = b. Daraus folgt x = ea und y = eb mit xy = eaeb = ea+b aufgrundder Rechenregeln fur Potenzen. Deshalb ist ln(xy) = ln(ea+b) = a + b :=ln(x) + ln(y).

Weitere wichtige Rechenregeln sind

ln

(x

y

)= ln(x)− ln(y)

ln(xa) = a ln(x)

ln(1/x) = − ln(x)

Deshalb kann z.B. die Cobb-Douglas Funktion Q = AKαLβ linearisiert werdenzu ln(Q) = ln(A) + α ln(K) + β ln(L).

Achtung: Die meisten Okonometrieprogramme verwenden fur den naturlichenLogarithmus die Funktion log anstelle des in der Mathematik gebrauchlichenOperators ln.

1Beachten Sie den Unterschied zwischen der Eulerschen Zahl e und den Residuen e.

Page 3: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 3

2. Die Differenz zwischen zwei logarithmierten Werten entspricht naherungsweiseder relativen Anderung der ursprunglichen Werte, d.h.

ln(x2)− ln(x1) ≈x2 − x1

x1

:=∆x

xfur x2, x1 > 0

Wir werden gleich sehen, dass diese Eigenschaft die Interpretation von Regres-sionskoeffizienten logarithmierter Variablen sehr vereinfacht.

Fur ein intuitives Verstandnis erinnern wir uns an die Ableitungsregel fur dennaturlichen Logarithmus

d ln(x)

dx=

1

x

Dies konnen wir uns umgeschrieben denken als

d lnx =dx

x

und erinnern uns, dass wir d(ln x) als eine infinitesimal kleine Anderung vonln(x) interpretieren konnen. Ahnlich konnen wir uns dx als eine infinitesimalkleine Anderung von x vorstellen, weshalb dx/x eine (infinitesimal kleine)relative Anderung von x darstellt.

In Analogie dazu wurden wir erwarten, dass fur diskrete Falle naherungsweise(‘≈’) gilt

ln(x+∆x)− ln(x) ≈∆x

x

Bemerkung: Wenn wir zwei konkrete Punkte x0 und x1 vor Augen habenkonnen wir fur (x + ∆x) auch schreiben [x0 + (x1 − x0)] = x1, d.h. fur denobigen Ausdruck ln(x1)− ln(x0) ≈ (x1 − x0)/x0. ¶

Dieser Zusammenhang gilt tatsachlich, wenn ∆x/x ‘relativ’ klein ist (siehe‘Exkurs: Logarithmische Differenz und relative Anderungsraten’, Seite 5).

Wir halten also fest: die Differenz einer logarithmierten Variable misst nahe-rungsweise die relative Anderung der ursprunglichen Variable.

Wenn man eine relative Anderung mit 100 multipliziert erhalt man die pro-zentuelle Anderung.

3. Durch Logarithmierung werden kleine Zahlenwerte gespreizt, große Zahlen-werte gestaucht, siehe Abbildung 2.1. Dies fuhrt manchmal dazu, dass derEinfluss extremer Beobachtungen auf die Schatzung reduziert wird, oder dassschiefe Verteilungen symmetrischer werden. Ein klassisches Beispiel dazu sindEinkommensdaten, vgl. Abbildung 2.2.

2.1.2 Interpretation der Koeffizienten logarithmierter Va-

riablen

Fur OLS Schatzungen selbst spielt es keine unmittelbare Rolle, ob die Variablenlogarithmiert wurden oder nicht. Allerdings andert sich dadurch die Interpretation

Page 4: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 4

ln(0) = −∞

ln(0.000001) = −13.816

ln(0.01) = −4.605

ln(0.1) = −2.303

ln(1) = 0

ln(10) = 2.303

ln(100) = 4.605

ln(1000) = 6.908

ln(1000000) = 13.816

0

1

2

-1

-2

1 2 3 4 5 6 7 8

ln(x)

x

Abbildung 2.1: Durch Logarithmierung werden kleine Zahlenwerte gespreizt,große Zahlenwerte gestaucht.

Histogramm StdL

Den

sity

0 20 40 60 80 100 120

0.00

0.02

0.04

0.06

0.08

Histogramm log(StdL)

Den

sity

1 2 3 4

0.0

0.2

0.4

0.6

0.8

1.0

Abbildung 2.2: Histogramme des Brutto-Stundenlohns (StdL) und des Logarith-mus vom Brutto-Stundenlohn; Quelle: EU-Silc 2012

Page 5: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 5

Exkurs: Logarithmische Differenz und relative Anderungsraten

Wir haben im Text behauptet, dass die logarithmische Differenz einer Variable un-gefahr gleich der relativen Anderung dieser Variable ist

ln(x+∆x)− ln(x) ≈∆x

xfur kleine

∆x

x

Dies kann allgemein mit Hilfe einer Taylor Expansion gezeigt werden. Mit einer Tay-lor Reihenentwicklung konnen nichtlineare (differenzierbare . . . ) Funktionen in derUmgebung bestimmter Punkte durch Potenzreihen dargestellt werden. Insbesonderegilt

ln(1 + x) =∞∑

n=1

(−1)(n+1) xn

n= x−

x2

2+

x3

3− . . . fur |x| < 1

bzw. fur x = ∆yy

ln

(1 +

∆y

y

)=

∆y

y−

1

2

(∆y

y

)2

+1

3

(∆y

y

)3

− . . .

Die linke Seite kann auch als logarithmische Differenz geschrieben werden, da

ln

(1 +

∆y

y

)= ln

(y +∆y

y

)= ln(y +∆y)− ln(y)

Daraus folgt

ln(y +∆y)− ln(y) ≈∆y

y

da fur kleine ∆y/y die Folgeterme −1/2 (∆y/y)2+1/3 (∆y/y)3− . . . der Reihe sehrklein werden und fur praktische Zwecke oft vernachlassigbar sind.

Page 6: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 6

der Koeffizienten, je nach dem, ob nur die abhangige Variable, nur die erklarendeVariable oder beide logarithmiert wurden.

Wenn die abhangige und die erklarende Variable logarithmiert wird spricht man voneinem log-linearen oder log-log Modell. Wenn hingegen nur die abhangige oder dieerklarende Variable logarithmiert wird spricht man von einem semi-log Modell, odermanchmal auch von einem log-lin bzw. lin-log Modell.

Log-lineare (log-log) Modelle

Wie schon erwahnt kann die Exponentialfunktion

yi = bxb2i exp(ei)

durch Logarithmierung linearisiert werden (vgl. Abbildung 2.3)

ln yi = b1 + b2 lnxi + ei mit b1 := ln b

Dieses Modell ist linear in den Parametern und kann deshalb ganz normal mit OLSgeschatzt werden. Der Koeffizient b2 konnte zwar wie ublich interpretiert werden,namlich um wie viele Einheiten sich ln(y) andert, wenn ln(x) um eine Einheit zu-nimmt, aber wie wurden Sie dies einem Laien erklaren? Was soll man sich untereiner Einheit von ln(x) vorstellen?

x

y

y = eb1xb2

ln(x)

ln(y)

ln(y) = b1 + b2 ln(x)

Abbildung 2.3: Log-log Modell mit logarithmisch und linear skalierter Skala

Wenn wir uns an die Eigenschaft des Logarithmus erinnern, dass ln(x1)− ln(x0) ≈(x1 − x0)/x0 := ∆x/x ist, geht’s einfach.

Meistens interessieren wir uns fur den marginalen Effekt, das heißt, wie sich dieabhangige Variable y andert, wenn die erklarende Variable x um eine Einheit zu-nimmt. Beginnen wir mit einer diskreten Anderung zwischen zwei Punkten

ln(y1) = b1 + b2 ln(x1)

ln(y0) = b1 + b2 ln(x0)

Die Differenz ist ln(y1)− ln(y0) := ∆ ln(y) = b2[ln(x1)− ln(x0)] := b2∆ ln(x), darausfolgt b2 = ∆ ln(y)/∆ ln(x).

Page 7: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 7

Nun wissen wir aber, dass die Differenz einer logarithmierten Variable ∆ ln(y) nahe-rungsweise einer relativen Anderung ∆y

yentspricht, deshalb gilt

b2 =∆ ln(y)

∆ ln(x)≈

∆yy

∆xx

=relative Anderung von y

relative Anderung von x= Elastizitaty,x

wobei eine Elastizitat als das Verhaltnis zweier relativer Anderungen definiert ist.

Deshalb konnen wir die Koeffizienten von log-log Modellen unmittelbar als Elasti-zitaten interpretieren.

Multiplikation einer relativen Anderung mit 100 ergibt eine prozentuelle Anderung,wenn wir also Zahler und Nenner obiger Gleichung mit 100 multiplizieren andertdies nichts am Wert, da sich die 100 herauskurzen, aber wir erhalten die ublicheInterpretation einer Elastizitat, namlich um wie viele Prozent sich die abhangigeVariable y andert, wenn die erklarende Variable x ceteris paribus um ein Prozentzunimmt.

Beispiel: Angenommen wir haben die Funktion

ln(y) = 1 + 0.2 ln(x)

Wie verandert sich y, wenn x um ein Prozent zunimmt? Aufgrund der obigen Dis-kussion erwarten wir, dass y um 0.2 Prozent zunehmen wird. Stimmt das wirklich?Wir konnen dies einfach uberprufen, indem wir obige Funktion umschreiben zuy = exp[1 + 0.2 ln(x)] und fur x zwei Werte einsetzen, z.B. 5 und 5.05.

x (∆x)/x %∆x y = exp(1 + 0.2 ln(x)) (∆y)/y %∆y5.00 3.7504945.05 5.05−5

5= 0.01 1% 3.757965 0.001992 ≈ 0.2%

Wir sehen, dass dies nicht exakt gilt, da eine Anderung um ein Prozent keine infi-nitesimal kleine Anderung ist, aber fur praktische Zwecke ist diese Naherung meistgenau genug. ¶

Dies kann selbstverstandlich auch mit Hilfe der Infinitesimalrechnung gezeigt wer-den, wobei wir uns an die Rechenregeln dex/dx = ex und d ln(x)/dx = 1/x erinnern.Entweder man differenziert y = exp(b1+b2 ln(x)) nach x indem man die Kettenregelanwendet

dy

dx= b2

1

x[exp(b1 + b2 ln(x))]︸ ︷︷ ︸

y

⇒ b2 =dy

dx

x

y=

dyy

dxx

oder man differenziert ln(y) = b1 + b2 ln(x) total

1

ydy = b2

1

xdx ⇒ b2 =

dy

dx

x

y=

dyy

dxx

Fur infinitesimale Anderungen gilt dieser Zusammenhang also exakt.

Abbildung 2.4 zeigt mogliche Verlaufe fur positive (links) und negative b (rechts)der Exponentialfunktion y = Axb, die durch Logarithmierung linear wird ln(y) =ln(A) + b ln(x).

Page 8: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 8

0 1 2 3

y

x

b > 1

b < 1

A

0 1 2 3

y

x

b = −1

b < −1

−1 < b < 0A

Abbildung 2.4: Log-lineare (bzw. log-log) Modelle: Verlaufe der Exponentialfunk-tion y = Axb fur unterschiedliche β.

Beispiel: Cobb and Douglas (1928) schatzten fur die USA von 1899–1922 folgendeProduktionsfunktion

ln(Qi) = −0.177 + 0.807 ln(Li) + 0.233 ln(Ki) + ei(0.434) (0.145) (0.064)

R2 = 0.957, σ = 0.058, n = 24(Standardfehler in Klammern)

Beide Steigungskoeffizienten weisen das erwartete Vorzeichen auf und sind signifikantvon Null verschieden. Der Koeffizient von ln(Li) gibt die Ausbringungselastizitat desFaktors Arbeit an, d.h., falls der Arbeitseinsatz um 1% erhoht wird erwarten wirceteris paribus eine Erhohung des Outputs um 0.807%. Analog, wenn der Kapital-einsatz um 1% steigt erwarten wir ceteris paribus eine Zunahme des Outputs um0.233%.

Achtung: Die Beziehung y = αxβ kann okonometrisch auf verschiedene Arten mo-delliert werden, d.h. die Storterme kann auf verschiedene Art berucksichtigt werden

1) yi = αxβi exp(ei) ⇒ ln yi = lnα + β ln xi + ei

2) yi = αxβi ei ⇒ ln yi = lnα + β ln xi + ln ei

3) yi = αxβi + ei ⇒ ln yi = ln(αxβ

i + ei)

Nur die erste Gleichung kann unmittelbar mittels OLS geschatzt werden!

Die zweite Gleichung kann zwar geschatzt werden, aber dies hat meist unerwunschteImplikationen fur den Storterm, denn wenn ln(ei) normalverteilt ist, d.h. ln(ei) ∼N(0, σ2), dann ist der Storterm ei log-normalverteilt mit Erwartungswert exp(σ2/2)(siehe Exkurs Seite 8)! Dies hat insbesondere auch Implikationen fur Prognosen,

wenn die gefitteten Werte ln(y) geschatzt wurden, wir aber an y interessiert sind,siehe z.B. Wooldridge (2012, 204ff).

Die dritte Gleichung ln yi = ln(αxβi +ei) ist schließlich nicht linear in den Parametern,

da ln(A+B) 6= lnA+lnB, und kann deshalb nicht einfach mit OLS geschatzt werden!

Page 9: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 9

Exkurs: Die Log-Normalverteilung (Logarithmische Normalverteilung)

Eine Zufallsvariable, deren naturlicher Logarithmus normalverteilt ist, ist log-normalverteilt.

Das heißt, wenn ln(X) ∼ N(µ, σ2)),dann ist X log-normalverteilt.Anders herum, wenn eine Zufallsvaria-ble Y normalverteilt ist, dann ist X =exp(Y ) log-normalverteilt.Die Log-Normalverteilung ist rechts-schief und kann nur positive Werte an-nehmen.

Eine log-normale Verteilung wird haufig zur Modellierung von Zufallsvariablen her-angezogen, die man sich als das (multiplikative) Produkt vieler kleiner unabhangigerFaktoren vorstellen kann.Erwartungswert und Varianz sind

E(X) = exp

(µ+

σ2

2

)

var(X) = exp(2µ+ 2σ2)[1− exp(−σ2)]

Median(X) = exp(µ)

Fur µ = 0 ist der Mittelwert exp(σ2/2) und die Varianz exp(σ2)(exp(σ2 − 1)).

Page 10: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 10

y

x

ln y = b1 + b2xb2 > 0

eb1

y

x

ln y = b1 + b2xb2 < 0

Abbildung 2.5: Log-lin Modelle: ln y = α + βx

Log-lin Modelle

Beim log-lin Modell2 wird nur die abhangige Variable y logarithmiert, aber nicht dieerklarende x Variable

ln(y) = b1 + b2x

Mogliche Funktionsverlaufe fur einen positiven und negativen Steigungskoeffizientensind in Abbildung 2.5 dargestellt.

Der marginale Effekt von x auf ln(y) ist wie ublich die Ableitung d ln(y)dx

= b2, aber

dies ist etwas schwierig zu interpretieren, da man sich unter einer Anderung vonln(y) vermutlich nicht viel vorstellen kann.3

Wir konnen auch

d ln(y)

dx=

1

y

dy

dx= b2 ⇒

dy

dx= b2y = b2(b1 + b2x)

berechnen und sehen, dass die Große des ublichen marginalen Effekts von x abhangt.Deshalb ist die Angabe dieses marginalen Effekts bei log-lin Modellen unublich.

Es gibt eine alternative Darstellung mit Hilfe relativer Anderungen von y, die un-abhangig von x ist, und deshalb einfacher zu interpretieren ist.

Fur eine intuitive Vorstellung schreiben wir obigen Ausdruck um

1

y

dy

dx= b2 ⇒

dy

y= b2dx

2Achtung: Das log-lin Modell ist nicht zu verwechseln mit dem log-linearen Modell ln(y) =b1 + b2 ln(x).

3Fur infinitesimale Anderungen konnen wir ln(y) = b1 + b2x total differenzieren und erhalten1ydy = b2dx. Losen nach b2 gibt

b2 =

dyy

dx≈

∆yy

∆x

Genauso gut konnten wir y = exp(b1 + b2x) nach x differenzieren und umschreiben.

Page 11: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 11

y

x

y = eb1eb2x bzw.ln y = b1 + b2x

bc

bc bc

bc bc

∆x

dydx ∆x

∆y

Abbildung 2.6: Auswirkung einer diskreten Anderung von x (d.h. ∆x) auf y.

Fur diskrete Anderungen wurden wir deshalb erwarten, dass ∆yy

≈ b2∆x, und fur

prozentuelle Anderungen

%∆y :=∆y

y× 100 ≈ b2 × 100 fur ∆x = 1

oder in Worten:

Wenn ln y = b1 + b2x und x um eine Einheit zunimmt, andert sich y(ceteris paribus) ungefahr um 100× b2 Prozent.

Fur die log-lin Funktionsformen gilt diese Interpretation fur alle x, was die Inter-pretation ganz erheblich erleichtert.

Dies wird manchmal auch eine Semi-Elastizitat genannt, da der Zusammenhangzwischen einer prozentuellen Anderung von y und einer absoluten Anderung von xbeschrieben wird.

Allerdings gilt dies fur diskrete Anderungen nur ungefahr. Wie Abbildung 2.6 zeigtfuhrt eine Zunahme von x um eine Einheit (d.h. ∆x = 1) zu einer Anderung von yum ∆y Einheiten, die Steigung der Tangente dy/dx im Ausgangspunkt beschreibtdies nur naherungsweise.

Fur stark gekrummte Kurven (d.h. große b2) und große ∆x ist diese Approximationweniger genau.

Aber diese Ungenauigkeit kann leicht korrigiert werden, um die Auswirkungen sol-cher diskreter Anderungen von x auf y zu bestimmen bilden wir Differenzen. Fur

Page 12: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 12

b2 exp(b2)− 1−0.50 −0.393−0.30 −0.259−0.10 −0.095−0.01 −0.0100.01 0.0100.05 0.0510.10 0.1050.30 0.3500.50 0.649

0.2

0.4

−0.2

−0.4

−0.6

0.2 0.4−0.2−0.4−0.6

exp(b2)− 1

b2

Abbildung 2.7: Fur kleine Werte von b2 (z.B. |b2| ≤ 0.1) ist der Unterschied zwi-schen b2 und exp(b2)− 1 oft vernachlassigbar.

ln(y) = b1 + b2x erhalten wir

∆ ln(y) := ln(y +∆y)− ln(y) = b1 + b2(x+∆x)− (b1 + b2x)

ln

(y +∆y

y

)= b2∆x

1 +∆y

y= exp(b2∆x)

∆y

y= exp(b2∆x)− 1

(∆y

y

)× 100 = [exp(b2∆x)− 1]× 100

bzw. fur ∆x = 1

%∆y :=

(∆y

y

)× 100 = [exp(b2)− 1]× 100

d.h. wenn x um eine Einheit zunimmt andert sich y um (exp(b2)− 1)×100 Prozent.

Fur kleine b2 (z.B. b2 < 0.1) gilt exp(b2)− 1 ≈ b2, siehe Abbildung 2.7.

Deshalb konnen wir fur b2 < 0.1 schreiben

%∆y :=

(∆y

y

)× 100 ≈ b2 × 100 fur b2 < 0.1

Log-lin Modelle mit Dummy Variablen Bei der Interpretation der Koeffizi-enten von Dummy Variablen in log-lin Modellen ist zu beachten, dass sich DummyVariablen per Definition nicht infinitesimal andern konnen, deshalb muss wieder dieDifferenz zwischen beiden Auspragungen der Dummy Variable gebildet werden. Sei

Page 13: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 13

d eine Dummy Variable und ln(yi) = b1 + b2di, dann sind die Differenzen

∆ ln(yi) := [ln(yi)|di = 1]− [ln(yi)|di = 0] = b1 + b2 × 1− b1 − b2 × 0

ln

(yi|di = 1

yi|di = 0

)= b2

yi|di = 1

yi|di = 0− 1 = exp(b2)− 1

[(yi|di = 1)− (yi|di = 0)

(yi|di = 0)

]× 100 = [exp(b2)− 1]× 100

Der durchschnittliche prozentuelle Unterschied zwischen den beiden Kategorien istalso [exp(b2)− 1]× 100, und fur |b2| < 0.1 gilt wieder [exp(b2)− 1] ≈ b2.

Beispiel 1: Auf Grundlage von EU-Silc Daten fur Osterreich (2012) wurdefolgende Lohngleichung geschatzt, wobei ‘StdL’ den Stundenlohn unselbstandigBeschaftigter bezeichnet, ‘potBildg’ ist die potentielle Ausbildungszeit in Jahren(Alter bei Berufseinstieg minus 6), und ‘Weibl’ ist eine Dummy Variable.

ln(StdL) = 2.345 + 0.026 potBildg − 0.189 Weibl

R2 = 0.151, n = 5111

Nach dieser Schatzung nimmt der Stundenlohn ceteris paribus mit jedem Jahr po-tentieller Bildung um 2.6% zu (genauer: (exp(0.026) − 1)100 = 0.0262). Aufgrundder speziellen Funktionsform gilt dies fur alle Bildungsniveaus.

Frauen verdienen nach dieser Schatzung im Durchschnitt um 17.22 Prozent wenigerals Manner, weil (exp(−0.189)− 1)100 = −17.22.

Beispiel 2: Betrachten wir die Funktion

ln(y) = 1 + 0.2x

Wie verandert sich y, wenn x um eine Einheit von 5 auf 6 zunimmt? Aufgrund derobigen Diskussion erwarten wir, dass y um [(exp(0.2) − 1]100% = 22.14 Prozentzunehmen wird.

Dies konnen wir wieder einfach uberprufen, indem wir obige Funktion umschreibenzu y = exp(1 + 0.2x) und fur x zwei Werte einsetzen, z.B. 5 und 6.

x ∆x y = exp(1 + 0.2x) (∆y)/y %∆y5 7.38905616 1 9.0250135 0.2214 22.14%

fur Osterreich folgende Lohngleichung geschatzt

Page 14: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 14

Beispiel 3: Berechnung von durchschnittlichen Wachstumsraten mittelsOLS Mit Hilfe einer einfachen log-lin Regression auf den Trend4 kann eine durch-schnittliche Wachstumsrate berechnet werden.

Wenn i die diskrete Wachstumsrate einer Variable y ist gilt

yt = y0(1 + i)t ⇒ ln yt = ln y0 + ln(1 + i)× t

Dieser Zusammenhang sollte fur jede Periode gelten. Um die diskrete Wachstumsratei zu schatzen konnen wir deshalb t durch eine Trendvariable Trend = 1, 2, 3, . . . , Tersetzen. Wenn wir mit y0 den Wert von y in der Ausgangsperiode bezeichnen ist

ln yt = ln y0︸︷︷︸b1

+ ln(1 + i)︸ ︷︷ ︸b2

×Trendt

Wir konnen also einfachln yt = b1 + b2Trendt + et

schatzen und aus b2 = ln(1 + i) die durchschnittliche diskrete Wachstumsrate iberechnen, denn aus

b2 = ln(1 + i) folgt i = exp(b2)− 1

Die prozentuelle durchschnittliche diskrete Wachstumsrate ist deshalb

i% := i× 100 = [exp(b2)− 1]× 100

Wenn b2 sehr klein ist (z.B. kleiner als 0.1) wird sich b2 nur geringfugig von exp(b2)−1unterscheiden, bei großeren Werten sollte die Korrektur aber durchgefuhrt werden.

Beispiel: Fur das reale BIP Chinas wurde folgende Regression geschatzt (Da-tenquelle: World dataBank, WDI; Dependent variable: GDP, PPP, constant 2005international dollar.)

ln(GDP) = 26.955 + 0.096 Trend(0.012)*** (0.001)***

R2 = 0.998, σ = 0.036, DW = 0.502, n = 32 (1980− 2011)(Standardfehler in Klammern)

Nach dieser Schatzung ist das reale BIP Chinas im Zeitraum 1980 – 2011 im Durch-schnitt jahrlich um (exp(0.096)− 1)× 100 ≈ 10.08 Prozent gewachsen.

Hinweis: Wir konnten uns fragen, in welcher Zeitspanne sich das Einkommen ver-doppelt, wenn es mit einer naturlichen Wachstumsrate r wachst. Dazu mussen wirnur

2Y0 = Y0ert

4Eine Trendvariable nimmt mit jeder Beobachtung um eine Einheit zu, z.B. Trend =1, 2, 3, . . . , T .

Page 15: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 15

y

x

ln(y) = b1 + b21x

Abbildung 2.8: Log-Reziproke Transformationen

nach t losen. Logaritmieren gibt ln(2) = rt oder t = ln(2)/r ≈ 0.7/r. Wenn wirZahler und Nenner mit 100 multiplizieren erhalten wir eine prozentuelle Wachs-tumsrate, also

Verdoppelungszeit ≈70

r%Naturlich gilt dies naherungsweise auch fur eine diskrete Wachstumsrate i. Wir losen2Y0 = Y0(1 + i)t nach der Verdoppelungszeit t und erhalten t = ln(2)/ ln(1 + i). Dafur kleine i gilt ln(1 + i) ≈ i gilt dieser Zusammenhang naherungsweise auch furdiskrete Wachstumsraten.5

Mit einer Wachstumsrate von 10% verdoppelt sich das Einkommen also ungefahralle sieben Jahre!

Beispiel 4: Eine spezielle Spezifikation ist

ln(y) = b1 + b21

x

Dieses log-inverses Modell erlaubt die Modellierung zuerst zunehmender und dannabnehmender marginaler Effekte, siehe siehe Abbildung 2.8. Ein solches Modellkonnte zum Beispiel verwendet werden, um Verkaufsumsatze in Abhangigkeit vonWerbeausgaben zu erklaren. Die S-formige Funktionsform erlaubt zuerst zunehmen-de Grenzertrage von Werbeausgaben, und ab demWendepunkt bei b2/2 abnehmendeGrenzertrage, und nahert sich schließlich asymptotisch einem horizontalen Verlaufan.

Das lin-log Modell

Beim lin-log Modell wird nur die erklarende Variable logarithmiert. Eine grafischeAbbildung des lin-log Modells

yi = b1 + b2 ln xi

5Wir erinnern uns, dass ln(x+∆x)−ln(x) ≈ ∆x/x, vgl. Exkurs Seite 5. Dies kann umgeschriebenwerden

ln(x+∆x)− ln(x) = ln

(x+∆x

x

)= ln

(1 +

∆x

x

)≈

∆x

x

woraus mit i := ∆x/x folgt ln(1 + i) ≈ i; vgl. auch Abbildung 2.7.

Page 16: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 16

y

x

y = b1 + b2 lnxb2 > 0

e−b1/b2

y

x

y = b1 + b2 lnxb2 < 0

Abbildung 2.9: Lin-log Modell: y = b1 + b2 ln x

findet sich in Abbildung 2.9.

Wir konnen dies wieder in Anderungen anschreiben6

∆y = b2∆ ln(x) ⇒ b2 =∆y

∆ ln(x)≈

∆y∆xx

=absolute Anderung von y

relative Anderung von x

Um eine prozentuelle Anderung von x zu erhalten mussen wir in diesem Fall dielinke und die rechte Seite durch 100 dividieren

b2100

≈∆y

∆xx

× 100=

absolute Anderung von y

prozentuelle Anderung von x

d.h. eine Zunahme von x um ein Prozent fuhrt ceteris paribus zu einer absolutenAnderung von y um 0.01× b2 Einheiten.

Beispiel 1: Angenommen wir haben die Funktion

y = 1 + 0.2 ln(x)

Wie verandert sich y, wenn x um ein Prozent zunimmt? Aufgrund der obigen Dis-kussion erwarten wir, dass y um 0.002 Einheiten zunehmen wird.

Wir uberprufen dies wieder, indem wir in obige Funktion zwei Werte fur x einsetzen,z.B. 5 und 5.05.

x (∆x)/x %∆x y = 1 + 0.2 ln(x) ∆y5.00 1.32188765.05 5.05−5

5= 0.01 1% 1.3238777 0.00199

Da eine Anderung um ein Prozent keine infinitesimal kleine Anderung ist gilt diesnicht exakt, aber fur praktische Zwecke ist diese Naherung meist ausreichend. ¶

6Fur infinitesimale Anderungen differenzieren wir y = b1 + b2 ln(x) total und erhalten dy =b2

1x dx woraus folgt

b2 =dy

dx/x

Page 17: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 17

Beispiel 2: Abbildung 2.10 zeigt den Zusammenhang zwischen Lebenserwartung(LE; Life expectancy at birth, total (years)) und pro Kopf Einkommen (GNIpC; GNIper capita, PPP (current international $)) fur einen Landerquerschnitt im Jahr 2011.Das linke Panel zeigt die Rohdaten, offensichtlich beschreibt eine lineare Regressiondiesen Zusammenhang deutlich schlechter als eine lin-log Regression. Das rechtePanel zeigt den Zusammenhang, wenn auf der x-Achse das logarithmierte pro KopfEinkommen aufgetragen wird.

40

50

60

70

80

90

0 10,000 30,000 50,000 70,000 90,000

GNI per capita, PPP (current international $)

Life e

xpecta

ncy a

t birth

, to

tal (y

ears

)

Linear FitLinear-Log Fit

40

50

60

70

80

90

5 6 7 8 9 10 11 12

LOG(GNI per capita, PPP (current international $))

Life

exp

ecta

ncy a

t b

irth

, to

tal (y

ea

rs)

Abbildung 2.10: Lebenserwartung (Life expectancy at birth, total (years)) vs. proKopf Einkommen (GNI per capita, PPP (current international$)); Datenquelle: World Bank, WDI

LE = 16.828 + 5.968 LOG(GNIpC)(3.096)*** (0.345)***

R2 = 0.643, s = 5.704, n = 168(Standardfehler in Klammern)

Interpretation: Wenn das pro Kopf Einkommen um ein Prozent zunimmt erwartenwir auf Grundlage dieser Schatzung ceteris paribus eine Verlangerung der Lebens-erwartung um ca. 0.06 Jahre, das sind ca. 22 Tage.

Achtung: wir wissen, dass diese Gleichung ziemlich sicher fehlspezifiziert ist, dasowohl die Lebenserwartung als auch das pro Kopf Einkommen unabhangig von-einander im Zeitablauf zunehmen (z.B. mit dem technischen Fortschritt), also istzumindest der ‘Trend’ ziemlich sicher eine ‘omitted variable’.

2.1.3 Wann logarithmieren?

Logarithmische Transformationen werden in der Okonometrie haufig angewandt, vorallem fur Großen, die in Geldbetragen oder einem anderen Niveau gemessen wer-den, z.B. BIP, Bevolkerung oder Flache. Insbesondere makrookonomische Variablen,von denen man plausibel annehmen kann, dass sie langfristig ungefahr exponenti-ell wachsen, werden haufig logarithmiert, denn wie wir gesehen haben nimmt derLogarithmus solcher Variablen linear zu.

Page 18: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 18

Variablen, die eine Zeitdimension haben, werden hingegen eher selten logarithmiert,z.B. Alter, Berufserfahrung oder Bildungsjahre.

Daruber hinaus bietet die Logarithmierung manchmal Vorteile, wenn die Verteilungvon y schief ist oder die Varianzen von ei nicht konstant sind (Heteroskedastizitat),denn haufig erfullt die Verteilung von ln(y) die Annahmen des Regressionsmodellsbesser als y. Da durch die Logarithmierung große Zahlenwerte ‘gestaucht’ werden,sind logarithmisch spezifizierte Regressionen haufig auch weniger anfallig gegenuberAusreißern (‘outliers’ ).

Ein weiterer Grund besteht darin, dass die Standardabweichung vieler okonomi-scher Variablen ungefahr proportional zum Niveau dieser Variablen ist, deshalb istdie Standardabweichung der logarithmierten Variablen naherungsweise konstant. Inanderen Worten, das Logarithmieren okonomischer Variablen fuhrt haufig zu einerArt ‘Stabilisierung’ der Standardabweichung der Koeffizienten.

Ein großer Vorteil logarithmischer Transformationen besteht darin, dass die Stei-gungskoeffizienten als Elastizitaten, bzw. Semi-Elastizitaten, interpretiert werdenkonnen, und deshalb unabhangig von der ursprunglichen Maßeinheit sind. Das sollteaber nicht dazu verleiten unbedacht eine logarithmische Funktionsform zu wahlen.

Das entscheidende Argument fur die Wahl der Funktionsform sollte sein, welchesModell mit der Theorie konsistent ist und die Daten besser abbildet. Prinzipiellexistieren auch Tests fur die Wahl der Funktionsform (z.B. Test von MacKinnon,White & Davidson), doch haben diese oft keine sehr große Power. Manchmal reichtauch schon ein Blick auf einen Scatterplot oder das Histogramm der geschatztenResiduen um zu erkennen, welche Funktionsform eher angebracht ist.

Prozent versus Prozentpunkte: Vorsicht ist geboten, wenn Wachstumsratenund/oder Anteile in Regressionen verwendet werden. Fur die Interpretation derKoeffizienten solcher Regressionen ist es wesentlich zwischen Prozent und Pro-zentpunkten zu unterscheiden. Wenn z.B. die Arbeitslosenrate von 5% auf 6% steigt,so ist dies eine Zunahme um einen Prozentpunkt, aber eine Zunahme von 20 Prozent(= (6 − 5)/5 × 100) gegenuber dem ursprunglichen Niveau. Man beachte, dass dieDifferenz der Logarithmen naherungsweise einer relativen Anderung entspricht, z.B.ln(6)− ln(5) = 0.1823 ≈ 0.2 (beachte, dass (exp(0.1823)− 1)× 100 = 20).

Angenommen in der Regression ln(y) = b1 + b2A+ e sei A ein Anteil, d.h. eine Zahlzwischen Null und Eins (0 ≤ A ≤ 1), es handelt sich also um ein ubliches log-linModell. Deshalb gibt 100b2 naherungsweise an, um wie viel Prozent sich y andert,wenn A um eine Einheit zunimmt. Aber was soll man sich unter ‘einer Einheit’ einesAnteils vorstellen? Wenn wir A mit 100 multiplizieren erhalten wir Prozent, bzw.eine Zunahme um einen Prozentpunkt, denn im log-lin Modell ln(y) = b1 + b2A + eist

b2 ≈

∆yy

∆A=

∆yy× 100

∆A× 100=

prozentuelle Anderung von y

Zunahme von A um einen Prozentpunkt

Deshalb gibt b2 naherungsweise an, um wie viel Prozent sich y andert, wenn Aum einen Prozentpunkt zunimmt (wie immer in log-lin Modellen erhalten wir einenetwas genaueren Wert mit [exp(b2)− 1]).

Page 19: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 19

In einem log-log Modell ln(y) = b1 + b2 ln(A) + e wird b2 wieder wie ublich alsElastizitat interpretiert, das heißt, um wieviel Prozent sich y andert, wenn der AnteilA um ein Prozent zunimmt.

Beobachtungen mit Nullen: Wie schon mehrfach betont ist der Logarithmusvon Null und negativen Werten nicht definiert, deshalb durfen Variablen, die nega-tive Werte oder den Wert Null enthalten, naturlich nicht logarithmiert werden.

Ein bisschen eine Glaubensfrage ist, was man tun soll, wenn eine Variable y nureinige wenige Nullen enthalt. Falls man aus irgendwelchen Grunden y trotzdemlogarithmieren mochte, und es wirklich nur wenige Nullen sind, die von der inhaltli-chen Interpretation her auch keinen großen Stellenwert besitzen, empfehlen mancheAutoren einfach ln(1 + y) anstelle von ln(y) zu verwenden. Die ubliche Prozent-Interpretation bleibt dabei oft zumindest naherungsweise erhalten, mit Ausnahmevon Anderungen in der Nahe von y = 0, wo sie nicht einmal definiert ist (vgl.Wooldridge, 2005, 199). Generell empfiehlt sich in solchen Fallen aber die Anwen-dung geeigneterer Schatzverfahren, z.B. Tobit oder Poisson Modellen.

Wiederholung

1. Partieller Effekt im linearen Modell y = b1 + b2x2 + · · ·+ bhxh + · · ·+ bkxk:

bh =∆y

∆xh

∣∣∣∣ceteris paribus

mit ceteris paribus meinen wir, dass alle anderen x-Variablen konstant gehal-ten werden (∆x1 = . . . = ∆xh−1 = ∆xh+1 = . . . = ∆xk = 0)

2. Partieller Effekt im im log-log Modell ln y = b1+b2x2+· · ·+bh ln xh+· · ·+bkxk

bh =∆ln y

∆ ln xh

∣∣∣∣∣c.p.

∆yy

∆xh

xh

=

∆yy× 100

∆xh

xh

× 100= Elastizitat

3. Partieller Effekt im im log-lin Modell ln y = b1 + b2x2 + · · ·+ bhxh + · · ·+ bkxk

bh =∆ln y

∆xh

∣∣∣∣∣c.p.

∆yy

∆xhoder 100× bh =

∆yy× 100

∆xh

4. Partieller Effekt im im lin-log Modell y = b1+ b2x2+ · · ·+ bh ln xh+ · · ·+ bkxk

bh =∆y

∆ ln xh

∣∣∣∣c.p.

≈∆y∆xh

xh

oder 0.01× bh =∆y

∆xh

xh

× 100

Page 20: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 20

Zusammenfassung: Interpretation der Koeffizienten in Log-Modellen

Spezifikation Interpretation

I. ln(yi) = b1 + b2 ln(xi) + ei Eine Zunahme von x um ein Prozent geht ein-her mit einer Anderung von y um b2 Prozent, d.h.b2 kann unmittelbar als Elastizitat interpretiertwerden.

II. ln(yi) = b1 + b2xi + ei Eine Zunahme von x um eine Einheit (z.B. einenEuro) geht einher mit einer Anderung von y umungefahr 100× b2 Prozent, oder genauer, zu einerAnderung von [exp(b2)− 1]× 100 Prozent.

III. yi = b1 + b2 ln(xi) + ei Eine Zunahme von x um ein Prozent geht einhermit einer Anderung von y um 0.01× b2 Einheiten(z.B. Euro).

2.2 Quadratische Modelle

Lineare Funktionsformen sind praktisch und einfach zu interpretieren, aber leiderist die Realitat nicht immer so einfach, manchmal sind die marginalen Effekte nichtkonstant, sondern hangen vom Niveau ab.

Zum Beispiel wissen wir aus der Mikrookonomik, dass die kurzfristige Durchschnitts-kostenfunktion einer Unternehmung haufig einen U-formigen Verlauf hat.

Eine sehr einfache – wenngleich ziemlich restriktive – Methode zum Modellierungsolcher Nichtlinearitaten besteht in der Verwendung von Polynomen, wobei man sichin den allermeisten Fallen auf quadratische Funktionsformen beschrankt.

yi = b1 + b2x+ b3x2

Man beachte, dass diese Funktion linear in den Parametern b1 und b2 ist, und deshalbeinfach mit OLS geschatzt werden kann, aber nichtlinear in der erklarenden Variablex ist.7

Der marginalen Effekt kann wie ublich als Ableitung berechnet werden

dy

dx= b2 + 2b3x

Offensichtlich ist der marginale Effekt fur dieses quadratische Modell nicht konstant,sondern hangt vom Niveau von x ab. Dies ist auch in Abbildung 2.11 ersichtlich;dort ist b2 > 0 und b3 < 0, deshalb ist die Steigung bei sehr kleinem x groß, nimmtmit zunehmenden x ab, und wird schließlich negativ.

Achtung: b2 misst den marginalen Effekt nur im Punkt x = 0, deshalb ist der Koef-fizient b2 einzeln nur selten von Interesse, wenn uberhaupt ist es meist vernunftiger,

7Wenn wir spater in der stochastischen Regressionsanalyse testen wollen, ob es einen signifi-kanten Zusammenhang zwischen x und y gibt, reicht es nicht die Koeffizienten einzeln zu testen,sondern wir mussen mittels F -Test die simultane Nullhypothese H0 : β2 = 0 und β3 = 0 testen!

Page 21: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 21

y

x

bb b

bb

b bb

b b b

b

bbbbbbb b

b b b

bb

bbb

b b

b

x∗

Abbildung 2.11: Quadratische Modelle y = b1+b2x+b3x2 unterstellen einen sym-

metrischen Verlauf, deshalb konnen sie in der Stichprobe zwareinen sehr guten Fit haben, aber sehr schlechte Prognosen lie-fern. In diesem Beispiel ist b2 > 0 und b3 < 0.

den marginalen Effekt im Mittelwert der x oder in einem anderen gut interpretier-baren Punkt anzugeben. Sollte genugend Raum zur Verfugung stehen kann man ihnauch grafisch darstellen (siehe z.B. Abbildung 2.16, Seite 32).

Quadratische Funktionen haben ein Maximum oder Minimum, welches einfach be-rechnet werden kann, indem man die Ableitung dy/dx = b2 + 2b3x gleich Null setztund nach x lost

x∗ =−b22b3

Bevor dieser Extremwert x∗ interpretiert wird sollte man allerdings uberprufen, wel-cher Anteil der Beobachtungen links bzw. rechts von diesem Wert liegen, vergleicheAbbildung 2.11.

Quadratische Log-lin Modelle Bei log-lin Modellen interessieren wir uns meistfur die Auswirkungen der Anderung von x um eine Einheit, also fur eine diskreteAnderung VON x. Bei diskreten Anderungen in nichtlinearen Modellen ist generellVorsicht geboten, wie folgendes Beispiel zeigt.8

Angenommen, wir mochten den marginalen Effekt von x im Modell

ln(y) = b1 + b2x+ b3x2

berechnen. Wenn es sich um diskrete Anderungen von x handelt mussen wir aufgrundder Nichtlinearitat fur den partiellen Effekt die Differenzen bilden

∆ ln(y) := ln(y +∆y)− ln(y) = b1 + b2(x+∆x) + b3(x+∆x)2 −

b1 − b2x− b3x2

= b2∆x+ b3[2x∆x+ (∆x)2]

8Dank an Klaus Nowotny fur den Hinweis!

Page 22: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 22

und fur ∆x = 1

ln

(1 +

∆y

y

)= b2 + b3(2x+ 1) = b2 + 2b3(x+ 0.5) ≈

∆y

y

2.3 Interaktions-Modelle

Als erklarende Variablen konnen auch Produkte einzelner erklarender Variablen ver-wendet werden, z.B. im folgenden Modell das Produkt von x2 und x3

y = b1 + b2x2 + b3x3 + b4(x2x3)

In diesen Modellen werden x2 und x3 Hauptterme oder Haupteffekte (‘main terms’ )genannt und das Produkt x2x3 wird als Interaktionsterm (‘interaction term’ ) be-zeichnet.

Wenn in einem Modell Interaktionsterme berucksichtigt werden sollten auf jeden Fallauch die Hauptterme berucksichtigt werden, da sonst die Gefahr eine Fehlspezifika-tion aufgrund fehlender relevanter Variablen extrem groß ist (der Interaktionstermx2x3 ist fast immer mit x2 und x3 korreliert (vgl. Balli and Sørensen, 2012).

Der marginale Effekte von x2 hangt vom Niveau von x3 ab,

∂y

∂x2= b2 + b4x3

d.h. die ceteris paribus Auswirkung einer Anderung von x2 auf y hangt auch vomabsoluten Wert von x3 an der betreffenden Stelle ab.9

Man kann die Abhangigkeit des marginalen Effekts von x2 vom Wert von x3 z.B.grafisch darstellen, indem man in einer Grafik ∂y/∂x2 gegen x3 auftragt.

Achtung: Der Koeffizient b2 misst den marginalen Effekt von x2 nur im Punkt x3 = 0!

Analog gilt fur eine Anderung von x3, wenn x2 konstant gehalten wird,

∂y

∂x3

= b3 + b4x2

Aus der Tatsache, dass der Koeffizient des Interaktionsterms im linearen Modell

y = b1 + b2x2 + b3x3 + b4(x2x3)

einfach die zweite Ableitung ist

b4 =

∂y∂x2

∂x3

=

∂y∂x3

∂x2

=∂2y

∂x2∂x3

folgt eine weitere wichtige Beobachtung:

Der Koeffizient des Interaktionsterms b4 gibt an, wie sich der marginaleEffekt von x2 andert, wenn x3 um eine (infinitesimale) Einheit zunimmt.

Man beachte, dass die Funktionsform eine Symmetrie der marginalen Effekte er-zwingt (dies folgt aus der Symmetrie der zweiten Ableitungen, vgl. Young’s Theo-rem), d.h. b4 kann auch als Anderung des marginalen Effekts von x3 interpretiertwerden, wenn x2 um eine Einheit zunimmt.

9Wenn spater getestet werden soll, ob x2 einen Effekt auf y hat, darf nicht der einfache t-Testfur den Koeffizienten von x2 herangezogen werden, sondern es muss z.B. mit einem F-Test diesimultane Nullhypothese β2 = 0 und β4 = 0 getestet werden.

Page 23: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 23

Beispiel: Die Wirksamkeit von Entwicklungshilfe ist seit jeher sehr umstritten,einfache Regressionen von Indikatoren fur die empfangene Entwicklungshilfe aufdie Wachstumsrate der Empfangerlander zeigten regelmaßig keinen Zusammenhangoder lieferten widerspruchliche Ergebnisse.

In einem sehr einflussreichen Paper zur Entwicklungshilfe argumentierten Burnsideand Dollar (2000) “We find that aid has a positive impact on growth in developingcountries with good fiscal, monetary, and trade policies but has little effect in the pre-sence of poor policies.” Ihre Aussage begrundeten Sie mit einer etwas komplexerenOLS Regression, die (stark) vereinfacht folgendermaßen aussieht

W = b1 + b2A+ b3P + b4(A× P ) + · · ·+ e

dabei sind W die Wachstumsrate der Empfangerlander, A ein Indikator fur dieempfangene Entwicklungshilfe, und P ein Indikator fur ‘gute’ Wirtschaftspolitik,beruhend auf makrookonomischen Variablen wie z.B. Inflationsrate, Budgetdefizit,etc.

Das Argument von Burnside and Dollar (2000), das Entwicklungshilfe nur inLandern mit ‘guter’ Wirtschaftspolitik wirkt, beruhte auf dem Koeffizienten der In-teraktionsvariable, der in Ihrem Modell positiv und statistisch signifikant von Nullverschieden war. Das bedeutet, dass die Wirksamkeit der Entwicklungshilfe von ‘gu-ter’ Wirtschaftspolitik abhangt

∂W

∂Y= b2 + b4P

Dieses Papier war politisch extrem einflussreich, da es gut in das Weltbild vielerbetroffener Akteure passte, aber es wurde bald gezeigt, dass dieses Resultat sehrstark von der Landerauswahl und der Zeitperiode abhangig war. Fur eine großereZahl von Landern und spatere Jahre konnte das Resultat haufig nicht reproduziertwerden.

2.3.1 Alternative Parametrisierung von Interaktionsmodel-len

Durch eine einfache ‘Reparametrisierung’ kann ein alternatives Interaktionsmodellgeschatzt werden, dessen Koeffizienten direkt den marginalen Effekt im Mittelwertder betreffenden Variable messen.

Beginnen wir mit dem einfachen Interaktionsmodell

y = b1 + b2x2 + b3x3 + b4x2x3 (2.1)

Wenn uns z.B. der marginale Effekt von x2 gemessen im Mittelwert von x3 interes-siert konnen wir diesen einfach berechnen

∂y

∂x2

= b2 + b4x3 (2.2)

Wir werden nun zeigen, dass wir diesen marginalen Effekt im Mittelwert der ande-ren Variablen noch einfacher durch eine einfache Variablentransformation schatzenkonnen.

Page 24: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 24

Angenommen wir schatzen anstelle von Gleichung (2.1) ein reparametrisiertes Mo-dell

y = a1 + a2x2 + a3x3 + a4(x2 − x2)(x3 − x3) (2.3)

wobei x2 und x3 wie ublich die Mittelwerte bezeichnen, dann misst a2 den marginalenEffekt von x2 im Mittelwert von x3, d.h. gibt exakt den gleichen Wert, den wir ausGleichung (2.2) erhalten!

Warum dies so ist kann einfach gezeigt werden. Wenn wir den Interaktionstermausmultiplizieren erhalten wir

y = a1 + a2x2 + a3x3 + a4[x2x3 − x2x3 − x3x2 + x2x3]

= a1 + a4x2x3 + (a2 − a4x3)x2 + (a3 − a4x2)x3 + a4x2x3

Aus einem Vergleich mit Gleichung (2.1) sehen wir sofort, dass (a2 − a4x3) = b2,(a3 − a4x2) = b3 und a4 = b4 sein muss.

Was haben wir damit gewonnen? Aus (a2 − a4x3) = b2 und a4 = b4 folgt

a2 = b2 + b4x3

dies ist aber exakt der marginale Effekt von x2 gemessen im Mittelwert von x3 denwir aus Gleichung (2.2) erhalten haben!

Wenn wir also anstelle von Gleichung (2.1) die reparametrisierte Gleichung (2.3)schatzen misst der Koeffizienten a2 direkt den marginalen Effekt von x2 im Mit-telwert von x3, mit dem dazugehorigen korrekten Standardfehler des marginalenEffekts im Mittelwert. Die dazugehorige t-Statistik kann also unmittelbar verwen-det werden um zu testen, inwieweit der marginale Effekt im Mittelwert von x3 vonNull verschieden ist. Analoges gilt fur a3.

Dies ist offensichtlich interessanter als die Schatzung von b2 aus Gleichung (2.1),denn dieser Koeffizient misst den marginalen Effekt nur im Punkt x3 = 0, der kaumje relevant sein durfte.

Allerdings andert dies nichts an der Nicht-Linearitat des Zusammenhangs, der mar-ginale Effekt von x2 ist fur jeden Wert von x3 unterschiedlich!

Zusammenfassend einige abschließende Empfehlungen fur den Umgang mit Interak-tionseffekten von Brambor et al. (vgl. 2006):

1. Interpretieren Sie die Koeffizienten des Interaktionsvariable nie als unbedingtemarginale Effekte!

2. Falls Sie an den marginalen Effekten interessiert sind berechnen Sie diese furinteressierende Werte der anderen Variablen, oder stellen sie diesen grafischdar.

3. Berechnen Sie den Standardfehler des marginalen Effekts sowie dessen Signi-fikanz fur relevante Werte der Variablen, z.B. im Mittelwert. Eine einfacheMoglichkeit dazu bietet die oben erlauterte alternative Parametrisierung.

Page 25: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 25

Tabelle 2.1: Lohngleichung fur Osterreich mit Interaktionseffekten

Dependent Var.: log(wage) (1) (2)

Constant 1.44742∗∗∗ 1.24820∗∗∗

(0.03884) (0.03202)educ 0.04235∗∗∗ 0.05677∗∗∗

(0.00221) (0.00189)exper 0.02940∗∗∗ 0.03962∗∗∗

(0.00317) (0.00202)exper2 −0.00060∗∗∗ −0.00060∗∗∗

(0.00005) (0.00005)educ × exper 0.00074∗∗∗

(0.00015)(educ − educ)× (exper− exper) 0.00074∗∗∗

(0.00015)

R-squared 0.24811 0.24811N 5237 5237

Beispiel: Tabelle 2.1 zeigt zwei Schatzungen fur Lohngleichungen mit Interakti-onseffekten. Diesen Schatzungen liegen die gleichen EU-SILC Daten zugrunde, diewir auch spater fur ein ausfuhrlicheres Beispiel verwenden werden (vgl. Tabelle 2.2,Seite 29). Spalte (1) von Tabelle 2.1 zeigt den unmittelbaren Interaktionseffekt wiein Gleichung (2.1), Spalte (2) die Schatzung fur das reparametrisierte Modell wie inGleichung (2.3).

Alle Koeffizienten weisen das erwartete Vorzeichen auf und sind hoch signifikant vonNull verschieden.

Spalte (1) von Tabelle 2.1 zeigt die Schatzung fur die Gleichung

log(wage) = b1 + b2 educ + b3 exper + b4 exper2 + b5 educ× exper

Der marginale Effekt von educ ist

∂ log(wage)

∂educ= b2 + b5exper

Diese Funktion ist im linken Panel von Abbildung 2.12 dargestellt. Wenn wir diegeschatzten Koeffizienten aus Tabelle 2.1 und den Mittelwert fur die Berufserfahrungexper = 19.5 (siehe Tabelle 2.2) einsetzen erhalten wir den Wert 0.05677, also genauden Wert des Koeffizienten von educ in Spalte (2). Genau dies haben wir im vorher-gehenden Abschnitt uber die Reparametrisierung allgemein gezeigt. Fur jemandenmit 19.5 Jahren Berufserfahrung erwarten wir also, dass ein weiteres Jahr an Aus-bildung ungefahr einen um 5.677% hoheren Stundenlohn bringt. Dieser Punkt istim linken Panel von Abbildung 2.12 eingezeichnet. Aus dieser Abbildung erkennenwir auch, dass der marginale Effekt von educ mit zunehmender Berufserfahrung auffast 8% ansteigt.

Der marginale Effekt fur die Berufserfahrung exper ist

∂ log(wage)

∂exper= b3 + 2b4 exper + b5educ

Page 26: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 26

0 10 20 30 40 50

56

78

Marginal Effect of Education (%)

Experience

Mar

gina

l Effe

ct o

f Edu

catio

n (%

)

0 5 10 15 20 25 30 35

−1

01

23

45

Marginal Effect of Experience (%)

Education

Mar

gina

l Effe

ct o

f Exp

erie

nce

(%)

exper 0.25 quantileexper 0.5 quantile (median)exper 0.75 quantile

Abbildung 2.12: Marginale Effekte mit Interaktionseffekten fur Lohngleichung.

In diesem Fall hangt der marginale Effekt der Berufserfahrung auf den Stundenlohnvom Level des Ausbildungsjahre und der Berufserfahrung ab. Wenn wir wieder dieKoeffizienten von Spalte (1) aus Tabelle 2.1 einsetzen, fur educ den Mittelwert 13.815Jahre und fur exper = 0 erhalten wir den Koeffizienten von exper aus Spalte 2

∂ log(wage)

∂exper= 0.02940− 2× 0.0005991× 0 + 0.0007393× 13.815 ≈ 0.03962

Die Abhangigkeit des marginalen Effekts von exper auf den Stundenlohn fur un-terschiedliche Ausbildungsdauer educ und fur drei Levels von exper ist im rechtenPanel von Abbildung 2.12 dargestellt. Offensichtlich nimmt der marginale Effekt derBerufserfahrung ceteris paribus mit der Ausbildungsdauer zu, und ist ceteris paribusumso hoher, je geringer die Berufserfahrung ist.

Wenn wir fur exper anstelle von Null den Median von 20 Jahren einsetzen erhaltenwir den Wert 0.01565, das heißt, fur jemanden mit 13.8 Jahren Ausbildung erwartenwir, dass der Stundenlohn um ca. 1.565% steigt, wenn die Berufserfahrung von 20Jahren auf 21 Jahre zunimmt. Dieser Punkt ist in der Grafik eingezeichnet.

Vorsicht mit nicht-linearen Funktionsformen:

• Mit polynomischen Modellen (z.B. quadratischen oder kubischen Modellen)kann man zwar manchmal einen sehr guten Fit in der Stichprobe erreichen,aber fur Prognosen sind sie meistens ziemlich unbrauchbar, da die Funktions-form ‘out of sample’ haufig extreme Verlaufe erzwingt.

• Das Bestimmtheitsmaß R2 darf nur fur den Vergleich von Modellen verwendetwerden, in denen die abhangige Variable y nicht transformiert wurde und wennbeide Modelle die gleiche Anzahl erklarender Variablen haben.

Dies ist einfach zu erkennen: das Bestimmtheitsmaß ist definiert als Anteilder durch die x erklarten Streuung an der gesamten Streuung von y. Falls y

Page 27: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 27

y = b1 +b2

x− b3

y

xb3

b1

b2 > 0

y

xb3

b1

b2 < 0

Abbildung 2.13: Reziproke Transformationen

transformiert wird (also z.B. log(y) anstelle von y verwendet wird), andert sichnaturlich auch die Streuung, und damit das R2

R2y = 1−

∑i e

2i∑

i(yi − y)2⇔ R2

log(y) = 1−

∑i e

2i∑

i[log(yi)− log(y)]2

Dies gilt auch fur das korrigierte Bestimmtheitsmaß R2, welches bloß einenVergleich von Modellen mit einer unterschiedliche Anzahl erklarender Varia-blen ermoglicht.

• Grundsatzlich sollte weder das normale R2 noch das korrigierte Bestimmtheits-maß R2 fur die Einschatzung der Qualitat einer Schatzung uberinterpretiertwerden, da sie nur die Anpassung in der Stichprobe beschreiben. Viel wich-tiger ist z.B., ob die geschatzten Koeffizienten die theoretischen Erwartungenerfullen und signifikant von Null verschieden sind. Im Kapitel uber Spezifika-tion werden wir einige weitere Kriterien und Tests kennen lernen.

2.4 Reziproke Transformationen

Eine andere Funktionsform, die z.B. fur die Schatzung von Phillips-Kurven heran-gezogen werden kann, sind reziproke Transformationen, man verwendet einfach denKehrwert der Variablen, siehe Abbildung 2.13.

y = b1 + b21

x

Page 28: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 28

Ubersicht:

Modell Gleichung Steigung (= dydx) Elastizitat (= dy

dxxy)

Linear y = α + βx β β(x/y)Log-linear ln y = α + β ln x β(y/x) βLog-lin ln y = α + βx β(y) β(x)Lin-log y = α + β ln x β(1/x) β(1/y)Reziprok y = α + β(1/x) −β(1/x2) −β(1/xy)

2.5 Beispiele

2.5.1 Eine Lohngleichung fur Osterreich

In diesem Beispiel schatzen wir verschiedene Spezifikationen von Lohngleichungen,die wesentlich auf die Arbeiten des Arbeitsmarktokonomen Jacob Mincer (1974)zuruck gehen; fur neuere Entwicklungen siehe z.B. Heckman et al. (2003).

Im Rahmen der EU-SILC (‘Statistics on income, social inclusion and living condi-tions’ ) werden auch fur Osterreich jahrlich Daten uber die Lebensbedingungen vonPrivathaushalten erhoben. Diese Daten enthalten u.a. auch ein Bruttomonatsein-kommen,10 aus dem fur die folgende Schatzung unter Berucksichtigung von geleiste-ten Uberstunden etc. ein Brutto-Stundenlohn (wage) berechnet wurde.

Nachdem die Daten keine direkte Information zur Ausbildungsdauer enthalten ver-wenden wir dafur eine Proxy-Variable ‘educ’, die wir als ‘Alter bei hochstem Bil-dungsabschluss’ minus 6 berechnen. Auch fur die Berufserfahrung ‘exper’ verwen-den wir ein Proxy-Variable, namlich ‘Alter’ minus ‘Alter bei hochstem Bildungsab-schluss’. Dies sind naturlich nur Naherungen, aber fur unsere Zwecke reichen diese.

Ein wichtiger Punkt jeder Datenanalyse ist es, die Daten nach dem Einlesen in dasProgramm zu kontrollieren und auf ihre Plausibilitat zu uberprufen. Fur 77 vonuber funftausend Personen erhalt man fur educ bzw. exper negative Werte. Da dieseunplausibel scheinen wurden sie fur die folgenden Berechnungen ausgeschlossen.Diese Vorgangsweise ist nicht ganz unproblematisch, eigentlich sollten diese Fallenaher untersucht werden, aber wir werden im Moment darauf verzichten.

Tabelle 2.2 zeigt die ublichen deskriptiven Statistiken fur die Daten.

Offensichtlich streuen die Stundenlohne sehr stark, sie liegen zwischen 14.4 Cent und411 Euro. Solche Extremwerte mogen unglaubwurdig scheinen, sind aber in solchgroßen Stichproben nicht ungewohnlich. Obwohl solche Beobachtungen auf Kodie-rungsfehler zuruckzufuhren sein konnten ist es gefahrlich und willkurlich, solche Ex-tremboebachtungen ohne naherer Recherche auszuschließen. Insgesamt enthalt derDatensatz nur 9 Personen mit einem Stundenlohn unter einem Euro und 7 Personenmit einem Stundenlohn uber hundert Euro. Durch die Logarithmierung wird derEinfluss dieser Extrembeobachtungen vermindert und die Verteilung deutlich sym-metrischer, wie auch aus den Histogrammen in Abbildung 2.14 (Seite 29) ersichtlichist.

10Variable py200g: Aktuelles Einkommen aus unselbstandiger Erwerbstatigkeit - MonatsbetragBrutto

Page 29: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 29

Tabelle 2.2: Deskriptive Statistiken fur Brutto-Stundenlohn unselbstandig Er-werbstatiger (wage), sowie von Proxyvariablen fur Ausbildungsdazereduc und Berufserfahrung exper.

wage log(wage) educ exper

Mean 14.010 2.482 13.815 19.504Median 11.879 2.475 12.000 20.000Min 0.144 −1.936 4.000 0.000Max 411.354 6.019 47.000 61.000Std.Dev 10.735 0.563 4.787 11.807Obs 5237 5237 5237 5237Value = 0 0 0 0 104.000

Histogram of wage

wage

Den

sity

0 50 100 150

0.00

0.02

0.04

0.06

Histogram of log(wage)

log(wage)

Den

sity

−2 0 2 4 6

0.0

0.2

0.4

0.6

0.8

Abbildung 2.14: Histogramme des Brutto-Stundenlohns (wage) und des Logarith-mus vom Brutto-Stundenlohn.

Page 30: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 30

Die Werte fur ‘Bildungsjahre’ (educ) und ‘Berufserfahrungsjahre’ (exper) bewegensich im erwarteten Rahmen. Fur 140 Personen educ kleiner als die Schulpflicht vonneun Jahren. Auffallig ist, dass fur funfzig Prozent aller Personen educ zwischen 9und 12 Jahren liegt.

Tabelle 2.3 zeigt zwei Schatzungen von Lohngleichungen, in Spalte (1) die Schatzungfur

log(wage) = b1 + b2educ + b3exper + b4exper2

und in Spalte (2) wird educ2 als zusatzlicher Regressor berucksichtigt.

Tabelle 2.3: Schatzungen von Lohngleichungen fur Osterreich (Datenquelle: EU-SILC 2009).

Dependent variable: log(wage)(1) (2)

Constant 1.31643∗∗∗ 0.51894∗∗∗

(0.02914) (0.05298)educ 0.05072∗∗∗ 0.15091∗∗∗

(0.00148) (0.00581)exper 0.04205∗∗∗ 0.03594∗∗∗

(0.00197) (0.00194)exper2 −0.00068∗∗∗ −0.00052∗∗∗

(0.00005) (0.00005)educ2 −0.00258∗∗∗

(0.00015)

R-squared 0.24440 0.28757N 5237 5237

Alle Koeffizienten weisen das erwartete Vorzeichen auf und sind hoch signifikantvon Null verschieden. Ungefahr 24% der Streuung von log(wage) werden durch dieVariablen educ, exper und exper2 erklart, bzw. 29%, wenn educ2 als zusatzlicherRegressor berucksichtigt wird.

Abbildung 2.15 zeigt ein partielles Streudiagramm, das heißt, den Zusammenhangzwischen educ und log(wage) nachdem der lineare Einfluss von exper entfernt wurde(siehe Abschnitt ??, Seite ??; um die Großenordnung korrekt wiederzugeben wurdendie Mittelwerte der Variablen zu den Residuen addiert). Die durchgezogene Linezeigt die lineare Schatzung in Spalte (1) von Tabelle 2.3, die strichlierte Linie dasquadratische Modell in Spalte (2).

Nach der Schatzung in Spalte (1) wurden wir erwarten, dass der Lohn mit jedemzusatzlichen Ausbildungsjahr um ca. 5% zunimmt (oder genauer, um [exp(0.05072)−1]× 100%).

Die Schatzung in Spalte (2) berucksichtigt educ2 als zusatzlichen Regressor. Nachdieser Schatzung ist der marginale Effekt nicht konstant, sondern hangt der Anzahlder Bildungsjahre ab

∂log(wage)

∂educ= 0.15091− 2× 0.00258 educ

Page 31: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 31

10 20 30 40

−2

02

46

Partial Regression Plot

residuals education

resi

dual

s lo

g(w

age)

linearquadratic

Abbildung 2.15: Partieller Zusammenhang zwischen log(wage) und education(Schatzung siehe Tabelle 2.3 Spalte (1); Datenquelle: EU-SILC2009).

Dies lasst vermuten, dass sich ein ‘zuviel an Bildung’ negativ auf den Lohn auswirkt.Allerdings erreicht der Lohn erst bei educ = 29 Jahren ein Maximum, und nur 87Personen (1.6%) in dieser Stichprobe weisen tatsachlich eine Ausbildungsdauer vonmehr als 29 Jahren auf. Deshalb ist der Bereich mit einem negativen Zusammenhangzwischen wage und educ vermutlich nicht sehr relevant. Dies wird auch in Abbildung2.15 ersichtlich.

Achtung: Vermutlich uberschatzten diese Schatzungen den tatsachlichen margina-len Effekt der Bildung, da es sehr wahrscheinlich ist, dass sowohl die Bildung alsauch der Stundenlohn von nicht beobachtbaren Variablen wie zum Beispiel der In-telligenz beeinflusst werden. Uber den Umgang mit solchen nicht berucksichtigtenintervenierenden Variablen (‘omitted variables’ ) werden wir spater im Kapitel uberInstrumentvariablen mehr horen.

Den marginalen Effekt der Berufserfahrung exper berechnen wir aus Spalte (1) vonTabelle 2.3 wieder als Ableitung

∂log(wage)

∂exper= b3 + 2b4exper = 0.04205− 2× 0.00068 exper

Aufgrund der quadratischen Funktionsform ist der marginale Effekt nicht konstant,sondern hangt vom Niveau der Berufserfahrung ab. Fur jemanden mit keiner Berufs-erfahrung (exper = 0) betragt er ca. [(exp(0.04205− 2× 0.00068× 0)− 1]× 100% =4.3%. Wenn die Berufserfahrung von 5 auf 6 Jahre zunimmt erwarten wir eineErhohung des Stundenlohns um ca. 3.5% (oder genauer, [(exp(0.04205−2×0.00068×

Page 32: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 32

5)−1]×100%), bei einer Zunahme der Berufserfahrung von 20 auf 21 Jahre rechnenwir nur noch mit einer Erhohung des Lohns um ca. 1.485%. Oft ist es einfacher,solche marginale Effekte grafisch darzustellen, siehe Abbildung 2.16.

0

0.01

0.02

0.03

0.04

−0.01

−0.02

10 20 30 40 50

∂log(wage)∂exper

∂log(wage)∂exper = 0.04205− 2× 0.00068 exper

Marginaler

Effekt

exper

Abbildung 2.16: Marginaler Effekt der Berufserfahrung (exper). Mit zehn JahrenBerufserfahrung steigt der Lohn mit einem weiteren Jahr um ca.2.8% (= [exp(0.04205− 2× 0.00068× 10)− 1]× 100%).

Um zu berechnen, mit welcher Berufserfahrung der erwartete Lohn ein Maximum er-reicht, setzen wir die erste Ableitung nach exper gleich Null und losen nach expermax

expermax = −b32b4

= −0.04205

2× 0.00068≈ 30.9

Nach dieser Schatzung erreicht der Stundenlohn also bei ca. 31 Jahren Berufserfah-rung ein Maximum.11

Abbildung 2.17 zeigt den partiellen Zusammenhang zwischen log(wage) und experfur die Schatzung in Spalte (1), nachdem der lineare Einfluss von educ entfernt wurde(um die Großenordnung korrekt wiederzugeben wurden wieder die Mittelwerte derVariablen zu den Residuen addiert).

Um zu erkennen, ob der Teil der Funktion mit abnehmendem marginalen Effektrelevant ist, ist es wichtig zu uberprufen, wie viele Beobachtungen in diesen Bereichfallen. In unserer Stichprobe haben ca. 20% (1065 Personen) mehr als 31 JahreBerufserfahrung, also ist der Bereich mit abnehmende Lohnen durchaus relevant.

2.5.2 Diskriminierung und die Blinder-Oaxaca Zerlegung*

[nicht fertig . . . ]

ym = bm1 + bm2 xm2 + . . .+ bmk x

mk + em fur Manner

yw = bw1 + bw2 xw2 + . . .+ bwk x

wk + ew fur Frauen

11Die Bedingung 2. Ordnung ist selbstverstandlich erfullt, da die 2. Ableitung negativ ist.

Page 33: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 33

0 10 20 30 40 50

−2

02

46

Partial Regression Plot

residuals experience

resi

dual

s lo

g(w

age)

Abbildung 2.17: Partieller Zusammenhang zwischen log(wage) und exper (d.h.,der lineare Einfluss von educ wurde entfernt; Schatzung sieheTabelle 2.3 Spalte (1); Datenquelle: EU-SILC 2009).

Eine Eigenschaft der OLS Methode ist, dass fur Gleichungen mit Interzept die Re-gressionsgerade immer durch die Mittelwerte von y und xh (h = 1, . . . , k) lauft.

ym = bm1 + bm2 xm2 + . . .+ bmk x

mk

yw = bw1 + bw2 xw2 + . . .+ bwk x

wk

Der mittlere Unterschied ist also

ym − yw = (bm1 + bm2 xm2 + . . .+ bmk x

mk )

− (bw1 + bw2 xw2 + . . .+ bwk x

wk )

Der Unterschied der Koeffizienten zwischen Mannern und Frauen ist

∆bh = bmh − bwh woraus folgt bwh = bmh −∆bh

Wenn wir dies in die vorletzte Gleichung einsetzen und etwas umformen folgt un-mittelbar die Blinder-Oaxaca Zerlegung

ym − yw = ∆b1 +∆b2xw2 + . . .+∆bkxw

k︸ ︷︷ ︸“unerklart” (Diskriminierung etc.)

+ bm2 (xm2 − xw

2 ) + . . .+ bmk (xmk − xw

k )︸ ︷︷ ︸“erklart” (Ausstattung)

Page 34: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 34

das heißt, der Unterschied in den Mittelwerten der erklarenden Variable kann ineinen Diskriminierungseffekt (der im Unterschied der Koeffizienten ∆bh zum Aus-druck kommt) und in einen Ausstattungseffekt zerlegt werden.

Man beachte, dass fur die Messung der Diskriminierung die Differenz der Koeffizi-enten mit der durchschnittlichen Ausstattung der Frauen gewichtet wird, wahrendfur die Messung des Ausstattungseffekts die Ausstattungsunterschiede mit den Ko-effizienten der Manner gewichtet werden.

Genauso gut hatten wir statt bwh = bmh −∆bh auch bmh = bwh +∆bh verwenden konnenund waren zu folgender Zerlegung gelangt

ym − yw = ∆b1 +∆b2xm2 + . . .+∆bkxm

k

+ bw2 (xm2 − xw

2 ) + . . .+ bwk (xmk − xw

k )

Gewichtung: klassisches Indexproblem; Frauen-basierte Zerlegung

∆y = (∆x)′βm + xw′

(∆β)

Zerlegung liefert nur korrekte Ergebnisse, wenn die Lohngleichung korrekt spezifi-ziert wurde!

siehe (Berndt, 1996, 183)

2.5.3 Wachstumsregressionen

Wir wollen die Interpretation der Koeffizienten logarithmischer Modelle anhand ei-ner der meist diskutierten Fragen der Wachstumsokonomik der letzten 20 Jahreveranschaulichen, namlich, von welchen Faktoren die Wachstumsrate von Landernabhangt, und inwieweit arme Lander im Durchschnitt schneller wachsen als reicheLander (Beta-Konvergenz).

Im einfachsten Fall werden solche Fragen mit Hilfe von Regressionen auf Lander-querschnittsdaten untersucht. Konkret wird dabei die durchschnittliche Wachs-tumsrate der Lander auf eine Reihe erklarender Variablen (z.B. deren Sparquo-te, deren Einkommen im Ausgangsjahr, Bevolkerungswachstumsrate etc.) regres-siert. Solche Wachstumsregressionen stehen haufig auf dem theoretischen Funda-ment des Solow-Wachstumsmodells (fur eine Einfuhrung siehe z.B. Barro and Sala-i-Martin (2003), fur einen kurzen und kompakten Uberblick siehe z.B. Rehmehttp://tinyurl.com/cdvkqov). Nach dem Solow-Wachstumsmodell sollten Landermit hoheren Spar- und Investitionsquoten langfristig hohere Einkommensniveausaufweisen. Umgekehrt erwarten wir negative Auswirkungen des Bevolkerungswachs-tums auf das langfristige Einkommensniveau. Besonderes Augenmerk wird haufigauf den Koeffizienten des log-Einkommens einer fruheren Periode (initial income’ )gelegt, da aus diesem die ‘Konvergenzgeschwindigkeit’ berechnet werden kann, dasheißt die Geschwindigkeit, mit der sich Lander dem steady-state Einkommen nahern.Zahlreiche Untersuchungen auf Grundlage solcher Querschnitts-Schatzungen kamenzum Schluss, dass die Konvergenzgeschwindigkeit ca. zwei Prozent betragt, was im-plizieren wurde, dass der Abstand zum steady-state Einkommen in ca. 35 Jahrenhalbiert wurde.

Page 35: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 35

Wir wollen hier nicht naher auf die Theorie und deren Implikationen eingehen, son-dern lediglich einige einfache Versionen von Wachstumsregressionen schatzen, umdie Interpretation der Koeffizienten zu uben. Dazu greifen wir als Datenquelle aufdie ‘Penn World Tables’ (pwt.sas.upenn.edu) zuruck, die reale und internationalvergleichbare Daten fur derzeit 189 Lander uber den Zeitraum 1950-2010 bereitstellt.

Die Definition der verwendeten Variablen finden Sie in Tabelle 2.4. Vor jeder Analysesollte man sich zuerst einen Uberblick uber die Daten verschaffen. Weder Tabelle 2.5mit einigen deskriptive Statistiken noch Abbildung 2.18 mit den Streudiagrammender Variablen zeigen irgendwelche Auffalligkeiten.

Tabelle 2.4: Definition der Variablen fur die Wachstumsregressionen

rgdpch PPP Converted GDP Per Capita (Chain Series),at 2005 constant prices (2005 I$/person)

log(Y0) natural logarithm of rgdpch in 1970log(Y1) natural logarithm of rgdpch in 2010i% annualized discrete percentage growth rate of rgdpch

between 1970 and 2010r annualized continuous growth rate of rgdpch

between 1970 and 2010gPOP average annual population growth rate between 1970 and 2010 (%)ki investment share of PPP converted GDP per capita

at 2005 constant prices [rgdpl], value for 1970 (%)

Aus dem realen pro Kopf Einkommen im Jahr 1970 ‘Y0’ und dem realen pro KopfEinkommen im Jahr 2010 ‘Y1’ kann die durchschnittliche jahrliche prozentuelleWachstumsrate i% des pro Kopf Einkommens berechnet werden (vgl. Appendix)

i% =

[exp

(1

Tlog

[Y1

Y0

])− 1

]× 100

Alternativ kann aus den durchschnittlichen log-Differenzen eine stetige Wachstums-rate r berechnet werden

r =[log(Y1)− log(Y0)]

T=

1

Tlog

(Y1

Y0

)

Man beachte, dass r keine prozentuelle Wachstumsrate ist! Aus Abbildung 2.18 istersichtlich, dass die diskrete prozentuelle und die stetige Wachstumsrate sehr hochkorreliert sind (corr(i%, r) = 0.9999).

Tabelle 2.5: Deskriptive Statistiken zu Variablen der Wachstumsregressionen

Y0 Y1 i% r gPOP % ki

Mean 5849.467 12657.361 1.717 0.017 1.754 22.790Median 2840.244 6896.368 1.676 0.017 1.896 21.705Std.Dev 7386.831 14396.243 1.700 0.017 0.962 12.207Min 346.486 240.550 −2.730 −0.028 −0.418 2.497Max 51532.059 75588.116 7.550 0.073 4.187 66.773Obs 159 159 159 159 159 159

Page 36: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 36

i%

−0.02 0.04 0 1 2 3 4

−2

26

−0.

020.

04

r

log(Y0)

68

10

01

23

4

Pop. growth gPOP

−2 2 6 6 8 10 0 20 40 60

020

4060

Invest. share ki

Abbildung 2.18: Streudiagramme der Variablen

Vier Schatzungen von leicht unterschiedlich spezifizierten Wachstumsregressionenfinden sich in Tabelle 2.6, Seite 37. Wir stellen fest, dass alle Koeffizienten daserwartete Vorzeichen aufweisen und im statistischen Sinne signifikant von Null ver-schieden sind.

Trotzdem soll betont werden, dass derart einfache Wachstumsregressionen mit ei-nigen ernsthaften Problemen behaftet sind, auf die hier aus Platzgrunden nichtnaher eingegangen werden kann, deshalb sollte man diese Schatzergebnisse nichtunmittelbar fur bare Munze nehmen, wir verwenden sie lediglich um die korrekteInterpretation der Koeffizienten zu uben.

Um den Koeffizient α2 von Gleichung (2.4) zu interpretieren berucksichtigen wir,dass die abhangige Variable nicht logarithmiert wurde und in Prozent gemessenwurde; die erklarende Variable log(Y0) ist logarithmisch, es handelt sich also in Be-zug auf diese Variable um ein lin-log Modell. Deshalb vermuten wir, dass ein um einProzent hoheres pro Kopf Einkommen im Jahr 1970 ceteris paribus eine um α2/100Prozentpunkte hoheres/niedrigeres Wachstum des pro Kopf Einkommens erwartenlasst. Tabelle 2.6 entnehmen wir α2/100 ≈ −0.0041485, das heißt, ein um ein Pro-zent hoheres pro Kopf Einkommens im Jahr 1970 geht ceteris paribus mit einer umca. 0.004 Prozentpunkte niedrigeren Wachstumsrate einher. Die restlichen erklaren-den Variablen sind nicht logarithmisch, deshalb sind sie wie ublich in absolutenEinheiten zu interpretieren.

Eine um einen Prozentpunkt hohere Bevolkerungswachstumsrate (gPOP) geht cete-

Page 37: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 37

Tabelle 2.6: OLS Wachstumsregressionen

i% = α1 + α2 log(Y0) + α3 gPOP + α4 ki + e (2.4)

i% = β1 + β2 log(Y0) + β3 gPOP + β4 log(ki) + e (2.5)

r = γ1 + γ2 log(Y0) + γ3 gPOP + γ4 ki + e (2.6)

log(Y1) = δ1 + δ2 log(Y0) + δ3 gPOP + δ4 ki + e (2.7)

(2.4) (2.5) (2.6) (2.7)i % i % r log(Y1)

Constant 5.92506∗∗∗ 5.38851∗∗∗ 0.05780∗∗∗ 2.36970∗∗∗

(1.11329) (1.19493) (0.01090) (0.44681)log(Y0) −0.41485∗∗∗ −0.42998∗∗∗ −0.00402∗∗∗ 0.83526∗∗∗

(0.11921) (0.12178) (0.00117) (0.04784)gPOP −0.85639∗∗∗ −0.84725∗∗∗ −0.00842∗∗∗ −0.34518∗∗∗

(0.14432) (0.14620) (0.00141) (0.05792)ki 0.02713∗∗ 0.00027∗∗ 0.01089∗∗

(0.01000) (0.00010) (0.00401)log(ki) 0.42628∗

(0.19933)

R-squared 0.22505 0.21150 0.22620 0.80156N 159 159 159 159

ris paribus mit einer um α3 ≈ 0.856 Prozentpunkte niedrigeren Wachstumsrate despro Kopf Einkommens einher, und analog, ein im Jahr 1970 um ein Prozentpunkthoherer Investitionsanteil lasst eine um α4 ≈ 0.027 Prozentpunkte hohere Wachs-tumsrate des pro Kopf Einkommens erwarten. Da es sich jeweils um Prozentpunktehandelt sind diese Koeffizienten keine Elastizitaten!

Gleichung (2.5) (Spalte 2 in Tabelle 2.6) unterscheidet sich von der vorhin disku-tierten Regressionsgleichung nur darin, dass auch der Investitionsanteil 1970 loga-rithmiert wurde. Die Interpretation der Koeffizienten β2 und β3 lauft analog zumvorhergehenden Beispiel. Bezuglich des Koeffizienten β4 von log(ki) handelt es sichum ein lin-log Modell, deshalb lasst ein um ein Prozent hoherer Investitionsanteilim Jahr 1970 eine um β4/100 ≈ 0.00426 Prozentpunkte hohere Wachstumsrate er-warten. Man beachte, dass das R2 dieser zweiten Schatzung etwas kleiner ist als beider ersten Schatzung und dass die Signifikanz des Koeffizienten etwas geringer ist,deshalb wurde man vermutlich die erste Spezifikation (2.4) bevorzugen.

In Gleichung (2.6) (Spalte 3 in Tabelle 2.6) misst die erklarende Variable die durch-schnittliche relative Anderung des pro Kopf Einkommens r = [log(Y1− log(Y0)]/T ,das heißt, sie wurde im Unterschied zu i% nicht mit exp(r)−1 in eine diskrete Ande-rung umgerechnet und nicht mit 100 multipliziert um eine prozentuelle Anderungzu erhalten. Die erklarenden Variablen unterscheiden sich nicht von denen in Glei-chung (2.4). Da der Unterschied zwischen stetigen und diskreten Anderungsratenin diesem Fall nicht sehr groß ist (corr(i%, r) = 0.9999) liegt der Hauptunterschiedzwischen Gleichung (2.6) und Gleichung (2.4) hauptsachlich darin, dass i% eine pro-zentuelle Wachstumsrate ist und r eine relative Anderung misst. Deshalb handelt es

Page 38: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 38

sich im wesentlichen um eine unterschiedliche Skalierung der abhangigen Variablen,man muss lediglich die Koeffizienten mit 100 multiplizieren um wieder die gleicheInterpretation wie fur die erste Regression (2.4) zu erhalten, mit dem fur prakti-sche Belange haufig unbedeutenden Unterschied, dass sich Regression (2.4) auf einediskrete und Regression (2.6) auf eine stetige Wachstumsrate bezieht.

Bei der vierten Regression (2.7) ist die erklarende Variable das logarithmierte proKopf Einkommen im Jahr 2010, deshalb kann der Koeffizient δ2 von log(Y0) als Ela-stizitat interpretiert werden; ein um ein Prozent hoheres Einkommen im Jahr 1970lasst ceteris paribus ein um 0.835 Prozent hoheres Einkommen im Jahr 2010 erwar-ten. Bezuglich der beiden anderen erklarenden Variablen handelt es sich um ein log-lin Modell, das heißt, eine um einen Prozentpunkt großere Bevolkerungswachstums-rate lasst fur das Jahr 2010 ceteris paribus ein um ca. 29.2% niedrigeres pro KopfEinkommen erwarten, da [exp(δ3)− 1]× 100 = exp(−0.3452)− 1]× 100 ≈ −29.2%.Dies mag auf den ersten Blick riesig erscheinen, vor allem verglichen mit der fruherenauf Regression (2.4) basierenden Aussage, dass eine um einen Prozentpunkt hohe-re Bevolkerungswachstumsrate ceteris paribus mit einer um 0.8564 Prozentpunkteniedrigeren Wachstumsrate des pro Kopf Einkommens einhergeht. Wie man aberanhand der in Tabelle 2.5 wiedergegebenen deskriptiven Statistiken einfach kontrol-lieren kann fuhrt dies fast zum selben Resultat, denn wenn Y0 = 5850 uber 41 Jahremit der durchschnittlichen Wachstumsrate i% = 1.717% wachst erhalten wir einenWert von ca. 11756, wenn die Wachstumsrate nur (1.717 − 0.8564)% ≈ 0.86% be-tragt erhalten wir einen Wert von 8312.7, also einen um ca. 29% niedrigeren Betrag!Die beiden Spezifikationen (2.4) und (2.7) fuhren also zu durchaus vergleichbarenErgebnissen!

Auch bezuglich der Investitionsquote ki handelt es sich um ein log-lin Modell, des-halb folgern wir aus δ4 ≈ 0.01089, dass eine im Jahr 1970 um einen Prozentpunkthohere Investitionsquote ceteris paribus fur das Jahr 2010 ein um 1.089 Prozenthoheres pro Kopf Einkommen erwarten lasst.

Man beachte, dass es sich bei den Wachstumsregressionen (2.6) und (2.7) lediglichum unterschiedliche Parametrisierungen handelt, denn

r :=1

T[log(Y 1)− log(Y 0)] = γ1 + γ2 log(Y0) + γ3 gPOP + γ4 ki + e

kann einfach umgeschrieben werden zu

log(Y 1) = T γ1 + (T γ2 + 1) log(Y0) + T γ3 gPOP + T γ4 ki + Te

deshalb geben Gleichungen (2.6) und (2.7) exakt die gleiche Information wieder,Gleichung (2.7) kann auch ohne Schatzung aus Gleichung (2.6) berechnet werden!Zum Beispiel gilt fur die Koeffizienten von log(Y0) in Spalte (2.6) und (2.7) ausTabelle 2.6 −0.00402×41+1 = 0.8352 (eine kleine Differenz ist auf Rundungsfehlerzuruckzufuhren), analoges gilt fur alle andern Koeffizienten.

Dies gibt uns auch ein nettes Beispiel fur die Interpretation des BestimmtheitsmassesR2. Obwohl es sich bei den beiden Gleichungen (2.6) und (2.7) lediglich um unter-schiedliche Parametrisierungen handelt gaukelt uns das R2 von Gleichung (2.7) miteinem Wert von 0.80 einen deutlich besseren Fit vor als das R2 von Gleichung (2.6)mit einem Wert von lediglich 0.22. In diesem Fall ist klar, dass sich die Qualitat

Page 39: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 39

der beiden Schatzungen nicht unterscheidet, das großere R2 der zweiten Regressionsollte uns also nicht zum Irrglauben verleiten, dass die zweite Regression in irgend-einer Form ‘besser’ sei. Wir haben mehrfach betont, dass das Bestimmtheitsmaßnur dann zum Vergleich zweier Regressionen herangezogen werden darf, wenn beideRegressionen die gleiche abhangige Variable und die gleiche Anzahl von Regressorenaufweisen!

2.A Appendix

2.A.1 Berechnung von durchschnittlichen Wachstumsraten

Durchschnittliche Wachstumsraten spielen in vielen Bereichen der Wirtschaftswis-senschaften eine wichtige Rolle, deshalb wiederholen wir hier einige zentrale Konzep-te. Die Wachstumsraten hauptsachlich auf Zeitreihen angewandt werden verwendenwir t als Beobachtungsindex, mit t = 0, 1, 2, . . . , T .

Diskrete Wachstumsraten (i)

Unter der diskreten Wachstumsrate verstehen wir die relative Anderung einer Großezwischen zwei Perioden

i =yt − yt−1

yt−1=

∆ytyt−1

=ytyt−1

− 1

Der Quotient yt/yt−1 wird auch als Wachstumsfaktor bezeichnet.

Wenn eine Variable y mit einer konstanten diskreten Wachstumsrate i wachst nimmtsie in jeder Periode um iyt−1 Einheiten zu. Fur t = 1, 2, . . . , T

y1 = y0 + iy0 = y0(1 + i)

y2 = y1(1 + i) = y0(1 + i)(1 + i) = y0(1 + i)2

...

yT = y0(1 + i)T

Sollte die durchschnittliche Wachstumsrate zwischen den Perioden 0 und T berech-net werden, so darf dazu nicht das arithmetische Mittel herangezogen werden!

Man kann sich einfach fragen, welche Wachstumsrate i fuhrt vom Wert y0 zu yt.Dazu logarithmieren wir yT = y0(1 + i)T und losen nach i

ln yT = ln y0 + T ln(1 + i)1

T(ln yT − ln y0) = ln(1 + i)

exp

(1

T(∆ ln y)

)= 1 + i

i = exp

(1

Tln

[yTy0

])− 1

Page 40: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 40

T bezeichnet dabei die Anzahl der Perioden; sollte z.B. die durchschnittliche Wachs-tumsrate des BIP von 2005 – 2010 berechnet werden, und wird darunter die Periodevom 1.1.2005 – 31.12.2010 verstanden, also T = 6.

Um eine prozentuelle Wachstumsrate zu erhalten muss i mit 100 multipliziert wer-den.

Beispiel: Angenommen ein Wert hat zwischen 1990 und 2012 von 500 auf 2000zugenommen, wie groß ist die durchschnittliche jahrliche Wachstumsrate?

i = exp

(1

23ln

[2000

500

])= 0.062127177

die diskrete prozentuelle Wachstumsrate betragt also ca. 6.2%. Wir konnen dieseinfach uberprufen

500(1 + 0.062127177)23 = 2000

Stetiges Wachstum (r)

Der enge Zusammenhang zwischen Wachstumsraten und der Exponentialfunktion(bzw. dem Logarithmus) wird sofort klar, wenn man mehrere Verzinsungen proPeriode zulasst, und die Anzahl der Verzinsungen pro Periode gegen Unendlich gehenlasst.

Wenn die Verzinsung m Mal pro Periode erfolgt

yt = y0

(1 +

r

m

)mt

= y0

[(1 +

r

m

)m/r]rt

= y0

[(1 +

1

w

)w]rtmit w :=

m

r

Wir erinnern uns, dass die Eulersche Zahl als Grenzwert einer Folge dargestelltwerden kann

limm→∞

(1 +

1

w

)w

= e ≈ 2.7182819

da m → ∞ impliziert w → ∞.

Alsoyt = y0 e

rt := y0 exp(rt)

Man beachte, dass in yt = y0(1 + r/m)mt die Zeit noch eine diskrete Variable ist,erst durch die Grenzwertbildung wird die Zeit zu einer stetigen Variable. Außerdemwird hier r als konstant angenommen, aber naturlich mussen tatsachliche Wachs-tumsraten nicht immer konstant sein.

Mit einer stetigen Wachstumsrate kann die Veranderung uber die Zeit einfach alsAbleitung nach der Zeit berechnet werden

dytdt

=d(y0e

rt)

dt= ry0e

rt

Page 41: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 41

Die relative Anderung ist deshalb

dytdt

yt=

ry0ert

y0ert= r

Fur sehr kurze Zeitperioden konvergiert die diskrete Wachstumsrate i gegen diestetige Wachstumsrate r

lim∆t→0

i = lim∆t→0

{yt+∆t − yt

∆t·1

yt

}

=dy

dt

1

y= r

Wenn eine Variable y exponentiell mit konstanter Wachstumsrate r wachst gilt yt =y0e

rt, bzw. ln yt = ln y0 + rt. Daraus folgt durch Umschreiben

r =ln yt − ln y0

t=

∆ ln y

t

Daraus folgt, dass die stetige Wachstumsrate zwischen zwei aneinandergrenzendenPerioden, d.h. wenn ∆t = 1, einfach die logarithmische Differenz ist rt,t+1 = ∆ ln yt.

Ebenso ist aus ln yt = ln y0 + rt auch einfach ersichtlich, dass

d ln ytdt

= r

wenn y0 konstant ist.

Diese Zusammenhange werden in der empirischen Wirtschaftsforschung ausgiebiggenutzt, auch weil bei ‘kleinen’ Wachstumsraten (z.B. r < 0.05) die stetigen Wachs-tumsraten eine gute Annaherung an die diskreten Wachstumsraten darstellen.

Umrechnen zwischen stetigen und diskreten Wachstumsraten

Da zu jedem Zeitpunkt fur eine beliebige diskrete Wachstumsrate i genau eine stetigeWachstumsrate r existiert, die zum gleichen Betrag yt fuhrt, kann einfach zwischendiskreten und stetigen Wachstumsraten umgerechnet werden

y0(1 + i)t = y0 exp(rt)

folgt ln y0 + t ln(1 + i) = ln y0 + rt bzw.

r = ln(1 + i) bzw. i = exp(r)− 1

Wir haben vorhin gezeigt, dass die stetige Wachstumsrate zwischen zwei Periodenals logarithmische Differenz berechnet werden kann r = ∆ ln y/t. Wenn man diesein eine diskrete Wachstumsrate umrechnet erhalt man wieder i = exp (∆ ln y) /t−1.

Die prozentuellen Wachstumsraten erhalt man wie ublich, indem man diese Wachs-tumsraten mit 100 multipliziert.

Page 42: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 42

Beispiel: Eine Regression des osterreichischen BIPs (verkettete Volumenindizes,2005 = 100, Statistik Austria12) auf den Trend liefert folgendes Ergebnis

@LOG(BIP) = 3.949333 + 0.022791 @TREND(0.005735) (0.000299)

R2 = 0.994532, s = 0.017091, F -Stat = 5819.7113, DW = 0.998612,N = 34 (1976 – 2009, Standardfehler in Klammern)

Das folgende kleine EViews Programm berechnet die diversen Wachstumsraten furdie Periode 1976 – 2009 (34 Perioden).

wfcreate(wf=BIPAUT) a 1976 2009

read(t=xls,c7) VGR.xls BIP

table(2,3) WR

WR(1,1) = "durchschnittl. stetige Wachstumsrate"

WR(1,2) = 1/34*( log(@last(BIP)) - @log(@first(BIP)) )*100

WR(2,1) = "durchschnittl. diskrete Wachstumsrate"

WR(2,2) = (@exp(1/34*( log(@last(BIP)) - @log(@first(BIP)) )) - 1)*100

WR(3,1) = "durchschnittl. diskrete Wachstumsrate, OLS"

equation eqlog.ls @log(BIP) c @trend

WR(3,2) = (@exp(eqlog.@coefs(2)) - 1)*100

show WR

durchschnittl. stetige Wachstumsrate (%) r = 1/t(ln yt − ln y0)100 = 2.0961durchschnittl. diskrete Wachstumsrate (%) i = (exp(r)− 1)100 = 2.1182durchschnittl. diskrete Wachstumsr., OLS (%) i∗ = (exp(b2)− 1)100 = 2.3053

Wie man auch aus Abbildung 2.19 ersehen kann ist aufgrund des Einbruchs 2009 diedurchschnittliche Wachstumsrate, die nur Ausgangs- und Endperiode berucksichtigt,kleiner als die mittels OLS berechnete durchschnittliche Wachstumsrate, die allePerioden berucksichtigt.

Literaturverzeichnis

Balli, H. and Sørensen, B. (2012), ‘Interaction effects in econometrics’, EmpiricalEconomics pp. 1–21.URL: http://dx.doi.org/10.1007/s00181-012-0604-2

Barro, R. J. and Sala-i-Martin, X. I. (2003), Economic Growth, 2nd edn, The MITPress.

Berndt, E. R. (1996), The Practice of Econometrics: Classic and Contemporary,Addison Wesley.

Brambor, T., Clark, W. R. and Golder, M. (2006), ‘Understanding interaction mo-dels: Improving empirical analyses’, Political Analysis 14(1), pp. 63–82.URL: http://www.jstor.org/stable/25791835

12http://www.statistik.at/web_de/static/volkswirtschaftliche_gesamtrechnung_hauptgroessen_019505.xls, 09.05.2010

Page 43: Kapitel 2 Nichtlineare Funktionsformen - uibk.ac.at · PDF filefunktion yt = y0ert, wobei e = 2.718281828459... die Eulersche Zahl1 und r die stetige Wachstumsrate bezeichnet (siehe

Angewandte Okonometrie 43

3.9

4.0

4.1

4.2

4.3

4.4

4.5

4.6

4.7

4.8

40

50

60

70

80

90

100

110

120

130

1980 1985 1990 1995 2000 2005

LOG(BIP) BIP

BIP Austria

log(B

IP)

BIP

Abbildung 2.19: Die Entwicklung des osterreichischen BIPs (1976 – 2009); linkeSkala logarithmisch, rechte Skala linear.

Burnside, C. and Dollar, D. (2000), ‘Aid, policies, and growth’, American EconomicReview 90(4), 847–868.

Cobb, C. W. and Douglas, P. H. (1928), ‘A theory of production’, The AmericanEconomic Review 18(1), pp. 139–165.URL: http://www.jstor.org/stable/1811556

Heckman, J. J., Lochner, L. J. and Todd, P. E. (2003), Fifty years of mincer earningsregressions, Working Paper 9732, National Bureau of Economic Research.URL: http://www.nber.org/papers/w9732

Mincer, J. (1974), Schooling, Experience, and Earnings (Human Behavior and SocialInstitutions No. 2), 1st edn, Natonal Bureau of Economic Research.

Wooldridge, J. (2005), Introductory Econometrics: A Modern Approach, 3 edn,South-Western College Pub.

Wooldridge, J. M. (2012), Introductory Econometrics: A Modern Approach, 5 edn,South-Western College Pub.