(1) (1) 3. zur kritik an der herkömmlichen schätzmethodik im rahmen der univariaten...

((11) )

3. Zur Kritik an der herkömmlichen Schätzmethodik im Rahmen der univariaten Regressionsanalyse

Die Methodik der empirischen Makroökonomie ist seit Mitte der siebziger Jahre in die Kritik geraten;

Siehe z.B.

Summers, L.H., 1991 The Scientific Illusion in Empirical Macroeconomics,Scandinavian Journal of Economics, 93, S. 129-148.

Woran macht sich die methodische Kritik fest?

Welche Alternativen werden vorgeschlagen?

((22) )

3.1 Die Kritik von Leamer (1)

Leamer's Beispiel einer (makabren) Regressionsanalyse

Abh. Variable: begangene Morde pro 100.000 Einwohner

Erklärende Variablen:

(i) „Abschreckungsvariablen“:

Aufklärungsquote

Exekutionswahrscheinlichkeit bei Verurteilung

mittlere Strafe für Mord (in Jahren)

(ii) ökonomische Variablen:

mittleres Familieneinkommen

Prozentanteil der Familien unterhalb der Armutsgrenze

Arbeitslosenquote

((33) )

Die Kritik von Leamer (2)

(iii) Variablen des soziale Umfelds:• Prozentanteil Nicht-Weiße• Prozentanteil Jugendliche• städtisches Umfeld (Dummy-Variablen)• „Südstaaten“-Dummy

((44) )

Die Kritik von Leamer (3)

Die Regressionsanalyse wird mit einer Reihe von alternativen Spezifikationen, die sich durch den jeweils verwendeten Set von Regressoren unterscheiden;

Ergebnis der Analyse: der „Abschreckungseffekt“ von Exekutionen liegt – je nach Spezifikation – zwischen

–28 und + 12 (Morde pro 100.000 Einwohner)

Schlussfolgerung von Leamer: die Ergebnisse der Regressionsanalyse hängen zu stark von der gewählten Spezifikation ab, sie sind „fragil“;

weiterhin: das Vorurteil des Forschers könnte einen Einfluss auf die Ergebnisse haben ...

((55) )

Die Kritik von Leamer (4)Welche Konsequenzen folgen aus der kritischen

Analyse?

Leamer schlägt vor, dass ein gewissenhafter Ökonometriker immer die Spannbreite angibt, innerhalb derer die geschätzten Koeffizienten bei unterschiedlichen Spezifikationen liegen;

falls sich herausstellt, dass diese Spannbreite sogar einen Wechsel im Vorzeichen der Koeffizienten umfasst (wie im vorliegenden Beispiel), so muss der Ehrlichkeit halber gesagt werden, dass offensichtlich die Qualität bzw. der Umfang der Daten keine gesicherte Aussage zulässt;

((66) )

Die Kritik von Leamer (5)Gegenkritik an Leamer

Leamer‘s Forderung (Publikationen von Spannbreiten) geht implizit davon aus, dass alle Spezifikationen „gleich gut“ sind.

Dies ist jedoch nicht der Fall: in aller Regel kann der Anwender zwischen den verschiedenen Spezifikationen anhand objektiver Testkriterien diskriminieren.

Es mag jedoch auch dann noch eine Spannbreite der Ergebnisse von Schätzungen geben, die auf Grundlage der durchgeführten Tests annähernd „gleich gut“ sind.

((77) )

3.2 Zur Kritik des probabilistischen Ansatzes (1)

Probabilistischer Ansatz (Haavelmo, Econometrica 1944): „The probabilistic approach in econometrics“

Stoßrichtung: gegen reinen Empirismus.

Dieser lässt sich wie folgt karikieren:„Ein hohes R2 auf der Suche nach einer Interpretation...“

(Desai)

„Sherlock Holmes Ansatz“: It‘s a capital mistake to theorize before you have all evidence“ (Leamer)

((88) )

3.2 Zur Kritik des probabilistischen Ansatzes (2)

Kernthese von Haavelmo:

„Schlussfolgerungen aus einer Stichprobe von Beobachtungen müssen im Rahmen eines vorspezifizierten stochastischen Modells erfolgen, von dem angenommen wird, dass es die Erzeugung von Daten adäquat beschreibt.“

((99) )

Zur Kritik des probabilistischen Ansatzes (3)

Die Vorstellung hinter dem probabilistischen Ansatz: die Relation wird durch einen stochastischen Störterm

ergänzt; aus den Ergebnissen der Schätzung werden die

„strukturellen“ Parameter des zugrunde liegenden theoretischen Modells erschlossen; (Voraussetzung dafür ist, dass sich die strukturellen Parameter identifizieren lassen)

Theorie liefert auf eindeutige Weise eine zu schätzende Relation; (gegebenenfalls ist zur Verwendung als Schätzansatz eine Transformation wie z.B. eine Linearisierung notwendig)

((1010) )

Haavelmo schwebt offenbar die Vorgehensweise der Naturwissenschaft vor,

aber: „... in real statistic analysis there are no

‚true models‘“ (Durbin 1988) „no laws in economics...“ (Kalman)

konkrete Probleme: u.U. fehlende Identifizierbarkeit (alternative

Modelle sind beobachtungsäquivalent) Strukturbrüche (Parameter sind keine

Naturkonstanten) partieller Charakter jedes ökonomischen Modells


((1111) )


Der Haavelmo-Ansatz wendet sich gegen den unkritischen Empirismus, er hat eine idealtypische Verbindung von Theorie und Empirie vor Augen.

Es ist jedoch fraglich, ob diejenigen, die sich auf den Ansatz berufen haben, diesen Anspruch tatsächlich eingehalten haben.

Kritische Fragen in diesem Zusammenhang: Wurde der Haavelmo-Ansatz missbraucht? Trägt er grundsätzliche Schwächen in sich? Wurde die Rolle, die die Theorie spielen kann,

überschätzt? Ist diese in der Lage, eine eindeutige Grundlage für die empirische Untersuchung zu liefern?

((1212) )

3.3 Die Lucas-Kritik

Ein grundsätzliches Problem einer Schätzung betrifft die unterstellte strukturelle Invarianz einer Schätzbeziehung; da ökonomische Beziehungen nicht den Status von Naturgesetzen haben, können sie sich im Zeitablauf verändern; sofern sich eine solche Veränderung abrupt vollzieht, spricht man von einem Strukturbruch; dieser kann durch Strukturbruchtests überprüft wird (sofern der Zeitpunkt der Veränderung a-priori bekannt ist: z.B. durch einen Chow-F-Test);

Lucas (1976) hat aber noch ein tiefergehendes Problem aufgezeigt: Schätzbeziehungen können sich u.U. nicht nur durch äußere Ereignisse, sondern auch aufgrund ökonomischer Modellzusammenhänge (modellendogen) verändern!

((1313) )

Die Lucas-Kritik (2)

Die Lucas-Kritik kommt insbesondere dann ins Spiel, wenn das Modell Verhaltenssteuerung durch Erwartungsbildung impliziert.

Beispiel: Es sei unterstellt, dass über einen längeren Zeitraum eine

Politik eines konstanten Geldmengenwachstums von m =5% bei einem realen Wachstum der Wirtschaft von Ŷ= 2% betrieben worden sei; die Inflationserwartungen Erwartungen haben sich demzufolge auf eine Höhe von

e = m – Ŷ = 3% eingestellt. Mit Daten für diesen Zeitraum wird nun ökonometrisch eine

Phillipskurve geschätzt, d.h. ein Zusammenhang zwischen Arbeitslosigkeit und Inflation.

((1414) )

Die Lucas-Kritik (3)Fortsetzung des Beispiels: Aus der makroökonomischen Theorie ist bekannt, dass die

Lage der Phillipskurve von den Inflationserwartungen abhängig ist; d.h. der Lageparameter der Kurve ist nur solange stabil, wie die Inflationserwartungen konstant sind;

falls nun die ökonometrisch bestimmte Phillipskurve als wirtschaftspolitische trade-off-Beziehung verstanden wird und die Politik die Beziehung ausnützen möchte (z.B. eine Reduktion der Arbeitslosigkeit durch expansive Politik anstrebt), verändern sich die Inflationserwartungen;

damit wird der trade-off instabil, die Wirkung der Politik-maßnahme wird nicht mehr durch die ursprüngliche Schätzrelation beschrieben; aufgrund der modellendogenen Veränderungen kommt es damit zu einer Fehlprognose der Politikwirkungen.

((1515) )


Fortsetzung des Beispiels: Die Lucas-Kritik ist also insbesondere dann relevant, wenn

Schätzergebnisse als Grundlage wirtschaftspolitischer Eingriffe dienen und Wirtschaftssubjekte rationale Erwartungen bilden; dies kann dazu führen, dass sich durch die politische Intervention die Parameter der ökonomischen Relation verändern;man könnte von einer durch Politikmaßnahmen verursachten endogenen Instabilität der Parameter eines Modells sprechen.

((1616) )


Konsequenzen Die Lucas-Kritik hat weit gehende Konsequenzen:

Selbst wenn das Modell korrekt spezifiziert ist und die Parameter im Beobachtungszeitraum stabil waren, kann sich die Modellstruktur verändern, sobald wirtschaftspolitische Eingriffe erfolgen;

damit wäre der Nutzen ökonometrischer Modelle für die Politikberatung fundamental infrage gestellt.

Für die empirische Methodik entsteht das Problem, Tests zu entwickeln, die die Stabilität des Modells bei Politikänderungen überprüfen.

((1717) )

3.4 Die Kritik von Hendry (data mining) (1)

Worauf zielt der Vorwurf des data mining im Sinne von Hendry?

Kritik an folgendem „typischen“ Vorgehen: Gegeben sei eine abhängige Variable (z.B. Konsum); gegeben sei ferner eine Menge von Variablen, die als

Regressoren in Frage kommen (z.B. das verfügbare Einkommen, Vermögen, Altersstruktur, Zinssätze, Konsumklima)

((1818) )

Die Kritik von Hendry (data mining) (2)

Es existieren dann sehr viele Variationsmöglichkeiten für den Schätzansatz, z.B. durch Veränderung der Spezifikation der

Schätzgleichung (z.B. Auswahl der Regressoren, der funktionalen Form, der Modellierung der Anpassungsprozesse)

durch Wahl des Beobachtungszeitraums durch Wahl der konkreten Daten (z.B. Auswahl

alternativer Zinssätze)Viele Varianten der Schätzgleichung können ohne

großen Aufwand berechnet werden (und werden es in der Regel auch); dadurch kann meist eine große Spannbreite von Ergebnissen generiert werden.

((1919) )


Der Suchprozess wird solange fortgesetzt, bis eine „befriedigende Variante“ gefunden ist,

d.h. der Forscher versucht eine Variante zu finden, in der Vorzeichen und Größenordnung der

Parameter den theoretischen Erwartungen (oder dem Vorurteil) entsprechen

und in der statistisch/ ökonometrische Kriterien

erfüllt, z.B. auf ein hohes R2, signifikante t-Statistiken, keine Autokorrelation etc.

Dieses Vorgehen mag auf den ersten Blick vernünftig erscheinen, ist jedoch sehr methodologisch außerordentlich problematisch!

((2020) )


Es besteht die Gefahr, dass das Ergebnis der Analyse sehr stark durch die subjektive Vormeinung der Forscher bestimmt wird.

Damit wird ein wesentliches Prinzip des wissenschaftlichen Vorgehens verletzt: die Objektivität bzw. die zu fordernde Unvoreingenommenheit gegenüber dem Ergebnis der Analyse.

Hendry karikiert dieses Vorgehen wie folgt:

„Die Daten werden solange gefoltert, bis sie gestehen.“ („If you torture the data long enough, nature will confess.“)

Er begründet seine Kritik am data mining mit Lovell´s Bias ...

((2121) )

Die Kritik von Hendry (Lovell‘s Bias) (5)Betrachtet wird ein Experiment, in dem voneinander

unabhängige Zufallszahlen aufeinander regressiert werden;

Modell1:

0 1 1

1

Bei einem -Fehler von 0.05 kann erwartet werden, dass

ˆin 5 von 100 Versuchen der geschätzte Koeffizient als

auf dem 5-Prozent-Niveau signifikant von Null verschieden

ausgewiesen wird

t t ty x

, obwohl der wahre Koeffizient Null ist.

Unterstellen wir nun, der Forscher sei an signifikanten

Ergebnissen interessiert. Angenommen, es stünden

voneinander unabhängige (zueinander orthogonale)

Regr

n

essoren zur Verfügung.

((2222) )

-

Die Wahrscheinlichkeit, nach Versuchen "Erfolge" zu

haben, bestimmt sich nach der Binomial-Verteilung:

( ) = (1 - )

mit als Erfolgswahrscheinlichkeit, also .

Die Wahrscheinlic

k n k

n k

nP Z k p p

k

p p

0 10 10

hkeit, bei =10 Versuchen

signifikanten Koeffizienten zu erhalten, beträgt:

10 ( 0) = 0.05 (0.95) 0.95 = 0.5987

0

n

P Z

keinen

Die Kritik von Hendry (Lovell‘s Bias) (6)

((2323) )

Im Umkehrschluss:

Bereits bei 10 Versuchen gibt es eine Wahrscheinlichkeit

von mehr als 40 Prozent, mindestens einen "signifikanten"

Zusammenhang zwischen einer reinen Zufallsvariablen und

zu findenty .

Der tatsächliche Fehler erster Art beträgt

somit = 1 0.5987 = 0.4013

und nicht 0.05, wie vorgespiegelt wird.

Die Diskrepanz zwischen dem vorgeblichen und tatsächlichen

Fehler erster Art nennt m

an (Lovell 1983).Lovell's bias


((2424) )

0 1 1 2 2

1 2

Lovell's bias ist im Fall einer multiplen Regression weniger

wahrscheinlich, dennoch nicht zu vernachlässigen:

die Wahrscheinlichkeit, dass

"sig

t t t ty x x

Modell 2 :

sowohl als auch

1 2

1 2

100

nifikant von Null" sind, beträgt:

ˆ ˆP( signifik.) P( signifik.)=

ˆ ˆ1 P( nicht signifik.) 1 P( nicht signifik.)

Wk. bei einmaliger Versuch: 0.05 0.05 0.0025

Wk. bei 100 Versuchen: (1 0.0025) 0.77

86

Auch wenn die W'keit, keinen Doppelerfolg zu erzielen,

auf 0.7786 gesunken ist, ist in etwa 22% der Fälle, in denen aus

100 Versuchen ausgewählt wird, mindestens eine Schätzung

mit zwei scheinbar s

ignifikanten Koeffizienten dabei.


((2525) )

/

Wenn Regressoren aus Kandidaten ausgesucht werden

und ein nominelles Signifikanzniveau gewählt wurde, so

beträgt das nur mehr

= 1 (1

tatsächliche Signifikanzni

)

oder approximati :

veau

v

c k

k c

c=10; k=2; 0.05

0

Bei

.25

spiel

=

:

25%

ck


((2626) )

0

Bei Auswahl aus unabhängigen Zufallsvariablen beträgt

die Wahrscheinlichkeit für das Ergebnis

auf dem 5%-Niveau signifikanter Koeffizient:

( 0) = 0.05 (1 - 0.05) (1 - 0.05)0

c c

c

cP Z

kein

genau

1 1 1

auf dem 5%-Niveau signifikanter Koeffizient:

( 1) = 0.05 (1 - 0.05) 0.05 (1 - 0.05)1

auf dem 5%-Niveau signifikante

Koeffizienten:

( 1) 1 ( 0) ( 1)

c ccP Z c

P Z P Z P Z

ein

mindestens zwei


((2727) )

Experiment für Modell 2: Auswahl von 2 Regressoren aus c unabhängigen Zufallsvariablen

SignifikanteKoeffizienten

Wahrscheinlichkeit bei Auswahl aus c Kandidaten

2 5 10 20 100

0 0.903 0,774 0,599 0,358 0,006

1 0.095 0,204 0,315 0,377 0,031

mind. 2 0.0025 0.023 0.086 0.264 0.962

5% 12% 22,6% 40,1% 92,3%


Berechnung

(1) (1) 3. zur kritik an der herkömmlichen schätzmethodik im rahmen der univariaten...

Documents