Methoden derPsychologie
Multivariate Analysemethodenund
Multivariates Testen
Günter MeinhardtJohannes Gutenberg Universität Mainz
18.07.2007 & 25.06.2007
Methoden derPsychologie
Allgemeines • Nach der Overall-Signifikanz die Ergebnisse der Wirkungsweise explorieren.
• Trends sind definierbar, wenn die Stufen der UVs metrische Levels (Dosen, Zeiten, Anzahlen) repräsentieren, nicht jedoch bei kategorialen UVs.
• Einfach zu interpretieren sind orthogonale Trendpolynome.
• Jede Ordnung des Polynoms liefert eine orthogonale Trendkompo- nente, dessen Varianzanteil getrennt bestimmt und getest werden kann.
• Ermöglicht Prognose des Erreichens von Kriterien.
Trendtests in ANOVA und rm ANOVA
• Signifikanz des Faktors, unter dem Trends vermutet werden.
• In rm Designs die üblichen Voraussetzungen der rm ANOVA (paarweise homogene Varianz-Covarianzmatrizen (streng), bzw. Homogene Varianzen der Abweichungen von Zellen (Spherizität), Normalverteilung).
Voraussetzung
Univariates Testen ANOVA & rm ANOVA
Methoden derPsychologie
Beispiel
• Ein Dosierungsfaktor mit k- Stufen, k > 5 oder Messwiederholungen über mind. 5 Zeitpunkte
• monoton steigender oder fallender Gesamtverlauf
• Strategie: 1. Absichern des Trends 2. Mit gezielten Einzelvergleichen Effekt gegen Baseline absichern 3. Superposition der signifikanten Trendkomponenten zur Trendberechnung und Kriteriumsvorhersage verwenden
PrototypischeDatensituation
Univariates Testen Trendtests
0
4
8
12
16
20
0 pm 0.2 pm 0.4 pm 0.6 pm 0.8 pm 1.0 pm
Alkohohl-Dosis
An
zah
l F
ahrf
ehle
rquadratisch
linear
Mittelwerte mit Konfidenzintervallen
Methoden derPsychologie
Trendpolynom
• Lineares Polynom: Anpassungsgerade
• Ein quadratisches Polynom beschreibt monotones nichtlineares Wachstum oder Abfallen der Werte
• Ein kubisches Polynom kann auch Änderungen im Verlauf der Kurve beschreiben
Übliche Polynome
Univariates Testen Trendtests
2 3 10 1 2 3 1
kkX b b t b t b t b t
für einen Dosisfaktor mit k- Stufen beschreibt die Daten perfekt, wennalle Komponenten bis k-1 eingehen.
0
1
22
33
abhängige Variable
Treatment Ausprägung (metrisch)
Konstante
Lineare Komponente
Quadratische Komponente
Kubische Komponente
X
t
b
b t
b t
b t
Methoden derPsychologie
OrthogonalePolynome
Bedingungen
Univariates Testen Trendtests
2 3 10 1 2 3 1
kkX b b t b t b t b t
Wird als Gleichung für die Mittelwerte der j Stufen geschätzt:
0 1 1 2 2 1 1j j j k k jX b bu b u b u mit
1 1j ju a t 22 2 2j j ju a b t t 2 3
2 3 3 3j j j ju a b t c t t usw.
Für Linearkombinationen Ci werden Koeffizienten so gewählt, Daß die Trendkomponenten stets orthogonal sind:
1 1 2 2i i i ik kC c X c X c X mit
0ijj
c ' 0ij i jj
c c (Kontrastbedingung) (Orthogonalität der Ordnungen)
Methoden derPsychologie
OrthogonalePolynome
Univariates Testen Trendtests
Die Koeffizienten cij liegen bis zu hohen Anzahlen für k in Tabellen vor.
Methoden derPsychologie
Quadratsummen
Test
Trend-QS:
1Treat lin quad cub kQS QS QS QS QS
Mit diesen Koeffizienten gilt
Die Treatmentquadratsumme zerlegt sich additiv in die Quadratsummen-Anteile der einzelnen orthogonalen Trendpolynome.
2
( ) 2i
Trend iij
j
n CQS
c
Jede Trendkomponente hat einen Freiheitsgrad (df = 1). Dann gilt der F- Test:
2ˆTrend
error
QSF
Mit dfzähler = 1 und df Nenner = dferror.
In komplexeren Designs oder rm Designs ist die die jeweilige Testvarianzdes Faktors einzusetzen.
Univariates Testen Trendtests
Methoden derPsychologie
Komponenten
NichtlinearerTrend-Test
nonlin Treat linQS QS QS
Man teilt oft ein in lineare Komponenten und Restkomponenten, um den nichtlinearen Anteil abzuschätzen.
Diese Komponente hat k-2 Freiheitsgrade (df = k-2). Dann gilt der F- Test:
2
/( 2)ˆ
nonlin
error
QS kF
Mit dfzähler = k-2 und df Nenner = dferror.
Die Polynomkoeffizienten aller Trendkomponenten erhält man wie üblichüber die Methode der Normalgleichungen.Für die lineare Komponente eines aufsteigend (1,2,3…) ganzzahlig gestuf-ten Dosisfaktor gibt es einfache Beziehungen aus den Quadratsummen:
Univariates Testen Trendtests
Linearer Trend
lin
k
QSb
QS
(Steigung)
3
12k
n k kQS
(falls Stufen aufsteigend Integer)
a X b K
(Schnittpunkt)
Methoden derPsychologie
Trendvarianz-Aufklärung
2 Treat
Tot
QS
QS
Das Eta Quadrat kann aufgefasst werden als das Quadrat der Korrelation von den Daten mit der einem Polynom vom Grad k-1
Entsprechend kann man die einzelnen Trendanteile bewerten:
Man kann eine Intraklassenkorrelation von Faktorstufen und Treatmentberechnen:
Univariates Testen Trendtests
Intra-ClassCorrelation
2
intra 2 2error
r
2 TrendTrend
Tot
QS
QS
mit22
2 ˆ
1Treat
k n
Sie gibt den korrelativen Zusammenhang der Treatmentstufen mit denDaten an.
Damit kann man die Zunahme der Varianzaufklärung durch Hinzunahmeeinzelner Trendkomponenten bewerten.
Methoden derPsychologie
Einzelvergleiche
In der ANOVA prüft man Kontraste gewöhnlich über F- Tests. Wegen
Univariates Testen Trendtests
F-Test Kontraste
( )mit Zähler: 1
und Nenner: 1
df
df k n
=
= -
( )2
22ˆ x
xt F
sD
D= =
( )2
1,df dft F=
ist ein t- Test einem F- Test äquivalent. Es gilt
Für den Standardfehler eines Vergleichs gilt
( ) 2 2 21ˆ ˆx j error
j
Var D cn
s sD
æ ö÷ç ÷= = ç ÷ç ÷çè øå
j jj
D c x= ×å
0jj
c =å
mit den Kontrastbedingungen
( )
2 2
2 2error j
j
D n DF
Var D cs×
= =×å
(Kontrast über F-Test prüfen)
ˆ xsD
Methoden derPsychologie
OrthogonaleEinzelvergleiche
Für orthogonale Einzelvergleiche gelten gesonderte Konstruktionsregeln
Univariates Testen Trendtests
Vollständige Sätze von orthogonalenKontrasten
Zwei Einzelvergleiche j und k sind orthogonal, wenn gilt:
Man kann Mengen konstruieren, die k-1 orthogonale Einzelvergleicheenthalten. Für solche vollständigen Sätze von Einzelvergleichen gilt:
( ) ( ) ( )1 2 1Treat kQS QS D QS D QS D -= + +K
Die Treatmentquadratsumme ist additiv aus denQuadratsummen der Einzelvergleiche eines voll-ständigen Satzes zusammengesetzt.
2
2Dj
j
n DQS
c
×=
å
0ij iki
c c
Alle in einem vollständigen orthogonalen Satz von Einzelvergleichenenthaltenen Kontraste sind auf dem - Niveau des gesamten F- Testsfür den Treatmentfaktor abgesichert, weil sie lediglich Anteile an der Treatmentquadratsumme darstellen.
[Excel-Beispiel]
Methoden derPsychologie
KonstruktionEs gibt verschiedene Konstruktionsregeln. Z.B. Helmert-Regel:
Univariates Testen Trendtests
Für k=5 (Beispiel) führt dies auf die zeilenweise orthogonale (4 x 5) Koeffizientenmatrix
1 2 1
2 3 2 1
3 4 3 2 1
1 1 1
1
21
3
1
1k k k
D X X
D X X X
D X X X X
D X X Xk
1 1 0 0 0
1 11 0 0
2 21 1 1
1 03 3 31 1 1 1
14 4 4 4
Alle Vergleiche (Zeilen) sind orthogonal.
Methoden derPsychologie
PaarvergleicheFür reine Paarvergleiche gilt, dass es nur bis zu
Univariates Testen Trendtests
1. Teste Trends im Treatmentfaktor. Signifikanz des linearen Trends sichert bereits die monotone Folge der Stufen ab. Signifikanz des quadratischen Trends sicher den nichtlinearen Anstieg (Abfall).
2. Sichere den Unterschied der letzten Faktorstufen gegen den der ersten Faktorstufen mit wenigen Einzeltests ab. Damit ist zumeist der gesamte Gehalt der inhaltliche Hypothesen über Lernverlauf oder Sättigung statistisch geprüft.
div 2k orthogonaleVergleiche in einem Satz geben kann.
Für mehr Paarvergleiche muss das - Niveau gegen multiples Testen adjustiert werden (Bonferroni), um konservativ sicher zu testen.
Strategie
Man konstruiere sich ein Set von orthogonalen Einzelvergleichen, welchesviele der gewünschten a-priori Kontraste enthält. Darüber hinausgehendeVergleiche führt man mit - Adjustage durch. A-Posteriori Vergleiche (Scheffe, Duncan) liefern meist mehr konservative kritische Differenzen für Kontraste, dain a-posteriori Tests alle möglichen Paarvergleiche eingehen. [Excel-Beispiel]
Methoden derPsychologie
Allgemeines • Trendanalyse ist ein häufig eingesetztes Verfahren in rm ANOVA Designs, da sie die Art der Wirkverlaufes einer Intervention beurteilen lässt.
• Trends sind in rm Designs grundsätzlich definierbar, da die Stufen der UVs als Zeitpunkte oder Anzahlen der Wiederholung der Gabe eines Treatment grundsätzlich metrische Levels repräsentieren.
• Trends sind ebenfalls in Mischdesigns mit Grouping-Faktoren und rm Faktoren definierbar. Für die Testung des Trends gilt, dass der Trend immer an der Prüfvarianz des Faktors geprüft wird.
• Trendanalyse ermöglicht eine Prognose des Zeitpunktes, an dem ein Lern- oder Wirkkriterium voraussichtlich erreicht ist.
Trendtests in rm ANOVA
• Die Testung der Signifikanz des rm Faktors, der mögliche Trends enthält, ist in der rm ANOVA an strenge Voraussetzungen gebunden. (Eigenschaften der Varianz-Covarianz Matrix). Bei Verletzungen führt der F- Test zu progressiven Entscheidungen.
• Verletzungen der Voraussetzungen können mit geeigneten Verfahren (Box, Greenhouse-Geisser) korrigiert werden.
Voraussetzung
Univariates Testen rm ANOVA
Methoden derPsychologie
VerbundeneSymmetrie
Sind für insgesamt k Messzeitpunkte die Korrelationen zwischen allen Messzeitpunkten gleich und ebenfalls die Varianzen, so erhält man als Varianz-Covarianz-Matrix
(verbund-symmetrische Matrix). Diese strenge Forderung an dieStruktur der Daten für die rm-ANOVA ist aber nicht nötig.
Statt dessen muss für die Gültigkeit der F-Statistik folgende Bedingungerfüllt sein:
2
2
2
cov cov
cov cov
cov cov cov
Voraussetzungen rm ANOVA
'var const.j jX X a
Die Varianz der Differenz der Messwerte zweier beliebiger Messzeit-punkte j und j‘ muss dieselbe Konstante ergeben. Verletzungen dieser Voraussetzung führen zu progressiven Verfälschungen des F-Tests.
Homogenitäts-Voraussetzungder rm ANOVA
Methoden derPsychologie
Matrix-Bedingung:Zirkularität
Anders geschrieben:
11 12 13
21 22 23
31 32 33
9 5 6
4 11 7
6 7 13X
Σ
[Excel-Beispiel]
Voraussetzungen rm ANOVA
Man verifiziert ebenso, dass eine verbunden symmetrische Matrixebenfalls die Eigenschaft der Zirkularität besitzt.
Beispiel
' ' ' 'var 2 2 const.j j jj j j jjX X
Varianz-Covarianz Matrizen , die diese Bedingung erfüllen, heissen zirkulär.
11 22 12
11 33 13
22 33 23
2 9 11 2 5 10
2 9 13 2 6 10
2 11 13 2 7 10
Methoden derPsychologie
GenerischeRegel
Sei A eine Matrix mit gleichen Zeilenelementen, so gilt
2 2 2 2 3 4 5 0 0 9 5 6
3 3 3 2 3 4 0 5 0 4 11 7
4 4 4 2 3 4 0 0 5 6 7 13X
Σ
[Excel-Beispiel]
Voraussetzungen rm ANOVA
Die Eigenschaft der Zirkularität der Varianz-Covarianz Matrixist über statistische Tests prüfbar. Dazu bedient man sich einer aus der Zirkularität abgeleiteten Eigenschaft von , der Spherizität.
Beispiel (k=3, =5)
tX Σ A A I
ist zirkulär.
Test überSpherizität
Sei M eine (k-1) x k Matrix mit orthogonalen Zeilen.
tY X Σ MΣ M I
ist sphärisch, gdw X zirkulär ist.
Die (k-1) x (k-1) Matrix
Methoden derPsychologie
Sphärische Matrix Y
Man verwende als Matrix M eine Matrix der c-Koeffizienten, die einen vollständigen Satz orthogonaler Einzelvergleiche definiert. Die Vektoren normiere man zeilenweise (orthonormale Matrix M)
*
1 10
1 1 0 2 21 1 11 1 2
6 2 6
M M
Voraussetzungen rm ANOVA
Beispiel (k=3)
0 0t t MA AMDamit:
DiagonalmatrixY
Da A gleiche Zeilenelemente hat, und die Summe der Zeilenelemente von M Null ergibt, folgt
t
Y X
t t
t t t t
Σ MΣ M
M A A I M
MAM MA M MM
I
Wenn X zirkulär ist, ist Y sphärisch (diagonal)Folgerung
Methoden derPsychologie
Abweichung von Spherizität
Man definiert ein Abweichungsmaß für die Abweichung von derSpherizität:
Range der möglichen Abweichung
i die Eigenwerte von Y .
2
21i i
i ik
Voraussetzungen rm ANOVA
Damit kann man den Range der möglichen Abweichungen bewerten(Beispiel: k=4):
0 0
0 0
0 0Y Y
c c c c
c c c c
c c c c
Σ Σ
1 2 3c c c 1 2 33 0 0c
2
2
31
3 3
c
c
2
2
3 1 1
3 13 3
c
kc
Der Range der möglichen Abweichungen ist [(k-1)-1…1]
(perfekt) (max. Abweichung)
Methoden derPsychologie
Mauchley-Test
Man teste die Nullhypothese
Test-Statistik:Mauchley’s W
über die Stichprobenmatrizen SX und SY .
Y Σ I
Voraussetzungen rm ANOVA
1 1,W W k n
1/ 1
Yk
Y
Wtr k
S
Smit
tY XS MS M
(tr die Spur der Matrix)W ist austabelliert (e.g. Winer, Anhang D).
EntscheidungsRegel
Lehne die Nullhypothese (Spherizitätshypothese) ab, wenn
sonst behalte Spherizitätshypothese bei. sollte nicht konservativ gewählt werden (e.g. = 0.25)
Aus W berechnet man die 2 verteilte Prüfstatistik -Test
lnL n k W 1
, 12
k kdf
mit
22 21
6
1
m m
m n k
m k
(nur approx.)
Methoden derPsychologie
Mauchley-TestW-Tabelle
Voraussetzungen rm ANOVA
Methoden derPsychologie
Freiheitsgrad-korrektur
Unabhängig vom Ergebnis des Mauchley-Tests kann der F-Test durch eine Adjustage der Freiheitsgrade konservativer gemacht werden.
Nach Box ist die F- Statistik in rm Designs verteilt wie
Voraussetzungen rm ANOVA
1 , 1 1F k n k (#)
Greenhouse-GeisserCorrection
Da die untere Grenze für (maximale Verletzung) 1/(k-1) ist, folgt
1 2
1 1 1
n k
k n k
Wenn 1 1
Box-Correction
1, 1F n
als konservativster F- Test, der jede Spherizitätsverletzung auffängt.
Die Gültigkeit von (#) ist gut untersucht. Huynh und Feldt schlagenvor, korrigierte in (#) zu verwenden:
Huynh-Feldt-Correction
aber kombiniert mit der Regel:
(den Abweichungswert auf 1 setzen, falls größer wird)
Mit der Box Formel lässt sich nach Verwendung von ein optimalesErgebnis erreichen.