syllabus statistiek 2 2014-2015

77
Vrije Universiteit Faculteit Psychologie en Pedagogiek Statistiek 2 Syllabus 2014 - 2015 Vakcode: P_BSTATIS_2 1

Upload: michiel-davy

Post on 13-Jan-2016

222 views

Category:

Documents


0 download

DESCRIPTION

The syllabus, exercise booklet of the course statistics 2 at VU university

TRANSCRIPT

Page 1: Syllabus Statistiek 2 2014-2015

Vrije Universiteit

Faculteit Psychologie en Pedagogiek

Statistiek 2

Syllabus 2014 - 2015

Vakcode: P_BSTATIS_2

1

Page 2: Syllabus Statistiek 2 2014-2015

Docenten hoorcollegesDr. Niels SmitsDr. Marleen H. M. de Moor

Coördinator WerkgroepenDrs. Anja M. RuhlandTransitorium kamer 3C-23 020 - 598 2613E-mail: [email protected]

© FPP, Faculteit Psychologie en Pedagogiek, afdeling MethodenNiets uit deze uitgave mag worden verveelvoudigd en/of openbaar gemaakt door middel van druk, fotokopie, microfilm of op welke wijze ook zonder voorafgaande schriftelijke toestemming van het Onderwijsinstituut Psychologie en Pedagogiek.

Vrije UniversiteitFaculteit Psychologie en Pedagogiek Van der Boechorststraat 11081 BT Amsterdam

2

Page 3: Syllabus Statistiek 2 2014-2015

Voorwoord

Met de statistische technieken uit Statistiek 1 kun je vragen beantwoorden over: 1) hoe vaak iets voorkomt; bijvoorbeeld hoeveel jongeren vertonen delinquent gedrag? 2) over verschillen tussen groepen; bijvoorbeeld zijn jongens agressiever dan meisjes? En 3) de relatie tussen variabelen, bijvoorbeeld wat is de relatie tussen gedragsproblemen en opvoedingsstijl? Bij het beantwoorden van de eerste vraag schat je een parameter en bereken je een betrouwbaarheidsinterval. Bij de tweede bereken je het betrouwbaarheidsinterval van het verschil en doe je mogelijk een t-toets. En voor het beantwoorden van de laatste vraag gebruik je mogelijk regressieanalyse. Tijdens Statistiek 2 wordt de inhoud van Statistiek 1 kort herhaald en deze stof behoort ook tot de tentamenstof van Statistiek 2.

Met de technieken die je tijdens Statistiek 2 leert kun je meer! Vaak zijn psychologische en pedagogische verschijnselen complexer, omdat er bijvoorbeeld meerdere oorzaken een rol spelen of omdat een oorzaak niet voor iedereen hetzelfde effect heeft. Met de kennis uit Statistiek 2 kun je bijvoorbeeld de vraag beantwoorden in hoeverre depressie veroorzaakt wordt door gebeurtenissen, denkpatronen en genetische kwetsbaarheid (Hier zijn vier variabelen in het spel (welke?)). Of je kunt de vraag beantwoorden of een pedagogische interventie ter voorkoming van agressie een verschillend effect heeft op jongens en meisjes (Hier zijn drie variabelen in het spel (welke?)). Tijdens Statistiek 2 leer je technieken voor het analyseren van verschijnselen waarbij één respons- (of afhankelijke) variabele en twee of meer predictoren (onafhankelijke variabelen) in het spel zijn. Terzijde, Statistiek 3 in het B3-jaar is een uitbreiding naar meerdere en complexere responsvariabelen.

3

Page 4: Syllabus Statistiek 2 2014-2015

CURSUSINFORMATIE

1. Opzet cursus 2. Verwachtingen3. Verplichte literatuur4. Overzicht werk- en hoorcolleges

1. Opzet van de cursus en leerdoelenAls je aan het eind van de cursus in staat bent om goed na te denken over psychologische en pedagogische problemen waarin drie variabelen tegelijkertijd een rol spelen heb je een belangrijk doel bereikt en zonder overdrijven iets geleerd waar je je hele professionele leven als psycholoog of pedagoog gebruik van zult maken.

Je zult merken dat de kennis uit de Statistiek 2 daarbij nuttig is (vraag maar aan de werkgroepdocent hoe hij/zij dat heeft gemerkt). Dus ook als je denkt nooit onderzoek te doen is de kennis uit Statistiek 2 voor je professionele bestaan als psycholoog of pedagoog van belang.

Hoe is de cursus opgezet?

1. Hoorcolleges: Je krijgt 13 hoorcollege plus een responsiecollege (14 hoorcolleges in totaal). In de eerste week wordt een groot deel van de stof van Statistiek 1 (hoofdstuk 1 t/m 7) snel herhaald. Vanaf de tweede week volgt ook uitleg over hoofdstuk 8 en 9 en de nieuwe hoofdstukken 10 t/m 15.

2. Digitale ondersteuning: Als je vorig jaar het boek van Agresti en Finlay (2009) gekocht hebt, heb je weer toegang tot MyStatLab. Wel moet je een nieuwe code gebruiken die op BlackBoard komt te staan. Meld je op de site van MyStatLab aan! Zij die dit jaar een boek kochten kunnen gewoon inloggen. Voor iedere week staan er op Mystatlab sommen die bedoeld zijn om de studiestof onder de knie te krijgen. Voor de eerste week betreft het een grotere hoeveelheid items dan in latere weken (2 t/m 6) omdat in het begin een groot deel van de stof wordt herhaald.

3. Discussionboard: Tijdens de cursus kun je met je vragen terecht op het discussionboard dat bereikbaar is via BlackBoard. Je mede-studenten zullen je vragen beantwoorden. Het discussionboard wordt gevolgd door Diane Lamb. Zij zal indien nodig vragen beantwoorden.

4. Wekelijkse toets: Wekelijks zal via Blackboard een aantal opgaven (3 tot 10) worden aangeboden als toets. Deze toets moet elke maandag vóór 20:00 uur worden gemaakt: op blackboard staan de deadlines aangegeven. Voor iedere wekelijkse toets krijg je een cijfer. Als je gemiddeld een 6.0 of hoger hebt gescoord voor deze toetsen, wordt je tentamencijfer, als dat tussen de 5.0 en 5.9 is, opgehoogd naar een 6.0. Deze toetsen geven je ook een indruk van je kennis op dat moment: dan weet je precies waar je nog voor moet leren en wat je al beheerst.

5. Sommen uit Agresti & Finlay (2009). Wekelijks krijg je als huiswerkopgave de opdracht mee om een aantal sommen te maken uit het boek. Vragen die je hierover hebt kun je vooral aan elkaar stellen. In werkcolleges 3, 5 en 7 wordt aan deze opgaven aandacht besteed.

4

Page 5: Syllabus Statistiek 2 2014-2015

6. Werkcolleges. De werkcolleges zijn bedoeld om je vaardigheid in het beantwoorden van psychologische en pedagogische vragen te vergroten. Dat gebeurt op drie manieren.

a. Je werkt aan een grote opdracht alcoholgebruik bij jongeren. Enkele van de vele vragen zijn: Hoeveel drinken jongeren? Is dat voor jongens en meisjes hetzelfde? Wat zijn de belangrijkste voorspellers van alcoholgebruik bij jongeren? Is het mogelijk via een pedagogische interventie alcoholgebruik te verkleinen? Je maakt tijdens de werkgroepen een aantal deelopdrachten, waarop je feedback krijgt van de docent. Die feedback gebruik je bij de eindopdracht.

b. Vergroten van statistische kennis. Tijdens iedere werkgroep wordt met een gedeelte van de stof van de hoorcolleges geoefend: achter de computer tijdens computerpractica of tijdens het werkcollege met opdrachten. De bedoeling is dat je elkaar helpt. De docent is daarbij meer coach dan leraar en zal je zoveel mogelijk motiveren zelf het antwoord uit te zoeken. Bij de werkgroepen Statistiek 2 gaat het meer om het leren begrijpen van de stof dan om het al kunnen geven van de juiste antwoorden.

c. Vergroten van rekenvaardigheid met SPSS. Omdat SPSS vaak als een hinderpaal wordt ervaren oefen je tijdens de werkgroepen regelmatig met SPSS. Wat de pen is voor een schrijver en de werkkamer voor de therapeut, is SPSS voor de psycholoog en pedagoog. Als je goed met SPSS overweg kunt, kom je echt toe aan het oplossen van psychologische en pedagogische vragen. De kunst is om een juiste analyse in SPSS aan te sturen en de juiste output te interpreteren en te rapporteren.

d. Vergroten van je rapportagevaardigheid. Je schrijft een onderzoeksverslag, in APA stijl.

2. VerwachtingenWat wordt er van je verwacht? Als professionele psycholoog of pedagoog wordt er straks van je verwacht dat je psychologische en pedagogische problemen zelfstandig en deskundig kunt oplossen. Een academicus is niet zozeer iemand die antwoorden of oplossingen weet, maar vooral weet hoe hij of zij een antwoord of oplossing moet vinden. Hij of zij kan bronnen raadplegen, kent psychologische en pedagogische begrippen en theorieën, maar vooral kan hij of zij goed nadenken en redeneren. En hij of zij is in staat de vraag en het antwoord begrijpelijk onder woorden te brengen.

Van jou wordt tijdens de werkcolleges hetzelfde verwacht. Er wordt verwacht dat je pedagogische, psychologische en statistische begrippen juist gebruikt. Dat je actief meehelpt problemen te formuleren en op te lossen. Dat kan variëren van het uitvogelen en daarna uitleggen van een procedure in SPSS, van het leren begrijpen van een statistisch begrip of toets tot het bedenken van een verklaring voor een psychologisch probleem.

We verwachten van je dat je je als een aankomend professional gedraagt: je werk doet, opdrachten maakt, je voorbereidt op werkgroepen, je sommen maakt en de stof goed bijhoudt. Dat je er kortom voor gaat. Ook een professional twijfelt weleens aan het nut van wat hij of zij doet, of aan zijn eigen kunnen. De goede professional stapt over die twijfels heen en weet dat hij of zij kennis en vaardigheden moet (blijven) ontwikkelen om zijn vak goed en met plezier uit te kunnen oefenen.

5

Page 6: Syllabus Statistiek 2 2014-2015

3. Verplichte literatuur Agresti, A. & Finlay, B. (2009). Statistical methods for the social sciences (4th edition).

Upper Saddle River, NJ: Pearson. ISBN-13: 9781848783751 Pallant, J. SPSS survival manual (3rd edition). Maidenhead, Berkshire, England: Open

University Press. Laatste editie Burton, Lorelle J. (2010). An interactive approach to writing essays and research reports

in Psychology (3nd edition). Wiley. ISBN: 9781742166490. SPSS-software via Surfspot Selectie van artikelen: wordt nader bekend gemaakt.

6

Page 7: Syllabus Statistiek 2 2014-2015

4. Overzicht werk- en hoorcolleges

Werkcollege 1:- Start cursus: kennismaking- Eindopdracht: inleiding en uitleg- Computerpracticum 2e helft werkcollege 1Thuis: afmaken 1.3; maken Mystatlab-opgaven en wekelijkse BB-toets.

Hoorcolleges week 1: Herhaling Statistiek 1

Werkcollege 2: Computerpracticum-Analyse Eenvoudige relatiesThuis: hypothesen toetsen over eenvoudige relaties; maken A&F- en Mystatlab-opgaven en wekelijkse BB-toets. Hypothesen formuleren eindopdracht formuleren en inleveren

Hoorcolleges week 2: Verbanden tussen twee, en meer dan twee vari-abelen.

(twee dagen vóór werkcollege 3: inleveren hypothesen)Werkcollege 3:- Bespreken blackboardopdrachten en oefenopgaven.- Oefening Relaties- Eindopdracht: hypothesen complexere relatiesThuis: werken aan eindopdracht: Inleiding en Methoden schrijven en inleveren op BB; maken A&F- en Mystatlab-opgaven en wekelijkse BB-toets.

Hoorcolleges week 3: Multipele Regressie (H11 Agresti en Finlay (2009)).

(vóór werkcollege 4 inleveren eindopdracht: Inleiding en Methode)Werkcollege 4: Computerpracticum- Computerpracticum Eindopdracht: verkenning data- Computerpracticum Oefening: ANOVA oefenenThuis: maken A&F- en Mystatlab-opgaven en wekelijkse BB-toets. Bestuderen bijlage D en afmaken 4.2.

Hoorcolleges week 4: Variantieanalyse met één factor (H12 Agresti).

Werkcollege 5:- feedback Inleiding en Methoden- Bespreken blackboardopdrachten en oefenopgaven.- Oefening ANOVA en data-analyseplanThuis: maken A&F- en Mystatlab-opgaven en wekelijkse BB-toets en voorbereiden werkcollege 6.

Hoorcolleges week 5: Variantieanalyse met meer factoren, Covari-Antieanalyse (H13 Agresti).

Werkcollege 6: Computerpracticum- Computerpracticum: logistische regressie, analyses eindopdrachtThuis: maken A&F- en Mystatlab-opgaven en wekelijkse BB-toets. werken aan eindverslag: tweede tussenverslag afschrijven en inleveren op BB

Hoorcolleges week 6: Modelbuilding en logistische regressie (H14 en 15 Agresti).

(Twee dagen vóór werkcollege 7 inleveren eindopdracht: Resultaten en Discussie)Werkcollege 7:- Bespreken blackboardopdrachten en oefenopgaven.- (Peer)Feedback op tweede tussenverslag- Evaluatie

Hoorcolleges week 7: GLM en terugblik (responsie).

Na werkcollege 7: afschrijven EindopdrachtInkijken Feedback R&D in Turnitin: vanaf vrijdag 27 maart 2014, 23.59 uur.

7

Page 8: Syllabus Statistiek 2 2014-2015

Inleveren Eindopdracht uiterlijk vrijdag 3 april 2015, 23.59 uur. Feedback dmv Rubrics: uiterlijk zondag 19 april 23.59 uur. Maandag 20 of dinsdag 21 april staat cijfer op VUnet.Inleveren Herkansing van de eindopdracht uiterlijk vóór vrijdag 15 mei 2014, 23.59. Cijfers terug, uiterlijk maandag 2 juni op VUnet.

8

Page 9: Syllabus Statistiek 2 2014-2015

SPELREGELS

1. APA-regels 2. Plagiaat3. Spelling en grammatica4. Aanwezigheidsregeling5. Inleveren opdrachten6. Toetsvorm

1. APA-regelsIn het boek van Burton kun je de eisen waaraan een wetenschappelijk verslag moet voldoen opzoeken, evenals veel tips over wetenschappelijk schrijven. Daarom zal de docent voortdurend verwijzen naar het boek van Burton en Pallant (voor SPSS).

2. PlagiaatAls je passages en ideeën uit andermans werk citeert of parafraseert en deze als eigen werk presenteert, pleeg je plagiaat. Plagiaat is intellectuele diefstal en wordt beschouwd als wetenschappelijk wangedrag. Ook als student wordt plagiaat je zwaar aangerekend. Als je plagiaat pleegt, wordt dit gemeld aan de examencommissie. Deze bepaalt dan of je een cijfer kunt krijgen voor je werk of niet en of er andere maatregelen genomen moeten worden. In de meeste gevallen wordt je bij plagiaat uitgesloten voor een jaar voor het vak waarbij je plagiaat hebt gepleegd.

NB: Wellicht ten overvloede: uiteraard is overnemen van tekst van medestudenten, websites en andere mogelijke bronnen ook plagiaat. Leen ook nooit jouw tekst uit om studenten te helpen met het schrijven van verslagen. Daarmee geef je gelegenheid tot plagiaat: zowel gelegenheid geven als plagiaat plegen worden gemeld aan de examencommissie.

3. Spelling en grammaticaBij alle schrijfopdrachten wordt uitgegaan van schrijven in goed Nederlands. De spelling en grammatica moeten in orde zijn, anders heeft de docent het recht om het werk terug te geven met de opmerking dat het pas nagekeken wordt als de spelling en de grammatica in orde is. De werkgroepdocent is geen Nederlandse taaldocent en mag verwachten dat je dat op de middelbare school in voldoende mate hebt geleerd.

Als je het moeilijk vindt om goed Nederlands te schrijven, door dyslexie of doordat je moedertaal niet Nederlands is, laat je werk dan door anderen nakijken voordat je het inlevert. De spellingscheck in de softwareprogramma’s haalt wel wat spelfouten uit je werk, maar haalt er niet alles uit: alleen met een spellingscheck je werk controleren is daarom niet voldoende.

4. AanwezigheidsregelingIn overleg met de docent kun je één werkcollege missen. Als je twee of meer werkcolleges mist, moet je de werkcolleges volgend studiejaar over doen en kun je de eindopdracht niet inleveren, ongeacht de redenen van het verzuim.

9

Page 10: Syllabus Statistiek 2 2014-2015

Als je het eerste werkcollege afwezig bent zonder afbericht, wordt ervan uit gegaan dat je de cursus niet zal volgen en wordt je automatisch uitgeschreven.Uiteraard is het de bedoeling dat je op tijd binnen bent voor de werkcolleges.

5. Inleveren opdrachtenAls je verslagen op de daarvoor aangegeven tijd hebt ingeleverd, zal de docent feedback geven. Als je het niet redt, overleg dan vóóraf met de docent of er nog andere mogelijkheden zijn.

6. Toetsvorm Tentamen en Eindopdracht. Zie voor weging en eisen de studiegids.

10

Page 11: Syllabus Statistiek 2 2014-2015

WERKCOLLEGE 1

1.1. Start van de cursus (in de werkgroepruimte)1.2. EindopdrachtTweede helft van het werkcollege:1.3. Computerpracticum (in de computerzaal) 1.4. Huiswerk

NB: Neem Agresti en Pallant mee!Agresti & Finlay, Herhalen Hoofdstukken 1 t/m 7

Doel: - opfrissen van kennis van Statistiek 1: beschrijvende statistiek - oefening en herhaling SPSS

1.1. Start van de cursus (in de werkgroepruimte)Kennismaking.

Bespreek in een groepje wat jouw houding is ten opzichte van statistiek. Hoe heb je statistiek in het eerste jaar aangepakt? Hoe wil je het nu aanpakken? Waar ga je voor? En hoe kun je bij elkaar een professionele houding bevorderen?

1.2. EindopdrachtJe schrijft voor de eindopdracht een verslag over een onderzoek naar Alcoholgebruik bij jongeren (zie bijlage C). Je onderzoekt welke risico- en beschermende factoren het alcoholgebruik van jongeren beïnvloeden (Inleiding, Methode, Resultaten en Discussie). Daarvoor krijg je een dataset (via blackboard). Tijdens de computerpractica van werkcolleges 4 en 6 werk je aan de analyses van de eindopdracht. Tijdens werkcolleges 1 en 2 oefen je in data analyse.

- Planning: je maakt opdrachten tijdens en na de werkcolleges voor de eindopdracht, je schrijft een hypotheseopdracht en twee tussenverslagen, waar je feedback op krijgt, en je schrijft het eindverslag. In het schema op p. 6, kun je precies zien wanneer je wat moet inleveren.

- De eisen die aan de verslagen gesteld worden staan in bijlagen A en B.- De deadlines voor het inleveren van de eindversie staan ook in bijlage A.

NB: omdat je eerst meer kennis en vaardigheden nodig hebt voor het kunnen uitvoeren van de eindopdracht, wordt pas in werkcollege 3 met de opdracht gestart. Vlak vóór werkcollege 3 moet je daarvoor de eerste opdracht inleveren (zie huiswerk Werkcollege 2).

1.3. Computerpracticum (in de computerzaal)In dit practicum train je SPSS vaardigheden.

In dit werkcollege oefenen we met diverse SPSS-opdrachten aan de hand van kleine datasets.

11

Page 12: Syllabus Statistiek 2 2014-2015

Het is bedoeling dat je leert je problemen met SPSS snel op te lossen, dat je inventief wordt en handig gebruik weet te maken van bijvoorbeeld Pallant en de helpfunctie in SPSS. Je werkt individueel aan een computer, maar kunt overleggen met je buurvrouw/man. Probeer veel en kijk steeds goed naar de output (óók als je een ‘error’ krijgt) en probeer er met je buurvrouw/man eerst zelf uit te komen.

Het is echt trial en error en voor sommigen ook het leren omgaan met de frustratie die daarbij kan komen kijken. De werkgroepbegeleider wil je graag (kort) helpen. De docent zal nooit langer dan enkele minuten bij je blijven staan, zodat iedereen de kans krijgt vragen te stellen. De opdrachten sluiten aan bij Hoofdstuk 1 tot en met 7 van het statistiekboek van Agresti en Finlay.

Opdracht 1: Sport en Depressie (beschrijven categorische variabelen)Janneke doet een onderzoek onder studenten naar de relatie tussen sport en depressie. Zij heeft aan 100 aselect getrokken studenten economie, medicijnen, psychologie en rechten gevraagd aan welke soort sport zij doen en of zij depressieve klachten hebben De vragen maakten deel uit van een grootschaliger onderzoek naar het welbevinden van studenten, waarbij onder andere de Beck Depression Inventory (cf Beck, Steer & Carbin 2002) en de DSM-IV werd gebruikt. Je kunt het bestand van blackboard downloaden (onder de button ‘Materiaal Werkcolleges’ > map ‘Werkcollege 1’).

Bestand: Werkcollege 1 opdracht 1 sport en depressie v1.savVariabelen BeschrijvingPPNO ProefpersoonnummerStudie 1=economie, 2=medicijnen, 3=psychologie, 4=rechtenSport Soort sport (0=geen,1=individuele sport 2=teamsport)Depri Depressiviteit (0=geen klachten, 1= depressieve klachten)

Vragen a. Er zijn meerdere psychologische hypothesen mogelijk als het gaat over de relatie tussen

sport en depressie. Formuleer één psychologische hypothese over de relatie tussen sport en depressie. (Psychologische hypothese betekent dat je in woorden een toetsbare bewering formuleert, i.t.t. een statistische hypothese waarbij je de nul- en alternatieve hypothese zou moeten bedenken). Wat is de verklaring voor deze relatie?

Open de dataset ‘Werkcollege 1 opdracht 1 sport en depressie v1.sav’ in SPSS.

b. Wat zijn de frequenties in de vier categorieën van de variabele Studie? Bereken de modus. Rapporteer de modus, een frequentie tabel en een staafdiagram.

c. Wat is het percentage studenten dat aan sport doet?

12

Page 13: Syllabus Statistiek 2 2014-2015

d. Wat is de proportie depressieve studenten in de steekproef? Hoe groot schat je de proportie in de populatie? Bereken het 95% betrouwbaarheidsinterval en rapporteer.

e. Maak met een kruistabel en een staafdiagram zichtbaar of er een relatie bestaat tussen sport en depressie. Toets deze relatie.

Opdracht 2: Angst en Praten (beschrijven continue variabelen)Mirjam is geïnteresseerd in de relatie tussen angst en praten. Ze weet van zichzelf dat ze stil wordt als ze nerveus is, maar kent anderen die dan juist meer lijken te gaan praten. Ze besluit een experiment te doen. Zij verdeelt 40 eerstejaars psychologie studenten aselect over twee groepen. Met elke student wordt afzonderlijk een afspraak gemaakt. Studenten in conditie 1 krijgen bij aankomst te horen dat ze over 10 minuten een vragenlijst moeten invullen met vragen over hoe vriendelijk ze zijn. Studenten in condities 2 krijgen te horen dat zij over tien minuten worden geïnterviewd over hoe vriendelijk ze zijn door een panel van psychiaters en psychologen. Tijdens de tien minuten voorafgaand aan de test of het interview zit de deelnemer in een wachtkamer, samen met een medewerker van het onderzoek. Deze medewerker reageert alleen als de deelnemer stopt met praten (dat gaat volgens een vast protocol). Gemeten wordt hoe lang de deelnemer tijdens die tien minuten aan het woord is geweest. Na afloop krijgt de student een vragenlijst waarmee Angst en Stress gemeten wordt.

Bestand: Werkcollege 1 opdracht 2 angst en praten v1.savVariabelen BeschrijvingPPNO ProefpersoonnummerSekse 0=man, 1=vrouwLeeftijd Leeftijd gemeten in jarenAngst Score voor gegeneraliseerde angst. State-trate Anxiety

Inventory van Spielberger, hoe hoger de score hoe hoger de angst met een minimum van 1 en een maximum van 19.

Stress 1=geen stress (conditie met vragenlijst na 10 minuten)2=wel stress (conditie met panel en psychiaters na 10 minuten)

Praten Aantal minuten dat de deelnemer praat, uitgedrukt als percentage van de totale 10 minuten.

Vragen

f. Kun je een psychologische hypothese over de relatie tussen stress en praten formuleren? Wat is de verklaring voor deze relatie? Wat verwacht je voor uitkomst van Mirjam’s experiment?

13

Page 14: Syllabus Statistiek 2 2014-2015

Open de dataset ‘Werkcollege 1 opdracht 2 angst en praten v1.sav’ in SPSS

g. Hoe groot is het percentage vrouwen in de steekproef?

h. Wat is de leeftijd van de deelnemers aan het onderzoek? Rapporteer het gemiddelde, minimum en maximum, range en standaarddeviatie

i. Wat is de gemiddelde Angstscore? Hoe groot is de standaarddeviatie? Hoe groot is de standaardfout? Wat is het 95% betrouwbaarheidsinterval van de gemiddelde angstscore?

j. Wat is het effect van stress op praten: Beschrijf en toets het verschil in gemiddelde tussen de twee condities. Hoe zou je dit resultaat interpreteren en opschrijven?

k. Maak Boxplots van de variabele 'Praten' in de twee condities.

l. Onderzoek de relatie tussen Praten en Gegeneraliseerde Angst. Dat kun je doen via een scatterplot, gevolgd door regressie analyse. Is de relaties significant groter dan nul? Hoe sterk is de relatie: met andere woorden, wat is de verklaarde variantie? Hoe zou je dit resultaat interpreteren en opschrijven?

1.4. Huiswerk Op de blackboardsite van Statistiek 2 kun je onder de button ‘Digitale ondersteuning’

oefenopgaven vinden om de stof van de hoorcolleges te oefenen. Voor deze week zijn dat oefenopgaven uit MyStatlab die betrekking hebben op de stof van Statistiek 1.

Afmaken opgaven 1.3.

14

Page 15: Syllabus Statistiek 2 2014-2015

WERKCOLLEGE 2: Computerpracticum

2.1. Computerpracticum: enkelvoudige analyses2.2. Huiswerk

NB: Neem Agresti en Pallant mee en je laptop!

In hoorcollege van deze week wordt behandeld: Agresti & Finlay: Hoofdstuk 8, 9 (herhaling!) en 10 (nieuwe stof).

Doel: Toetsen verschillen en relaties Oefenen SPSS Interpretatie output

2.1. Computerpracticum: enkelvoudige analyses Tijdens werkcollege 1 heb je beschrijvende statistiek geoefend en een paar toetsen uitgevoerd met SPSS. Proporties, gemiddelden, standaarddeviaties, staafdiagram, histogram, boxplot, Chi-kwadraat toets, t-toets en dergelijke, zijn aan bod geweest. Dit werkcollege gaan we verder met het toetsen van verschillen en relaties met behulp van SPSS. Ook nu gaat het er vooral om dat je SPSS leert gebruiken. Met de huiswerkopdracht oefen je naast gebruik van de analyses in SPSS ook de interpretatie van de output. De analysetechnieken die we hier gebruiken staan beschreven in hoofdstuk 6 t/m 11 van Agresti en Finlay.

Opdracht 1: Lachen in het donker (contingency table analysis) Er is een beroemde scene uit de film "When Harry met Sally" waarin Sally hardop een orgasme simuleert in een lunchroom in Manhattan. (You Tube, trefwoord : "best fake orgasm ever"). Caroline gebruikt deze scene om na te gaan of het uitdrukken van emoties afhangt van de omstandigheden. Zij heeft het idee dat mensen niet spontaan hun emoties uiten, maar sociale regels volgen (Malatesta & Haviland, 1982) Zij laat genoemde scene aan 50 personen zien en scoort gedurende het bekijken van de scène of de personen voluit lachen. Ze gebruikt daarvoor een beoordelingsschema ontleent aan Ekman en Friesen (1978). In conditie 1 brandt tijdens het kijken helder TL–licht. In conditie 2 is het bijna donker, er brandt alleen een gezellig lampje.

Bestand: Werkcollege 2 opdracht 1 lachen in het donker v1.savVariabelen BeschrijvingPPNO ProefpersoonnummerSexe 0=man, 1=vrouwExtraversie Score op Eysenck’s Extraversie Schaal, hoe hoger de score

hoe extraverter iemand is met een minimum van 1 en een maximum van 19.

Conditie 1=Licht (TL-verlichting tijdens het kijken)2=Donker (Verlichting klein lampje)

15

Page 16: Syllabus Statistiek 2 2014-2015

Lachen 1=NietVoluit (Niet voluit lachen)2= Voluit. (Wel voluit lachen)

a. Formuleer op basis van de omschrijving van het onderzoek en de variabelen in het databestand een onderzoeksvraag.

b. Welke uitkomst verwacht je?

c. Welke verklaring kun je bedenken voor de uitkomst die je verwacht?

Open de dataset ‘Werkcollege 2 opdracht 1 lachen in het donker v1.sav’ in SPSS:

d. Controleer de meetniveau’s in de datafile (in Variable View, zoek zonodig in Pallant op hoe dat ook alweer moet).

e. Welke groep (conditie) is extraverter, de Lichtconditie of de Donkerconditie, of is er geen verschil? Hoe zie je dat? Wat is de t-waarde? (Werk met de syntax, kijk eventueel in Pallant hoe dat moet).

f. Waarom wil je controleren of proefpersonen in de Lichtconditie en de Donkerconditie gemiddeld even extravert zijn?

g. Maak een 'clustered barchart' waarin het verschil in voluit lachen tussen beide condities zichtbaar wordt. Dat kan via ‘Graphs > Legacy Dialogs’. Zoek het op in Pallant.

h. Ga na of het verschillende effect op lachen in de twee condities statistisch significant is, door een kruistabel (Crosstabs) te maken en deze te analyseren (Zie hoofdstuk 8 van Agresti & Finlay).

i. Wat is de procentuele verdeling van de deelnemers over beide condities?

j. Hoe groot is het percentage personen in iedere condities dat voluit lacht?

16

Page 17: Syllabus Statistiek 2 2014-2015

k. Zijn de percentages voluit lachende deelnemers verschillend voor de twee condities? Hoe zie je dat?

Opdracht 2: Studieprestaties, studeertijd en intelligentie (regressieanalyse) Het verklaren van studieprestaties is op het eerste gezicht zo moeilijk niet. Wie harder werkt presteert beter en wie intelligenter is ook. Toch zijn er studenten die ondanks het harde werken matige cijfers halen en slimme studenten die beroerde cijfers halen. Hoe zit het nou echt? Liesbeth heeft de cijfers voor Inleiding in de Economie (Cijfer), de voorbereidingstijd voor dit tentamen (UrenStudie) en het IQ van 100 economiestudenten en staat op het punt deze gegevens te analyseren.

Bestand: Werkcollege 2 opdracht 2 Studieprestatie v2.savVariabelen BeschrijvingPPNO ProefpersoonnummerSexe 1=man, 2=vrouwIQ Intelligentie: Score op de WAISUrenStudie Aantal uren besteed aan studeren voor het tentamen

Inleiding in de economie.Cijfer Cijfer behaald voor Inleiding in de economie. Studieprestatie

l. Wat is je verwachting over de relatie tussen de drie variabelen UrenStudie, IQ en Cijfer? Hoe is de gezamenlijke invloed van UrenStudie en IQ op Cijfer?

Open nu ‘Werkcollege 2 opdracht 2 Studieprestatie v2.sav’ in SPSS.m. Bepaal met de one-sample t-test of de ecomiestudenten meer dan gemiddeld intelligent

zijn. Bedenk dat je in deze analyse het gemiddelde in de steekproef vergelijkt met een waarde (Test Value) die je zelf moet invullen. Tegen welke Test Value wil je hier toetsen?

n. Zijn de economiestudenten significant slimmer of dommer dan de normale populatie? Hoe zie je dat?

o. Onderzoek de relaties tussen de drie variabelen paarsgewijs, door drie verschillende scatterplots te maken: (graph > legacy dialogs > scatter): Met x is IQ en y is CijferMet x is UrenStudie en y is CijferMet x is IQ en y is UrenStudie.

17

Page 18: Syllabus Statistiek 2 2014-2015

De algemene formule voor regressieanalyse met één predictor is: y = α + βx (Zie pagina 257, Agresti &Finlay). In Pallant kun je vinden waar je de α en β (de coëfficiënten) van deze regressievergelijking in de output kunt vinden, ook de helpfunctie van SPSS kan uitkomst bieden.

p. Onderzoek nu de relatie tussen Cijfer en IQ door middel van regressieanalyse.

q. Doe hetzelfde voor de relatie tussen Cijfer en Uren studie.

r. Vul de gevonden steekproefgrootheden met standaardfouten (SE) in onderstaande tabel in.

Responsvariabele. y

Predictor x Coëfficiënt SE t p-waarde

R² van het

model1 Cijfer Intercept (α)

IQ (β)2 Cijfer Intercept (α) =

constantUrenStudie (β)

s. Beschrijf de twee gevonden relaties ieder afzonderlijk in woorden

t. Bereken vervolgens de correlaties tussen Cijfer, IQ en Uren Studie.

u. Als je regressieanalyse uitvoert kun je dat doen met meer dan één predictor. Je voert dan een zogenaamde multiple regressie uit. Met één predictor is de formule y = α + βx en met twee predictoren wordt de formule y = α + β1x1+ β2x2. Als je voor y het Cijfer invult en UrenStudie voor x1 en IQ voor x2 dan krijg je Cijfer = α + β1UrenStudie + β2IQ. Laat SPSS de coëfficiënten uitrekenen door de twee predictoren in te voeren in het vakje ‘Independent(s)’.

v. Noteer de coëfficiënten in onderstaande tabel en en stel de vergelijking op waarmee je het Cijfer kunt voorspellen met UrenStudie en IQ als predictoren.

3 Resp. Y Predictor x Coëfficiënt SE t p-waarde R²

Cijfer Intercept (α)UrenStudie (β1)IQ (β2)

18

Page 19: Syllabus Statistiek 2 2014-2015

Cijfer = …

w. Probeer de gevonden relatie in woorden te beschrijven. Wat valt je op, vooral als je kijkt naar het aantal uren studeren? Bedenk dat regressieanalyse een som (optelling) van twee effecten beschrijft. (NB: Het gaat om het effect van het aantal uren studie bij gelijkblijvend IQ)

2.3. Huiswerk Maken Problems 9.4, 9.15, 9.17, 9.30, en 8.14 uit Agresti en Finlay, Mystatlab-opgaven en

wekelijkse BB-toets week 2.

Werken aan de eindopdracht, gebruik hierbij de informatie over de datafile (Bijlage C in deze Syllabus):

Bedenk wat je zou kunnen onderzoeken. Hoeveel variabelen heb je tot je beschikking en welke relaties zou je kunnen

onderzoeken? Brainstorm hierover zodat je kunt bedenken welke hypothesen je zou kunnen gaan

onderzoeken.

In het onderzoek naar alcoholgebruik zijn een aantal variabelen gemeten, zie de lijst in Bijlage C. Merk op dat er variabelen zijn die op 16-jarige leeftijd gemeten zijn, maar ook variabelen die prenataal en op de leeftijd van 12 maanden gemeten zijn. Er zijn ook enkele achtergrondgegevens gemeten.

Bedenk in ieder geval 5 hypothesen (later kun je kiezen welke 3 je voor je verslag gebruikt) en zet erbij waarom je een hypothese bedenkt. Formuleer bijvoorbeeld een hypothese over:a. Kwaliteit van gehechtheid en temperament toen de jongeren nog 12 maanden

waren;b. Of over de relatie tussen alcoholgebruik van de jongeren en twee

achtergrondvariabelen;c. Of over de relatie tussen alcoholgebruik van de jongeren en alcoholgebruik van de

twee beste vrienden, attentieproblemen en spanningsbehoefte;d. Et cetera: wat je maar interessant vindt en kunt bedenken met bovenstaande

variabelen.

NB: je moet uiteindelijk 3 verschillende statistische analysetechnieken kunnen gebruiken voor het toetsen van 3 hypothesen. Probeer variatie in je hypothesen aan te brengen, zodat je later bij de keuze van 3 van je hypothesen voor je eindverslag ook daadwerkelijk

19

Page 20: Syllabus Statistiek 2 2014-2015

gebruik kunt maken van verscheidene statistische analysetechnieken. Denk daarbij aan variatie in meetniveau’s van de predictor- en responsvariabelen.

Zie bijlage E voor tips voor het formuleren van hypothesen!

Zet die hypothesen op papier en lever twee dagen voor werkcollege 3 in bij de docent per email. Als je dit doet kan de docent je helpen met het opstellen en formuleren van goede hypothesen. In werkcollege 3 worden de hypothesen aan de hand van de feedback van de docent verder besproken. Je krijgt geen persoonlijke feedback op je hypothesen, de docent bekijkt de hypothesen om de meest gemaakte fouten eruit te halen zodat iedereen in werkcollege 3 aan de slag kan met het verbeteren van de hypothesen.

NB: Lever je hypothesen per email bij de docent in (twee dagen vóór aanvang van het werkcollege) en neem je hypothesen ook mee naar werkcollege 3!

Tip 1: Formuleer je hypotheses op variabele niveau (noem dus de variabelen in je hypothese). Zie voor tips bijlage E: Waar op te letten.Tip 2: Pas ervoor op dat je een continue variabele niet als dichotome variabele behandelt.Tip 3: maak gebruik van een schema per hypothese: geef aan met pijlen wat op wat volgt of wat met wat verband houdt, welke richting uit. In Word kun je met invoegen van ‘SmartArt’ leuke plaatjes invullen die je inzicht geven in de relaties. De formulering van je hypothese is daarna een fluitje van een cent. Bijvoorbeeld:

alcoholgebruik

ouderlijk toezicht

alcoholgebruik beste vrienden

20

Page 21: Syllabus Statistiek 2 2014-2015

WERKCOLLEGE 3:

Inleveren hypothesen: twee dagen vóór werkcollege 3 per email bij de docent

3.1. Bespreken opgaven uit Agresti en Finlay.3.2. Oefening ‘Relaties’3.3. Eindopdracht: hypothesen 3.4. Schrijven van Inleiding en Methode3.5. Huiswerk

NB: Neem Agresti en Burton mee!Plus: meenemen Hypothesen.Voorbereiden voor werkcollege 3: H9 en 11. Week drie hoorcollege: Multipele regressie, H11 (niet 11.3), plaatjes 14.2, H12 1-3.

Doel leren herkennen type relaties hypothesen opstellen voor eindopdracht

3.1. Bespreken opgaven uit Agresti en Finlay.Er is nu gelegenheid om over de Agresti en Finlay-opgaven van het huiswerk behorende bij werkcollege 1 en 2 vragen te stellen. Eventueel kunnen ook vragen gesteld worden over de BB-opgaven.

3.2. Oefening ‘Relaties’Tijdens afgelopen werkcolleges heb je gezien hoe de relatie tussen twee variabelen door een andere variabele wordt beïnvloed. Als je rekening hield met intelligentie bleek het effect van het aantal uren studeren er opeens toe te doen. Regressieanalyse, variantieanalyse en andere modellen met meer dan één predictor maken het mogelijk om psychologisch en pedagogisch interessante oorzaak-gevolg relaties te onderzoeken. (Al moet je wel bedenken dat de statistische technieken nooit causale relatie kunnen aantonen).

Tijdens dit werkcollege oefen je in het denken over diverse relaties. Hieronder zie je een overzicht ontleend aan Agresti & Finlay (p. 315), zoals dat afgelopen week tijdens college is besproken.

21

Page 22: Syllabus Statistiek 2 2014-2015

Figuur 1: Voorbeelden van causale relaties tussen drie variabelen

Opdracht: Interpretatie van gegevens: De relaties zoals die in Figuur 1 staan, kun je ook op grond van beschrijvingen en analyses van verzamelde gegevens herkennen. Hierna volgen de uitkomsten van een aantal onderzoeken. Trek zo goed mogelijk inhoudelijke conclusies. Maak gebruik van Figuur 1 om de relaties te beschrijven.

Opdracht a: Beslissen. In een fictief experimenteel onderzoek doen 30 patiënten met schade aan de Prefrontale Cortex mee en 30 anderen in een gematchte controle groep. De helft van iedere groep doet een leertaak zonder beloning en de andere helft doet dezelfde leertaak met beloning. In de figuur hiernaast zie je de gemiddelde prestaties (de bolletjes) van de groep patiënten met schade aan de Prefrontale Cortex (dichte bolletjes) en de Controle groep (open bolletjes) in de condities zonder en met beloning. Benoem de gevonden relatie aan de hand van de relaties in Figuur 1.

b.1. Welke relatie zoals beschreven in Figuur 1 is hier van toepassing en waarom.Interactie: x1 = schade, x2 = beloning, y = prestatie

b.2. Trek een conclusie over de relatie tussen Leerprestatie, schade hebben aan de Prefontale Cortex en BeloningBeloning heeft een positief effect op de prestatie van mensen zonder schade aan Prefrontale Cortex. Beloning heeft een klein effect op de prestatie van mensen met schade aan Prefrontale Cortex.

Optioneel: Opdracht b: Hangjongeren. In onderstaande tabel 1 (gebaseerd op inzichten van Trees Pels) zie je de aantallen jongeren, autochtoon en allochtoon die wel of niet aan te wijzen zijn als hangjongeren. ‘Thuis’ is geen hangjongere; ‘Hangen’ is hangjongere. De linker tabel laat zien dat 162 van 250 allochtone jongeren hangjongere is, terwijl dat maar voor 48 van de 250

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

Prestatie

Controle

patiënten

Zonder Met Beloning Beloning

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

X1 X2

X2 X1 Y

X2 X1 X2 Y Y

Y X1 Y X1 X2

Spurieus Ketting Interactie Meer Oorzaken Direct & Indirect(X1Y verband)

22

Page 23: Syllabus Statistiek 2 2014-2015

autochtone jongeren geldt. De gegevens in de linker tabel zijn in de twee rechter tabellen uitgesplitst naar de opvoeding die de jongeren krijgen: niet-autoritair versus autoritair.

a.1. Welke relatie zoals beschreven in Figuur 1 is hier van toepassing en waarom.

a.2. Geef op grond van deze uitsplitsing een interpretatie van de relatie tussen de drie variabelen: Afkomst (Autochtoon versus Allochtoon), Hangjongere (Thuisblijver versus hangjongere) en Opvoeding (Niet-Autoritair versus Autoritair).

Tabel 1.Samen Niet Autoritair AutoritairThuis Hangen Thuis Hangen Thuis Hangen

Autochtoon 202 48 Aut. 192 8 Aut. 10 40Allochtoon 88 162 All. 48 2 All. 40 160

Optioneel: Opdracht c: Emotieherkenning. In een onderzoek naar emotieherkenning hebben deelnemers ieder voor zich 25 foto's beoordeeld met een neutrale, boze, droevige of angstige gezichtsuitdrukking. Een hoge score op de Emotie Herkenningstaak (EH) geeft aan dat men goed in staat is negatieve emoties te herkennen. Ook is bekend hoe iedere deelnemer zich op het moment voelt (gemeten via de Negative Affect Scale: NA). Hoge scores duiden op een negatieve stemming. Tot slot is de mate van depressiviteit gemeten met de BDI. Hoge scores op de BDI duiden op depressiviteit.

Twee enkelvoudige regressieanalyses (a en b) en een multiple regressieanalyse (c) gaven het volgende resultaat

a) Em.Herkennen = 6 + 3 * (NegatieveStemming)b) Em.Herkennen = 4 + 4* (Depressiviteit)c) Em Herkennen = 6 + 3 * (NegatieveStemming) + 0.0 (Depressiviteit)

c.1. Welke relatie zoals beschreven in Figuur 1 is hier van toepassing en waarom.

c.2. Maak gebruik van de relaties in Figuur 1 en deze resultaten om de invloed van Depressiviteit en Negatieve Stemming op het Herkennen van emoties te karakteriseren.

3.3. Eindopdracht: hypothesen over complexe relatiesIn dit werkcollege werk je nu verder aan je hypothesen die je hebt meegenomen en hebt ingeleverd bij de docent. Aan het eind van de les moet je in staat zijn de hypothesen te verwerken in het eerste tussenverslag. In de Inleiding onderbouw je de hypothesen en in de Methode beschrijf je hoe de hypothesen onderzocht zijn.

23

Page 24: Syllabus Statistiek 2 2014-2015

Een hypothese is een toetsbare bewering waarin duidelijk wordt wat de variabelen zijn en welk verband er is tussen de variabelen. In het onderzoek naar alcoholgebruik zijn een aantal variabelen gemeten, zie de lijst in Bijlage C. Hieronder een samenvattende tabel:

Gedrag op 16-jarige lftOverige op 16-jarige lft Achtergrond-

gegevens

Genetische, prenatale en factoren in vroege jeugd.

Alcoholgebruik Alcoholgebruik beste vrienden

Sekse ADH1B gen

Attentieproblemen Ouderlijk toezicht SES Roken moeder tijdens zwangerschap

Spanningsbehoefte Alcohol drinken moeder tijdens zwangerschapGehechtheidNegatief reactief temperament

Je hebt, gebruikmakend van deze variabelen, vijf verschillende hypothesen over het ontstaan van alcoholgebruik geformuleerd.

De hypothesen moeten verschillende causale relaties beschrijven, overeenkomstig de relaties zoals beschreven in Hoofdstuk 10 van Agresti & Finlay en samengevat in Figuur 1 van de hierbovenstaande ‘oefening Relaties’. Als het goed is heb je hypothesen verzonnen die de lezer (van je eindverslag) inzicht geven in de (risico-) factoren in het ontstaan van alcoholgebruik op 16-jarige leeftijd en beschrijven ze minimaal een aantal van de ‘Relaties’.

NB: Sommige hypothesen kun je nu nog niet toetsen omdat je de uitleg over die toetsen nog niet gehad hebt: de docent kan je hierin adviseren. Advies: Pas op voor te ingewikkelde hypothesen. Het is een goed gebruik om eerst eenvoudige hypothesen te onderzoeken. Later kun je die hypothesen uitbreiden als je meer kennis hebt over de data. Kijk niet gek op als je over een paar weken, andere, ingewikkelder hypothesen formuleert. Maar dat kan pas als je eenvoudig begint.

a. Voor de eindopdracht moet je minimaal 3 hypothesen verwerken. Ga na of je hypothesen aan de eisen voldoen en of je ze moet aanpassen.

b. Ga na welke 3 hypothesen je graag in je verslag zou willen verwerken. Leg de gekozen hypothesen voor aan de docent om er zeker van te zijn dat je op de goede weg zit.

c. Bedenk wat voor informatie je nodig hebt om een goede inleiding te kunnen schrijven waarin je de hypothesen kunt onderbouwen: wat zijn de variabelen en welke literatuur sluit daarop aan. Eventueel: wat zijn je zoektermen om goed naar artikelen te kunnen zoeken? Thuis kun je die artikelen opzoeken en in je Inleiding verwerken.

24

Page 25: Syllabus Statistiek 2 2014-2015

d. Bedenk hoe je de Methoden zou kunnen opzetten: welke onderwerpen moet je daarin kwijt? Wat voor onderzoeksdesign kun je bedenken om je hypothesen te kunnen onderzoeken, daarbij natuurlijk gebruikmakend van de dataset die je tot je beschikking hebt. Je mag de Methoden helemaal zelf verzinnen. Je hebt bij Methodologie 1 onderzoeksdesigns gehad, daar kun je gebruik van maken en je weet welke variabelen je wilt onderzoeken. Daar kun je passende Materialen- en Proceduresecties bij verzinnen. Voor het onderdeel Respondenten kun je gebruik maken van de dataset.

3.4. Schrijven van Inleiding en MethodenBesproken wordt hoe de Inleiding en Methoden geschreven moeten worden.

3.5. Huiswerk

1. Maken Problems 11.1, 11.11, 11.12, en 14.6 uit Agresti en Finlay, Mystatlab-opgaven en wekelijkse BB-toets week 3.

2. Eindopdracht:

a) Schrijf het eerste tussenverslag Inleiding en Methode en lever het in op blackboard (button ‘Inleveren opdrachten’) vóór aanvang van werkcollege 4. Zie voor de eisen aan het eerste tussenverslag Bijlagen A en B en Burton.

b) Neem de (aangepaste) hypothesen mee naar werkcollege 4. Tijdens dat werkcollege krijg je de kans om een eerste stap te zetten in het empirisch toetsen van de hypothesen met SPSS onder begeleiding van de docent.

3. Bestudeer Bijlage D: Data-analyseplan.

NB: Neem je geformuleerde hypothesen mee naar werkcollege 4 en ga gelijk naar de computerruimte.

25

Page 26: Syllabus Statistiek 2 2014-2015

WERKCOLLEGE 4: Computerpracticum

Inleveren Eerste tussenverslag: Inleiding en Methode vóór werkcollege 4 op blackboard.

4.1. Computerpracticum: ANOVA4.2. Eindopdracht: data-inspectie.4.3. Huiswerk

NB: Neem Agresti en Pallant mee!NB: ga gelijk naar de computerruimte in de kelder van het Transitorium en dus niet eerst naar de werkgroepzaal.

Hoorcolleges week 4: Oneway Anova, H12 par 1-3, 6

Doelen werkcollege: met syntax leren werken Anova en regressie met dummy’s: hoe verhoudt dat zich tot elkaar data-inspectie eindopdracht.

4.1. Computerpracticum: ANOVA

Deze week maak je tijdens de colleges kennis met Variantieanalyse (ANOVA). ANOVA wordt gebruikt om de gemiddelden tussen meer dan twee groepen te vergelijken. Als eerste voeren we echter een regressieanalyse uit met zogenaamde dummyvariabelen. Dat zijn variabelen die door een 1 of een 0 aangeven of een kenmerk respectivelijk wel of niet op iemand van toepassing is. Met regressieanalyse ben je inmiddels vertrouwd.

Interesse en Studierichting. Karel doet onderzoek naar interesses. (Een interesse is een blijvende tendens om aandacht te schenken aan en plezier te hebben in een activiteit of inhoud). Hij heeft met de BIT (Evers, Lucassen, & Wiegersma 2008) de interesses gemeten van studenten economie, psychologie en pedagogiek. Hij vraagt zich af of er verschillen bestaan tussen studenten van verschillende studierichtingen in interesse in sociale beroepen.

Tabel 4.1Bestand: Werkcollege 4 opdracht 1 Interesse v1.sav

Variabelen BeschrijvingPPNO ProefpersoonnummerStudierichting 1=Economie, 2 = Psychologie, 3 = PedagogiekBaMa 1=Bachelor, 2=MasterDum_psy Dummy Psychologie: 0 = Andere studie, 1 = PsychologieDum_ped Dummy Pedagogiek: 0 = Andere studie 1 = Pedagogiek

Interesse Interesse in sociale beroepen (normscores: 1 t/m 100)

26

Page 27: Syllabus Statistiek 2 2014-2015

Het databestand bevat behalve de kwantitatieve responsvariabele Interesse, de categorische predictor Studierichting met drie niveaus en de eveneens categorische predictor BaMa met twee niveaus. In Tabel 4.1 vind je de lijst van de variabelen.

De dummyvariabele Dum_psy heeft de waarde (score) 1 als de deelnemer psychologie studeert en anders de waarde 0. Evenzo heeft Dum_ped de waarde 1 als de deelnemer pedagogiek studeert en anders de waarde 0. (Zie Agresti & Finlay, 2009, p. 379).

Al met al zal blijken dat regressieanalyse met dummyvariabelen overeenkomt met ANOVA en omgekeerd.

a. Welk verschil in interesse in sociale beroepen verwacht je tussen de drie groepen studenten? i) Een verschil in interesse tussen economie en psychologieii) Een verschil in interesse tussen economie en pedagogiekiii) Geen verschil in interesse tussen pedagogiek en psychologie

Open het data bestand ‘Werkcollege 4 opdracht 1 Interesse v1.sav’ in SPSS. Tip: werk met de syntax (kijk in Pallant hoe dat moet)

b. Bereken de gemiddelde interesse voor de studenten uit de drie studierichtingen en vul de gemiddelden in onderstaande Tabel 4.2 (2e kolom) in. i) *

c. Wie hebben de meeste interesse in sociale beroepen en wie de minste? i) Pedagogiek heeft de meeste, Economie heeft de minste

d. Pas vervolgens het multiple regressiemodel toe met responsvariabele Interesse in sociale beroepen en de twee predictoren Dum_psy en Dum_ped. (Zie Agresti & Finlay, 2009, p. 379). Het gaat om het model: Interesse = α + β1 Dum_Psy + β2

Dum_Ped. Voer de analyse uit en vul vervolgens de waarden van de intercept α en de coëfficiënten β1 en β2 in in de vierde kolom van Tabel 4.2.

Tabel 4.2

27

Gem. Interess

e

Coëfficiënten Regressieanalyse

Voorspelde score

Economie 49.94 α 49.94 49.94Psychologie 56.72 β1 6.78 56.72Pedagogiek 58.66 β2 8.72 67.38

Page 28: Syllabus Statistiek 2 2014-2015

e. Zie je de overeenkomsten tussen de gemiddelden en de regressiecoëfficiënten? (1)

Om deze overeenkomsten te begrijpen moet je bedenken wat het regressiemodel met twee predictoren inhoudt. Het is een som of vergelijking waarmee je voor ieder individu op grond van de intercept, regressie coëfficiënten en de waarden van de predictoren voor iedere deelnemer zijn/haar voorspelde score kunt berekenen op, in dit geval, de variabele ‘interesse in sociale beroepen’. Een economiestudent heeft de score 0 op Dum_Psy en evenzo de score 0 op Dum_ped. Je kunt zijn of haar voorspelde score dus berekenen met:

Voorspelde interesse (Econ.) = α + β1 * 0 + β2 *0. En een psychologiestudent heeft de score 1 op Dum_psy en de score 0 op Dum_ped. Je kunt zijn of haar voorspelde score dus berekenen met:

Voorspelde interesse (Psy) = α + β1 * 1 + β2 * 0. En als laatste een pedagogiekstudent heeft de score 0 op Dum_psy en de score 1 op Dum_ped. Je kunt zijn of haar voorspelde score dus berekenen met:

Voorspelde interesse (Ped) = α + β1 * 0 + β2 * 1.

f. Voer de berekeningen uit en vul de berekeningen van de voorspelde scores in kolom vijf (‘Voorspelde score’) van Tabel 4.2 in. En wat valt op? (1) Dat de voorspelde score op Economie hetzelfde is als de gemiddelde score op

interesse.

g. Neem nu de Sum of Squares (SS) over uit de output van de door jou uitgevoerde regressieanalyse met dummy variabelen in kolom 2 van de tabel hieronder: Tabel 4.3. (de reden waarom je dit doet wordt straks duidelijk) De totale kwadratensom (de som van alle gekwadrateerde afwijkingsscores) wordt bij regressieanalyse in twee delen gesplitst: 1) In de kwadratensom van de scores die voorspeld worden door de predictoren Dum_psy en Dum_ped (de Sum of squares due to regression; SS-reg) en 2) in het niet voorspelde of onverklaarde deel, de Sum of Squared errors; SS-residual.

Met de F-toets die ook in de uitvoer staat vermeld kun je nagaan of de kwadratensom van voorspelde scores significant groter is dan nul. Vul de df, MS in de derde en de vierde kolom in van tabel 4.3. Vul de F- en p-waarden in de vijfde kolom van Tabel 4.3 in.

Tabel 4.3Regressieanalyse Variantieanalyse

SS df MS F SS df MS F

28

Page 29: Syllabus Statistiek 2 2014-2015

p pSS Regression 1080.34 2 540.17 3.852

.025SS 1080.34 2 540.17 3.852

.025SSResidual 11497.55 82 140.21 SS-error 11497.55 82 140.21SS Total 12577.89 84 SS-tot 12577.89 84

Variantieanalyse (Anova) is een statistische techniek om gemiddelden te vergelijken tussen groepen. Anova wordt vaak toegepast als analysetechniek bij experimenten. Bijvoorbeeld om na te gaan of er verschillen zijn op de responsvariabele tussen experimentele en controle groepen. Anova kan echter ook gebruikt worden voor niet experimenteel onderzoek. Bijvoorbeeld om het verschil in interesse tussen Economen, Psychologen en Pedagogen te analyseren. Omdat hier sprake is van één categorische variabele of ‘between-subject factor’ (met drie niveaus) spreekt men van One-Way Analysis of variance (Eenwegsvariantieanalyse).

h. Voer in SPSS de one-way ANOVA uit om de gemiddelde interesse in sociale beroepen van de drie verschillende groepen studenten te analyseren. Kies bij de opties voor descriptives. (1) *

i. Neem de resultaten over in Tabel 4.3 (7e t/m 10e kolom). Interpreteer de uitkomst: wat betekent de uitkomst van de F-toets? (1) Dat de nulhypothese verworpen kan worden, de variantie die je wel kunt

verklaren is significant.

j. Wat valt op als je de uitkomst van de regressieanalyse en variantieanalyse vergelijkt?(1) De Sum of Squares, het aantal vrijheidsgraden, de Mean Square, de f-score en de

p-waarde zijn hetzelfde bij de regressieanalyse en de variantieanalyse.

k. Probeer te verklaren wat de Between Sum of Squares en de Within Sum of Squares betekenen (zie o.a blz 375 van Agresti & Finlay, 2009). (1)

4.2. Eindopdracht: data-inspectieJe kunt de dataset die je nodig hebt vinden in ‘File Exchange’ van je groep in blackboard: Tools Groups klik op je groep File Exchange

Aan de hand van de hypothesen die je hebt geformuleerd over de oorzaken van alcoholgebruik inspecteer je in dit werkcollege allereerst je data met eenvoudige analyses om later (in werkcollege 6) de hypothesen te analyseren met geavanceerdere technieken. Dit is gebruikelijk. Je bent als onderzoeker nieuwsgierig naar je dataset! Je beschrijft een aantal kenmerken van de

29

Page 30: Syllabus Statistiek 2 2014-2015

steekproef, bij wijze van informatie aan de lezer, maar ook om je dataset goed te leren kennen voordat je meer ingewikkelde analyses gaat uitvoeren.

In Bijlage C vind je de uitleg van de variabelen en hieronder voor het gemak de samenvatting van die tabel in Tabel 4.4. In Bijlage D vind je een handig hulpmiddel: het data-analyseplan.

Tabel 4.4

Gedrag op 16-jarige lft Overige op 16-jarige lft

Achtergrond-gegevens

Genetische, prenatale en factoren in vroege jeugd.

Alcoholgebruik Alcoholgebruik beste vrienden

Sekse ADH1B gen

Attentieproblemen Ouderlijk toezicht SES Roken moeder tijdens zwangerschap

Spanningsbehoefte Alcohol drinken moeder tijdens zwangerschapGehechtheidNegatief reactief temperament

Open de dataset (te vinden onder ‘file exchange van je groep) en bekijk de variabelen. Vergelijk deze met bovenstaande tabel en controleer de meetniveau’s.

Stappenplan:i) Bekijk je hypothesen; welke variabelen wil je onderzoeken? Welke variabelen kun je

nu verkennen? (1) Wel of niet roken tijdens zwangerschap (dichotoom)(2) Wel of niet alcohol drinken tijdens zwangerschap (dichotoom)(3) Mate van spanningsbehoefte (continue)(4) Mate van sociaaleconomische status (continue)(5) Wel of geen risicoallel G (dichotoom)(6) Mate van ouderlijk toezicht (continue)

ii) Noteer van de variabelen de meetniveau’s(1) Zie hierboven

iii) Bekijk de verdelingen van de relevante variabelen. Maak zo veel mogelijk gebruik van afbeeldingen of grafieken. De Boxplot van een variabele, al dan niet voor verschillende groepen geeft al veel inzicht. (Zie Agresti hoofdstuk 3). Tref maatregelen als er uitbijters zijn. Noteer je bevindingen goed!

iv) Als je geïnteresseerd bent in relaties maak dan scatterplots met die variabelen. Als je chartbuilder gebruikt kun je makkelijk regressielijnen toevoegen (graphs>chartbuilders>maak keuze uit het menu en voeg variabelen toe. Heb je eenmaal een figuur dubbelklik op de output en je kunt regressielijnen toevoegen. Een kwestie van proberen)

v) Werk met de syntax en sla de syntax goed op. vi) Sla ook je output goed op: verzin handige namen voor je output, zodat je later

makkelijk je analyses kunt terugkijken.

30

Page 31: Syllabus Statistiek 2 2014-2015

vii) Interpreteer de uitkomsten.

Tip: Je toetst nu de hypothesen empirisch door de data te analyseren. Mogelijk kom je erachter dat er betere of andere hypothesen te formuleren zijn die je meer aanspreken (er bestaat geen ‘enige juiste’ oplossing, iedereen kan het net even anders geformuleerd hebben of met andere variabelen hebben gewerkt, dat is geen probleem, het gaat erom dat het goed doordacht is). Je kunt dan je hypothesen nog aanpassen. Je moet je in ieder geval realiseren om wat voor soort relatie het gaat. Voor je eindverslag kun je de aanpassing in je Inleiding doorvoeren (meestal moet je dan ook een kleine aanpassing doen in de beschrijving van variabelen, maar ingrijpend is dat meestal niet).

NB 1: Noteer de resultaten goed. Je kunt de analyses mogelijk gebruiken om de steekproef te beschrijven (volgens de APA regels in de Resultatensectie of onder Participanten van je Methodesectie van je tweede tussenverslag).

NB 2: Sla de output goed op, zodat je het later nog na kunt kijken! Nog beter is het om de SPSS-commando’s te bewaren in een syntaxfile, zodat je deze later makkelijk kunt overdoen als dat nodig is.

4.3. Huiswerk

Maken Problems 12.2, 12.4, 12.8, 12.12 en 12.15 uit Agresti en Finlay, Maken Mystatlab-opgaven en wekelijkse BB-toets week 4. Bestudeer Bijlage D: Data-analyseplan. Maak opdracht 4.2 af en stel je vragen daarover in werkcollege 5.

31

Page 32: Syllabus Statistiek 2 2014-2015

WERKCOLLEGE 5:

5.1. Bespreken huiswerk.5.2. Feedback eerste tussenverslag5.3. Oefenen data-analyseplan 5.4. Oefening ANOVA5.5. Huiswerk

NB: Neem Agresti mee!

Hoorcollege week 5, factoriële Anova en Ancova: H12 par 4-5, H13.H12 (4-5) en H15(log reg) voorbereiden voor werkcollege 6.

Doel: data-analyseplan leren gebruiken leren werken met ANOVA

5.1. Bespreken huiswerk.Er is nu gelegenheid om Agresti en Finlay-opgaven en de overige opdrachten uit het huiswerk behorende bij werkcollege 3 en 4 te bespreken. Studenten stellen vragen die (bij voorkeur) door studenten worden beantwoord.

5.2. Feedback op eerste tussenverslagJe krijgt van de docent via Turnitin persoonlijke feedback op je verslag.

5.3 en 5.4: InleidingInmiddels heb je kennis gemaakt met multiple regressieanalyse (hoofdstuk 11) en ANOVA (hoofdstuk 12) en heb je geleerd dat je met behulp van multiple regressieanalyse met dummyvariabelen ANOVA kunt uitvoeren. Deze week en volgende week leer je tijdens colleges hoe je beide technieken kunt combineren.

In deze syllabus wordt verdieping gegeven over twee onderwerpen: rekenen met ANOVA en Data-analyse.

1. Het eerste onderwerp is het Data-analyseplan (5.3). Hoe gebruik je je statistische kennis om data te analyseren? Welke analyse moet ik doen? Data analyse wordt vaak omschreven als een kunst (‘The art of data analysis’). Om je de kunst te leren, oefenen we vandaag met het maken van een data-analyseplan.

2. Ten tweede gaan we in op ANOVA (5.4). Met ANOVA wordt getoetst of groepen verschillen in gemiddelden aan de hand van variantie (verschillen) tussen en binnen groepen. Deze toets kan worden gebruikt wanneer de afhankelijke variabele een numeriek meetniveau heeft, en de onafhankelijke variabele(n) categorisch zijn.

32

Page 33: Syllabus Statistiek 2 2014-2015

a. Je voert vandaag eerst een variantieanalyse uit langs intuïtieve weg. Doel is dat je beter begrijpt wat met de termen 'within variance' en 'between variance' wordt bedoeld en hoe die samen tot statistische conclusies leiden.

b. Intuïtief begrip alleen is natuurlijk niet genoeg, daarom ga je ook (met de hand) rekenen en leer je hoe je de output van een ANOVA moet lezen. In SPSS wordt ANOVA, zeker als er meerdere factoren in het spel zijn, uitgevoerd met de procedure General Linear Model (GLM-univariate).

c. Vervolgens vergelijk je de output en eigen rekenwerk met je intuïties.

5.3. Oefening data-analyseplanBestudeer Bijlage D: Data-analyseplan. Je ziet in het ‘Voorbeeld data-analyseplan’ dat er om een hypothese te toetsen al minimaal zeven analyses zijn uit te voeren! Zoals je ziet is de keuze van de analyse bepaald door gebruik te maken van de lijst ‘Welke statistische methode’.

a. Maak nu een analyseplan voor één van de volgende drie onderzoekjes. Maak gebruik van ‘Welke statistische methode’.

Onderzoek 1. Een onderzoeker denkt dat meer slapen (gemeten in minuten) tot beter schoolprestaties leidt (continue Cito-score). Zijn verklaring is dat meer slapen tot een beter werkgeheugen (continue variabele) leidt, wat weer leidt tot betere schoolprestaties. Hoe ziet het analyseplan eruit?

Onderzoek 2. Een onderzoeker wil de bewering toetsen dat meisjes op jonge leeftijd taalvaardiger zijn dan jongens, maar dat jongens deze achterstand later inhalen. Zij maakt gebruik van de zogenaamde één-minuut-test om taalvaardigheid (continue variabele) te meten bij een groep zesjarige kinderen (helft jongens) en gebruikt dezelfde test om de taalvaardigheid te meten bij een groep twaalfjarige kinderen (eveneens helft jongens). Maak een analyseplan om na te gaan of meisjes op jonge leeftijd taalvaardiger zijn, en dat jongens de achterstand later inhalen. Hoe ziet het analyseplan eruit?

INTERACTIEo Sexe = cat = x1 (+ descriptieve gegevens)o Leeftijd = cat = x2 (+ descriptieve gegevens)o Taalvaardigheid = cont = y (+ descriptieve gegevens)

Enkelvoudig verband: effect van sexe op taalvaardigheid? Enkelvoudig verband: effect van leeftijd op taalvaardigheid?

Multipele verbanden: ANOVA

Onderzoek 3: Een onderzoeker wil weten hoe depressie bij adolescenten ontstaat. Zijn hypothese is dat agressie beschermt tegen het ontstaan van depressie. Hij houdt rekening met de mogelijkheid dat dit effect sterker is voor jongens. Zowel depressie als agressie zijn beide gemeten met tests (continue variabelen). Geslacht is, vanzelfsprekend, categorisch. Hoe ziet het analyseplan eruit?

5.4. Oefening ANOVA

33

Page 34: Syllabus Statistiek 2 2014-2015

ANOVAStel je de volgende situatie voor: een tweetal basisscholen in de provincie Utrecht kampt met ordeproblemen in groep 2. Omdat vroege ordeproblemen voorlopers kunnen zijn van latere gedragsproblemen besluiten de samenwerkende scholen de Utrechtse schoolbegeleidingsdienst in te schakelen. De scholen heten respectievelijk Zon en Maan. Zon is een school in en stadsvernieuwingswijk met een in veel opzichten zeer heterogene bevolking. Maan is een school in een nieuwbouwwijk van een forensendorp dicht bij Utrecht. De bevolking in deze wijk is in veel opzichten behoorlijk homogeen. Beide scholen hebben elk drie groepen 2.

Het eerste wat de pedagoog van de schoolbegeleidingsdienst doet is de scholen bezoeken om het ordeprobleem in kaart te brengen. Zij gebruikt een goed gevalideerde methode om de ernst van het ordeprobleem in iedere groep te bepalen. De methode werkt als volgt: als eerste worden met behulp van de namenlijst a-select (random) drie kinderen gekozen in iedere groep. Een getrainde observator observeert de kinderen om en om gedurende tien minuten, waarbij gebruik wordt gemaakt van een coderingsschema. In totaal wordt ieder kind zes keer geobserveerd. (De methode waarbij kinderen om en om gedurende een vast tijdsinterval worden geobserveerd noemt men 'scansampling'). Daarna wordt voor ieder kind een score berekend op een schaal van 1 tot en met 7. (Een hogere score geeft aan dat het betreffende kind voor grotere ordeproblemen zorgt).

Iedereen weet dat de ene onderwijzer beter orde kan houden dan de andere. Daarom onderzoekt de pedagoog van de schoolbegeleidingsdienst allereerst of er verschillen in gemiddelde ordeprobleem zijn tussen verschillende groepen in iedere school. Als dat het geval is zal zij de leerkrachten individueel coachen en anders gezamenlijk.

Zij weet dat het gebruik van beelden makkelijker communiceert dan alleen getallen. Daarom heeft ze de scores van de kinderen (drie per klas) grafisch weergegeven. Zij laat aan de schoolleiding van Zon de volgende figuur zien. Ieder staafje stelt een kind met een score voor. Hoe langer het staafje hoe meer ordeproblemen het kind veroorzaakt. (A, B en C zijn de drie verschillende groepen 2)

34

Page 35: Syllabus Statistiek 2 2014-2015

Zij vertelt aan de directie van Zon dat er weliswaar ordeverschillen zijn tussen de groepen A, B en C, maar dat die verschillen relatief klein zijn en in statistisch opzicht niet significant, als je rekening houdt met verschillen binnen klassen.

Aan de schoolleiding van Maan laat zij de volgende figuur zien. Ook hier stelt ieder staafje een kind met een score voor. A, B en C zijn de drie verschillende groepen 2. Zij vertelt de directie van Maan dat de verschillen tussen groepen relatief groot zijn en in statistische opzicht significant.

ZON A

o 1, 3, 5 3 B

o 3, 5, 7 5 C

o 2, 4, 6 4MAAN

Ao 2,5; 3; 3,5 3

Bo 4,5; 5; 5,5 5

C o 3,5; 4; 4,5 4

F=SSbetween/ df

SSwithin/df

35

Page 36: Syllabus Statistiek 2 2014-2015

Vragen:

a. Ben je het met de conclusie van de pedagoog eens? Leg uit waarom.i) Omdat de tussengroepsverhouding hetzelfde is en de binnengroepsverhouding

bij maan kleiner is,

b. Kun je uitleggen waarom de verschillen in ordeproblemen relatief groot zijn bij Zon en relatief klein bij Maan?

i) verhouding tussen de groepen en binnen de groepen is bij maan dus het grootst

c. De zogenaamde between variantie heeft betrekking op verschillen tussen gemiddelden. Wijs in bovenstaand figuren de between c.q. tussen groep verschillen aan. Is er een verschil tussen beide scholen in between variantie?i) Ja, gemiddelden zijn gelijk, dus SSbetween is ook gelijk

d. De within variantie heeft betrekking op verschillen binnen groepen. Wijs in

bovenstaande figuren de within variantie aan. Is de within variantie in beide scholen verschillend? i) Ja, maan heeft een kleinere SSwithin, zon heeft een grotere SSwithin

e. Bij welke school is de between variantie in verhouding tot de within variantie het grootst? Hoe ondersteunt deze uitkomst de uitspraken van de pedagoog? i) ZON, verhouding tussen de groepen en binnen de groepen is bij maan dus het

grootst

Je hebt zojuist een ‘variantieanalyse’ gedaan, door de variantie tussen groepen te vergelijken met varianties binnen groepen. Bij Maan was de variantie tussen groepen groot in vergelijking met de variantie binnen groepen.

De volgende stap is om de ‘varianties’ tussen en binnen groepen te bereken zodat je je inzicht kunt onderbouwen. In het college is de volgende tabel daarvoor gepresenteerd. In plaats van de varianties berekenen we kwadratensommen.

SSbetween=∑ ( y1− y )2

SSwithin=∑ ( y− y1)2

SSbetween=∑ ( yi− y )2

Rekenschema kwadraten sommen:Variabelen

xi yi

SStotaal

( y i−0)2

GroepsGemiddeldey i

SSbetween

( y i− y )2

SSError

( y i− y i)2

SScorrected total

( y i− y )2SSIntercept

( y−0)2

36

Page 37: Syllabus Statistiek 2 2014-2015

A1 1 *** ***A2 3 *** ***A3 5 *** ***B1 3 *** ***B2 5 *** ***B3 7 *** ***C1 2 *** ***C2 4 *** ***C3 6 *** ***

∑ *** = hoeft niet ingevuld te worden

Vul het schema in op basis van de data van Zon (kolom 1)f. Bereken het gemiddelde over alle waarnemingen y.

g. Vul de groepsgemiddelden in.

h. Bereken SSbetween (schrijf de kwadraten in de vierde kolom tel deze op in de onderste rij van het rekenschema)

i. Bereken SSerror (schrijf de kwadraten in de vijfde kolom en tel deze op in de onderste rij van het rekenschema).

Interpreteer de uitkomsten: j. Vergelijk je resultaten met onderstaande computer uitvoer van GLM.

k. Waaraan kun je zien of er wel of geen significante verschillen tussen de groepen zijn? Is het verschil significant?

l. Beredeneer (reken na) hoe de F-waarde van het verschil tussen groepen tot stand komt.

37

Page 38: Syllabus Statistiek 2 2014-2015

Tests of Between-Subjects Effects School ZonDependent Variable:OrdeverstoringSource Type III Sum

of Squares dfMean

Square F Sig.Corrected Model

6,000a 2 3,000 ,750 ,512

Intercept 144,000 1 144,000 36,000 ,001Groep(ABC) 6,000 2 3,000 ,750 ,512Error 24,000 6 4,000Total 174,000 9Corrected Total 30,000 8a. R Squared = ,200 (Adjusted R Squared = -,067)

m. Tot slot staat hierna dezelfde analyse, maar dan voor Maan. Interpreteer de uitkomst. Ga ook hier na hoe de F-waarde tot stand is gekomen.

Tests of Between-Subjects Effects School MAANDependent Variable:OrdeverstverstoringSource Type III Sum

of Squares dfMean

Square F Sig.Corrected Model

6,000a 2 3,000 12,000 ,008

Intercept 144,000 1 144,000 576,000 ,000Groep(ABC) 6,000 2 3,000 12,000 ,008Error 1,500 6 ,250Total 151,500 9Corrected Total 7,500 8a. R Squared = ,800 (Adjusted R Squared = ,733)

5.5. Huiswerk

Maken Problems 12.24, 12.25, 13.1, 13.5 en 13.14 uit Agresti en Finlay, Mystatlab-opgaven en wekelijkse BB-toets week 5.

Voorbereiden werkcollege 6 waarin je hypothesen voor je eindopdracht gaat toetsen. Neem mee naar werkcollege 6:

a. Bekijk je hypothesen: welke 3 hypothesen wil je onderzoeken voor je eindverslag.b. Welke variabelen uit de dataset heb je nodig om je hypothesen te onderzoeken?c. Noteer van de variabelen de meetniveau’s.d. Bekijk in bijlage D welke toetsen je kunt uitvoeren: in werkcollege 4 heb je vooral de

analyses om je populatie te beschrijven uitgevoerd, in werkcollege 6 toets je de hypothesen die je hebt gekozen om in je verslag te verwerken.

e. Voer in werkcollege 6 de analyses uit, noteer de gegevens die je nodig hebt voor je verslag.

38

Page 39: Syllabus Statistiek 2 2014-2015

(1) Tip: Je kunt natuurlijk thuis al het nodige voorwerk verrichten: dan kun je gerichtere vragen stellen tijdens het computerpracticum!

(2) Werk met de syntax en sla de syntax goed op. (3) Sla ook je output goed op: verzin handige namen voor je output, zodat je later

makkelijk je analyses kunt terugkijken.f. Interpreteer de uitkomsten (als je daar thuis al aan toekomt is dat mooi, tijdens

werkcollege 6 kun je hiermee ook aan de slag en dit verwerk je uiteraard in je verslag).

g. Voer een interactieanalyse uit en noteer de interpretatie. Neem de output en interpretatie mee naar het computerpracticum.

39

Page 40: Syllabus Statistiek 2 2014-2015

WERKCOLLEGE 6: Computerpracticum

6.1. Logistische regressie-analyse6.2. Analyse Eindopdracht6.3. Huiswerk

NB: Neem Agresti en Pallant mee!

NB: ga gelijk naar de computerruimte in de kelder van het Transitorium en dus niet eerst naar de werkgroepzaal.

Hoorcollege week 6, Model building en Logistische regressie. H14 (1-3,5) en H15 (1-3).Voor de volgende keer alles herhalen.

Doel: logistische regressie-analyse leren kennen: wanneer voer je die uit en hoe doe je dat in

SPSS werken aan eindopdracht: toetsen van hypothesen met complexe analyses (met

meerdere variabelen)

6.1. Logistische regressie-analyseIn deze opdracht leer je meer over de logistische regressie-analyse: het uitvoeren van de analyse, lezen van SPSS-output en interpretatie van de output.

Karin Bakker schrijft in een blad voor ouders regelmatig een column met als titel: "Opvoeden hoe doe je dat?" In een van haar columns roept ze ouders op om haar informatie te verschaffen over hun jongste baby of peuter. Haar lezers kunnen informatie achterlaten op haar website. Er zijn slechts vier vragen: 1) Is uw baby of peuter een jongen of een meisje; 2) Hoeveel maanden oud is uw baby of peuter; 3) Huilde uw baby vandaag ja/nee. 4) Was er een voor hem of haar onbekende persoon (vreemde) aanwezig? Er reageerden 388 lezers en lezeressen. Het is al bekend dat baby's en peuters minder vaak huilen naarmate ze ouder worden. Karin wil op grond van de data nagaan wat het precieze verloop van huilgedrag is en of dat verloop verschilt in situatie met en zonder vreemde. Zij denkt overigens dat geslacht er niet toe doet.

Beantwoord de volgende vragen vóórdat je het bestand opent:

40

Bestand: Werkcollege 6 opdracht 1 huilen.savNaam van de variabele: CoderingPPNO Nummer van de deelnemer 1Geslacht 1=jongen, 2=meisjeLeeftijd Leeftijd in maandenHuilen Huilen nee=0, ja=1Vreemde Aanwezigheid vreemde 0=afwezig,

1=aanwezig

Page 41: Syllabus Statistiek 2 2014-2015

a. Wat is de hypothese of wat zijn de hypothesen die Karin wil onderzoeken?

b. Wat is de afhankelijke (respons-)variabele en wat zijn de onafhankelijke variabelen?

c. Wat zijn de meetniveau’s van de onafhankelijke variabelen?

d. Wat is het meetniveau van de responsvariabele?

e. Hoe kun je je een verband tussen de onafhankelijke variabele en de responsvariabele voorstellen? Welke model gebruik je?

f. Voordat je gaat analyseren met SPSS, houd in gedachten wat je hypothesen zijn: hoe denk je dat het huilen verandert met de leeftijd? Hoe is deze verandering anders in de situatie met een vreemde of zonder een vreemde erbij? Met andere woorden: wat is het effect van leeftijd op huilen, en is dit effect een functie van de aanwezigheid van de variabele vreemde (wel/niet)?

g. Maak van je ideeën tekeningen om je gedachtegang te helpen: teken in onderstaande figuur één curve voor het leeftijdsverloop van het huilen zonder rekening te houden met de situatie of er wel of niet een vreemde aanwezig is. En teken dan een grafiek waarin je wel rekening houdt met de situatie wel/niet een vreemde aanwezig (dan krijg je twee grafiekjes in één figuur).

41

Page 42: Syllabus Statistiek 2 2014-2015

Open nu het bestand ‘Werkcollege 6 opdracht 1 huilen.sav’ in SPSS en voer een logistische regressie-analyse uit met leeftijd als verklarende variabele (predictorvariabele).Zoek op in Pallant hoe dit moet.

h. Wat is hier de waarde van de regressie-coëfficiënt B die het effect van Leeftijd op de kans op Huilen weergeeft? (Hint: je vindt de informatie in de laatste tabel van de output).

i. Is het effect van Leeftijd op de kans op Huilen significant? Wat is de toetsingsgrootheid?

Je hebt echter ook een hypothese waarbij de variabele Vreemde een predictor is.En je kijkt niet alleen naar hoofdeffecten, je verwacht waarschijnlijk ook een interactie-effect. Bij een regressie-analyse (zowel lineair als logistisch) moet je de interactievariabelen zelf maken.Dit doe je door in SPSS de predictoren met elkaar te vermenigvuldigen.Transform > Compute variableGeef de interactie-variabele een toepasselijke naam, en zet in het vak met Numeric Expression de vermenigvuldiging waar het om gaat en klik op OK (zie plaatje hieronder).

42

Page 43: Syllabus Statistiek 2 2014-2015

j. Ga in het databestand na hoe de nieuwe variabele VreemdeXLeeftijd er uitziet. Welke waarden heeft deze interactievariabele VreemdeXLeeftijd bij proefpersoon 1, 2, 9 en 10? Noteer hier:

k. Wat betekenen deze waarden?

l. Voer vervolgens een logistische regressie-analyse uit met huilen nog steeds als responsvariabele, en Leeftijd, Vreemde én de interactievariabele VreemdeXLeeftijd als de drie predictoren. Let op: de variabele Vreemde is een categorische variabele. Je moet bij een logistische regressie apart aangeven dat het om een categorische variabele gaat. Kijk in Pallant hoe dit moet.

m. Bekijk de output. Wat is je conclusie? Is de output in overeenstemming met de hypothese die je formuleerde? (Is de coëfficiënt van de interactieterm significant verschillend van nul, en wat betekent dat dan?).

43

Page 44: Syllabus Statistiek 2 2014-2015

De betekenis van deze coëfficiënt kun je beredeneren als je bedenkt dat de interactie-predictor de waarde “leeftijd x 1” heeft als er een vreemde aanwezig is en de waarde “leeftijd x 0” als er geen vreemde aanwezig is.

n. Schrijf in enkele regels het resultaat van de analyse op, en geef in het grafiekje hieronder weer wat de interactie in de SPSS-output volgens jou betekende.

o. Je kunt ook SPSS een grafiekje laten maken zoals je hierboven zelf hebt gedaan: Kies opnieuw dezelfde logistische regressie als hierboven, maar voordat je op OK klikt, klik eerst op Save, en vink vervolgens Probabilities aan linksboven in het vak met de titel Predicted Values. Klik op OK.

p. Kijk in de datafile hoe de nieuwe variabele PRE1 er uitziet. Wat betekenen de waarden bij deze variabele?

q. Maak een scatterplot (Graphs > LegacyDialogs > Scatter/Dot > SimpleScatter) met PRE1 op de y-as en Leeftijd op de x-as. Bekijk de output. Ziet het plaatje eruit zoals je bij n. getekend hebt? Zo nee, probeer te begrijpen wat de scatterplot betekent. Beschrijf de relatie in dit Scatterplot zoals het in het onderzoeksrapport van Karin Bakker zou kunnen staan:

44

Page 45: Syllabus Statistiek 2 2014-2015

6.2. Analyse EindopdrachtJe kunt nu alle geleerde technieken gebruiken om je complexere hypothesen te toetsen voor de eindopdracht.

Stappenplan:a. Bekijk je hypothesen: welke 3 hypothesen wil je onderzoeken voor je eindverslag?b. Welke variabelen uit de dataset heb je nodig om je hypothesen te onderzoeken?c. Wat zijn de meetniveau’s van de variabelen.d. Bekijk in bijlage D welke toetsen je kunt uitvoeren: in werkcollege 4 heb je vooral de

analyses om je populatie te beschrijven uitgevoerd, in werkcollege 6 toets je de hypothesen die je hebt gekozen om in je verslag te verwerken.

e. Voer nu, tijdens dit werkcollege, de analyses uit en noteer de gegevens die je nodig hebt voor je verslag. (1) Werk met de syntax en sla de syntax goed op. (2) Sla ook je output goed op: verzin handige namen voor je output, zodat je later

makkelijk je analyses kunt terugzien.f. Interpreteer de uitkomsten.

45

Page 46: Syllabus Statistiek 2 2014-2015

6.3. Huiswerk

Maken Problems 14.12, 14.17, 15.1, en 15.3 uit Agresti en Finlay, Mystatlab-opgaven en wekelijkse BB-toets, week 6.

Voorbereiden vragen over Statistiek 2 ter voorbereiding op het Tentamen.

Eindopdracht: schrijven tweede tussenverslag: Resultaten en Discussie. Dit moet twee dagen vóór werkcollege 7 ingeleverd worden. Zie bijlage A en B voor de eisen aan de Resultaten en Discussie.

Neem een kopie van je Resultaten en Discussie mee voor peerreview! Neem ook een kopie van de Rubrics mee (Course Documents, Werkcolleges, Eindopdracht). NB: Als je geen kopie meeneemt en geen tussenverslag inlevert, kun je niet meedoen met de (peer)feedback op de Resultaten en Discussie tijdens werkcollege 7.

46

Page 47: Syllabus Statistiek 2 2014-2015

WERKCOLLEGE 7:

Inleveren tweede tussenverslag (Resultaten en Discussie) twee dagen vóór werkcollege 7. Neem een kopie mee voor peerreview en neem de rubrics mee!

7.1. Bespreken opgaven uit Agresti en Finlay.7.2. (peer)Feedback op tweede tussenverslag7.3. Vragen voor tentamen 7.4. Evaluatie7.5. Huiswerk

NB: neem Burton mee en Bijlage B. Rubrics van blackboard. Hoorcollege: deze week is er een responsiecollege/overzichtscollege.

7.1. Bespreken opgaven uit Agresti en Finlay.

Er is nu gelegenheid om Agresti en Finlay-opgaven van het huiswerk behorende bij werkcollege 5 en 6 te bespreken. Studenten stellen vragen die (bij voorkeur) door studenten worden beantwoord.

7.2. (peer)Feedback op tweede tussenverslag1. Je krijgt van de docent via Turnitin persoonlijke feedback op je verslag. Je kunt de

feedback vanaf vrijdag 28 maart 2014, 23.59 uur inzien.2. Met behulp van de Rubrics geef je tijdens het werkcollege zelf feedback op de

Resultaten en Discussie van een studiegenoot.3. Je bespreekt met elkaar de eisen die je moet stellen aan je eigen verslag, of aan een

verslag in het algemeen.

7.3. Vragen voor tentamen In deze week is er een responsiecollege gepland tijdens het hoorcollege waarin je vragen kunt stellen ter voorbereiding op het tentamen. Stel zoveel mogelijk je vragen aan de hoorcollegedocent, maar ook tijdens het werkcollege is gelegenheid tot het stellen van vragen.

7.4. EvaluatieHet vak Statistiek 2 wordt afgerond met een korte evaluatie.

7.5. Huiswerk

Afschrijven Eindopdracht. Zie bijlage A voor de deadlines.

47

Page 48: Syllabus Statistiek 2 2014-2015

Bijlage A: Eisen verslagen:

NB: Alleen verslagen die er verzorgd uitzien worden nagekeken. Indien verslagen niet voldoen aan de minimale eisen (zoals bijvoorbeeld woordaantal (geldt vooral voor eindverslag), goed taalgebruik en duidelijk voorblad) geeft de docent het verslag terug en kan het verslag pas weer bij de volgende inlevermogelijkheid ingeleverd worden.

Eindverslag

Dit is een onderzoeksverslag met een: Voorblad met: titel, eigen naam, studentnummer, naam docent, werkgroepnummer. Samenvatting: 150 woorden, plus of min 10% Inleiding: 500 woorden, plus of min 10% Methode: 400 woorden, plus of min 10% Resultaten: 500 woorden, plus of min 10% Conclusie: 300 woorden, plus of min 10% Referentielijst.

Eerste opdracht (inleveren twee dagen vóór werkcollege 3): Bedenk 3 goede hypothesen. De hypothesen zijn ‘goed’ als ze complexe relaties beschrijven.

Dat houdt in dat je de statistiek die je leert in Statistiek 2 moet toepassen voor de eindopdracht.

o Als je alleen analyses doet op Statistiek 1 niveau wordt je verslag beoordeeld met een onvoldoende.

o Statistiek 2 niveau houdt in: het gebruik van multiple regressie, logistische regressie, (co-)variantieanalyse en dergelijke. Statistiek 1 niveau analyses als T-toets, chi-kwadraattoets en dergelijke worden slechts mondjesmaat gebruikt, bijvoorbeeld alleen bij het beschrijven van de steekproef.

o Gebruik 3 verschillende analysetechnieken (natuurlijk op Statistiek 2 niveau) en zorg ervoor dat je hypothesen daarvoor geschikt zijn.

Stuur de docent per email de hypothesen, uiterlijk twee dagen vóór werkcollege 3.

Eerste tussenverslag (inleveren vóór werkcollege 4):Dit is het tussenverslag waarin je in een lopende tekst (dus niet puntsgewijs) weergeeft:

Voorblad met: titel, eigen naam, studentnummer, naam docent, werkgroepnummer. Inleiding

o Schrijf de inleiding volgens de eisen die in Burton staan (hoofdstuk 5: Research reports). Verwerk de hypothesen in de inleiding zoals Burton dat adviseert.

o Kijk in de checklist (pagina 107) naar wat er in de “Introduction” moet staan. Bouw op die manier je verslag op: je onderbouwt je hypothesen.

o Zoek twee artikelen op waarmee je je hypothesen onderbouwt. NB: je hoeft geen uitgebreide literatuurbespreking te geven, literatuur dient alleen om de hypothesen te onderbouwen.

48

Page 49: Syllabus Statistiek 2 2014-2015

o De inleiding moet een goede structuur hebben, goed leesbaar zijn en in goed Nederlands zijn geschreven.

o Je moet minimaal 3 complexe hypothesen beschrijven. Methode

o Geef een beschrijving van het onderzoek volgens APA-normen (Kijk in Burton hoe dat ook alweer moet) met ‘Proefpersonen (hier kun je de beschrijvende statistiek in kwijt van de huiswerkopdracht van werkcollege 1)’, ‘Materialen’, en ‘Procedure’. Je mag zelf een onderzoeksopzet verzinnen die goed bij je hypothesen past en die past bij de dataset die je gebruikt voor je analyses.

Tweede tussenverslag: Resultaten en Discussie (inleveren vóór werkcollege 7)Schrijf nu de Resultaten en discussie. Lever twee dagen vóór werkcollege 7 in op blackboard. Zie Burton voor de eisen die aan een onderzoeksverslag worden gesteld (hoofdstuk 5).

Voorblad met je naam, studentnummer, groep en werkgroepdocent. Resultaten

o Op basis van je hypothesen voer je minimaal 3 analyses uit.o Je maakt gebruik van meerdere statistische analysetechnieken (niet alleen

(co-)variantieanalyses of regressie-analyses).o Zorg ervoor dat je analyses aansluiten bij je hypothesen en dat de analyses op

Statistiek 2 niveau zijn.o Schrijf de resultatensectie volgens de APA-normen (Kijk in Burton en Pallant als je

niet meer precies weet wat er in een Resultatensectie moet staan).o Geef de uitkomsten van de beschrijvende statistiek voor zover dat nog niet in de

Methode is verwerkt.o Geef de toetsresultaten van de getoetste hypothesen.o Geef telkens in woorden weer wat de betekenis is van de resultaten voor de

getoetste hypothese.o Verwerk tabellen en figuren in de tekst waar dat tot verduidelijking leidt. (mag in

de tekst, hoeft niet in een bijlage). Conclusie

o In de discussiesectie hoef je alleen een goede samenvatting van de resultaten te geven in psychologische en pedagogische termen. Je hoeft geen getallen en uitkomsten meer te geven. In feite geef je antwoord op de onderzoeksvraag in begrijpelijke taal.

o Je hoeft geen kritische discussie te schrijven, alleen een samenvatting.o Je kunt je discussie afsluiten met de betekenis van de resultaten voor de theorie,

voor zover je theorie hebt besproken in de Inleiding.

De docent beoordeelt het onderzoeksverslag met behulp van de Rubrics in Turnitin (voor een overzicht, zie het Rubrics-document op blackboard, mapje eindopdracht). Op de tussenverslagen geeft de docent feedback in Turnitin. Niet inleveren vóór de deadline betekent dat je geen feedback krijgt.

49

Page 50: Syllabus Statistiek 2 2014-2015

Bijlage B: Rubrics Onderzoeksverslag Statistiek 2 Zie mapje ‘Eindopdracht’ onder Course Documents Werkgroepen.

50

Page 51: Syllabus Statistiek 2 2014-2015

Bijlage C: Materiaal Eindopdracht

Alcoholgebruik bij jongeren In de puberteit beginnen veel jongeren te experimenteren met alcohol. Er zijn grote individuele verschillen in de leeftijd waarop jongeren beginnen met drinken, en de hoeveelheid die zij drinken. Jaarlijks worden ongeveer 1400 jongeren met alcoholvergiftiging behandeld op de Spoedeisende Eerste Hulp van een ziekenhuis. Jongeren die vroeg beginnen met drinken, en die (extreem) veel drinken lopen een verhoogd risico om later een alcoholverslaving te ontwikkelen. Velen maken zich dan ook zorgen om het alcoholgebruik van jongeren in de maatschappij. De data in het onderzoek naar alcoholgebruik bij jongeren zijn verzameld om inzicht te verwerven in de oorzaken van alcoholgebruik bij jongeren. Er is natuurlijk niet één oorzaak van alcoholgebruik. Er zijn er ongetwijfeld meer. En sommige oorzaken hebben mogelijk een verschillend effect voor bijvoorbeeld jongens en meisjes. Er zijn op twee meetmomenten metingen verricht. Toen de deelnemers ongeveer één jaar waren is nagegaan hoe veilig het kind aan de moeder gehecht was, hoe negatief reactief het temperament van het kind was, of de moeder tijdens de zwangerschap gerookt of alcohol gedronken had, en er is DNA afgenomen bij de kinderen om variatie in het ADH1B gen in kaart te brengen, een gen dat een rol speelt bij het afbreken van alcohol in de lever. Op 16-jarige leeftijd is aan de door de jongere aangewezen twee beste vrienden gevraagd hoeveel alcohol zij dronken. Ook hebben moeders gerapporteerd hoeveel toezicht zij houden op het alcoholgebruik en gedrag van hun kind, en hebben de jongeren zelf gerapporteerd over hun attentieproblemen en spanningsbehoefte. Er zijn ook enige achtergrondgegevens verzameld. Op blackboard vind je een basisartikel.

Bestand: Eindopdracht_Alcoholgebruik.sav

Variabele Beschrijving ToelichtingGedrag op 16-jarige leeftijdAlcohol Alcoholgebruik in aantal glazen alcohol per

weekRapportage Jongere Vragenlijst

Alcohol_D Alcoholgebruik (0=0 glazen per week, 1=1 of meer glazen per week)

Dichotomie alcoholgebruik

AttProb Attentieproblemen (Young Self Report) Rapportage Jongere Vragenlijst

SpanBeh Spanningsbehoefte (Sensation Seeking Scale V)

Rapportage Jongere Vragenlijst

AchtergrondgegevensSekse Sekse (1=vrouw,0=man) Rapportage Jongere

VragenlijstSES Sociaal Economische Status (0=laag,

1=midden, 2=hoog)Rapportage Moeder Vragenlijst

Overige variabelen op 16-jarige leeftijdAlcohol_V Gemiddeld aantal glazen alcohol per week

van de twee beste vriendenRapportage Vrienden Vragenlijst

OudToez Mate van ouderlijk toezicht Rapportage Moeder Vragenlijst

Variabelen gemeten op 1-jarige leeftijd

51

Page 52: Syllabus Statistiek 2 2014-2015

ADH1B Variatie in Alcohol Dehydrogenase 1B gen (SNP rs1229984; 1=1 of 2 kopieën van risicoallel G; 0=0 kopieën van risicoallel G )

Genotypering obv verzameld DNA materiaal

Roken_M Roken tijdens de zwangerschap door moeder (1=ja; 0=nee)

Rapportage Moeder Vragenlijst

Alcohol_M Alcohol drinken tijdens de zwangerschap door moeder (1=ja; 0=nee)

Rapportage Moeder Vragenlijst

Hechting Kwaliteit van gehechtheid moeder-kind (1=veilig; 0=onveilig)

Observatie (Strange Situation Procedure)

NegReact Negatief reactief temperament Observatie (LAB-TAB)

52

Page 53: Syllabus Statistiek 2 2014-2015

Bijlage D: Data-analyseplan

Waarom een Data-analyseplan Inmiddels heb je een aantal hypotheses geformuleerd over het ontstaan van alcoholgebruik. De volgende vraag is: “hoe toets ik die?”. Als je de resultatenparagraaf van een artikel leest ontstaat de indruk dat auteurs of onderzoekers, een paar hypothesen hebben opgesteld vervolgens data hebben verzameld en tot slot de computer hebben aangezet en een paar analyses hebben gedaan en de uitkomsten daarvan nog even hebben opgeschreven. Niets is minder waar. Het toetsen van hypothesen is veel minder rechtlijnig dan de uitkomsten van artikelen je willen doen geloven. Daar zijn bloed zweet en tranen aan voorafgegaan. Er worden veel meer analyses uitgevoerd dan er resultaten worden gerapporteerd. Zelfs in het meest eenvoudige onderzoek met drie of vier variabelen worden tientallen analyses uitgevoerd. De dataset die je voor de eindopdracht gebruikt is een goed voorbeeld. Om de vraag naar het ontstaan alcoholgebruik te onderzoeken zul je enkele tientallen analyses uitvoeren, ook al komen lang niet alle resultaten daarvan zichtbaar in je verslag. Het is verstandig systematisch te werk te gaan door een analyse plan te maken. In dat plan beschrijf je welke analyses je van plan bent te doen, om je onderzoeksvraag te beantwoorden. En met het plan in de hand kun je bijhouden hoever je bent.

Waarom worden er veel meer analyses gedaan dan er worden gerapporteerd? Omdat je zeker van je zaak wilt zijn. Je wilt objectief zijn. Dat houdt in dat, als een ander dezelfde of vergelijkbare data zou analyseren met jouw hypothese in gedachten, hij of zij tot dezelfde conclusie zou komen. En niet tot een andere conclusie die veel aannemelijker is. En wat je al helemaal niet wilt is dat anderen je op fouten zouden kunnen betrappen. Een sterke correlatie tussen variabelen kan bijvoorbeeld veroorzaakt worden door een enkele uitbijter. Wat je ook niet wilt is dat een relatie die je rapporteert ‘spurieus’ is, of dat er sprake is van een interactie die je over het hoofd ziet (zie de relaties in Figuur 1 van Werkcollege 3 van dit Werkboek).

Een data-analyseplan is een middel om je werk te structureren. Hoe zo'n plan eruit ziet mag je zelf bepalen. Het belangrijkst is dat je overzicht houdt en weet wat je doet en waarom je iets doet. Er zijn altijd inhoudelijke pedagogische of psychologische redenen om een analyse uit te voeren. Heb je geen inhoudelijke reden voor een analyse laat de analyse dan achterwege! De stappen zijn als volgt (waarbij gebruik gemaakt kan worden van het schema in het kader ‘Welke statistische methode’ om tot juiste keuzes te kunnen komen):

a. Formuleer vraagstelling(en) en hypothese(n) kort en bondig. Het gebeurt overigens regelmatig dat je de vraag of hypothese op grond van de uitkomsten van je analyses nog iets aanpast. Dat zou je bij kunnen houden.

b. Beschrijf de hypothese in een pijlendiagram (zoals Figuur 1 van Werkcollege 3).c. Plan de analyse voor het beschrijven van de kenmerken van de steekproef bijvoorbeeld:

leeftijd, sekse, SES, etc. d. Plan de analyse van een vraag en of toetsing van een hypothese. Dat doe je aan de hand

van: 1. meetniveau responsvariabele (categorische of continu); 2. het aantal verklarende variabelen (een of meer) en 3. hun meetniveau (categorische of continu).

53

Page 54: Syllabus Statistiek 2 2014-2015

e. Het plan bevat:1. Namen van de responsvariabele en de verklarende variabelen. 2. Het meetniveau van iedere variabele3. Voorstel voor beschrijvende analyses van iedere variabele

afzonderlijk 4. Voorstel voor analysemethoden voor paren variabelen (denk ook

aan achtergrond variabelen)5. Voorstel voor analyses met meerdere verklarende variabelen

(denk ook aan achtergrond variabelen).

Voorbeeld data-analyseplanEen onderzoeker is als onderdeel van zijn onderzoek geïnteresseerd in de relatie tussen IQ en agressie. Zijn hypothese is dat een laag IQ leidt tot agressie. Hij weet echter ook dat agressie vaker in lagere sociaal economische milieus voorkomt en dat IQ ook van SES af kan hangen. Pijlendiagram IQ Agressie Responsvariabele: Agressie (continu) Verklarende variabelen: IQ (continu) en mogelijk SES (categorisch) Analyse afzonderlijke variabelen (zie ‘Welke Statistische Methode’) Histogram Agressie en IQ plus descriptives (gemiddelde en SD) Proporties laag SES en hoog SES Analyse paren variabelen: Relatie Agressie IQ: scatterplot en regressie analyse Verschil Agressie tussen lage en niet lage SES (Staafdiagram en t-toets) Verschil IQ tussen lage en niet lage SES (Staafdiagram en t-toets) Analyse met meerdere verklarende variabelen Relatie Agressie met IQ en SES. Regressie analyse met Agressie als responsvariabele en IQ en SES (dummy) als predictoren.

54

Page 55: Syllabus Statistiek 2 2014-2015

Welke statistische methode? (Vrij naar Agresti & Finlay 2009)

Continue respons variabele 1. Gaat het om één variabele dan descriptieve methoden uit hoofdstuk 3 van Agresti & Finlay,

2009, (A&F), inductieve methoden hoofdstuk 5.3 (A&F) (betrouwbaarheidsintervallen) en significantietoetsen voor één parameter (SPSS: histogram en descriptives)

2. Categorische verklarende variabele: Met twee niveaus, dan vergelijk gemiddelden voor twee onafhankelijke steekproeven 7.3 (A&F), of voor twee afhankelijke steekproeven hoofdstuk 7.4 (A&F) (SPSS: compare means). Verklarende variabele met meerdere niveaus ANOVA paragraaf 12.1-3 (A&F) (SPSS: GLM Univariate) of paragraaf 12.6 (A&F) (afhankelijke steekproeven). Je kunt ook heel goed Regressieanalyse met dummies gebruiken (SPSS Regression)

3. Kwantitatieve verklarende variabelen: Gebruik correlatie- en regressiemethoden (hoofdstuk 11 en 14 A&F) (SPSS: Scatterplots, Regression en Correlate (ook Partial))

4. Kwantitatieve én Categorische variabelen: Regressie analyse met kwantitatieve predictoren en dummyvariabelen, ook aangeduid met covariantieanalyse (hoofdstuk 13 A&F). SPSS Regression (met zelfgemaakte dummies) aanbevolen of GLM.

Categorische respons variabele 1. Gaat het om één variabele dan descriptieve methoden hoofdstuk 3.1, inductieve methoden,

hoofdstuk 5.2 (A&F) (betrouwbaarheidsintervallen) en significantietoetsen voor een proportie (SPSS: barchart en descriptives, zie evt Non parametric binomial)

2. Categorische verklarende variabele: methoden voor kruistabellen (SPSS: barchart, en Descriptives>Crosstabs.

3. Categorische responsvariabele met twee niveaus (bijv. ja/nee; goed/fout). Met meerder kwantitatieve en of categorische verklarende variabelen, dan logistische regressie, hoofdstuk 15 (A&F) (SPSS: Regression> binary logistic).

4. Ordinale responsvaraible met meerder kwantitatieve en of categorische verklarende variabelen: Ordinal logit model, hoofdstuk 15.4 (A&F).

55

Page 56: Syllabus Statistiek 2 2014-2015

Tabel toetskeuze

Soort verband (heet ook wel)

Soort analyse Bijbehorende enkelvoudige analyses

Opmerkingen en aanwijzingen

Meerdere oorzaken

two way ANOVA t-toets, one-way ANOVA

In dit geval ben je vooral geïnteresseerd in hoofdeffecten.

multipele lineaire regressie

Enkelvoudige lineaire regressie

multipele logistische regressie

Enkelvoudige logistische regressie

Interactie (moderatie)

two way ANOVA t-toets, one-way ANOVA

In dit geval ben je vooral geïnteresseerd in het interactie-effect.

multipele lineaire regressie

Enkelvoudige lineaire regressie

Centreer alle continue onafhankelijke variabelen. Vermenigvuldig de (gecentreerde) onafhankelijke variabelen met elkaar om de nieuwe interactievariabele te creëren.

multipele logistische regressie

Enkelvoudige logistische regressie

Centreer alle continue onafhankelijke variabelen. Vermenigvuldig de (gecentreerde) onafhankelijke variabelen met elkaar om de nieuwe interactievariabele te creëren.

56

Page 57: Syllabus Statistiek 2 2014-2015

Bijlage E: Het formuleren van hypothesen: Waar op te letten.

Complexe relatiesWe werken bij statistiek 2 met complexe relaties. Zie ook bijlage A van de syllabus. Neem dus 3 variabelen op per hypothese.

Stel dat je onderzoek gaat doen naar Depressie bij kinderen

RichtingFormuleer indien mogelijk een richting. Dus niet: “Er wordt een verband verwacht tussen IQ en mate van depressieve klachten bij kinderen”, maar: “Er wordt een negatief verband verwacht tussen IQ en mate van depressieve klachten bij adolescenten” (en dan dus met meer dan deze 2 variabelen).

Verwarring van de niveaus van de variabelen

Bijvoorbeeld een hypothese als: “Hoe hoger het aantal stressvolle levensgebeurtenissen, hoe meer kans op een depressie.”, kan het beste omgezet worden in een formulering als: ”Er wordt een positief verband verwacht tussen het aantal stressvolle levensgebeurtenissen en de kans op depressie”. Het eerste is meer een uitleg van de laatste. Wat niet kan is een formulering als: “Een hoog aantal levensgebeurtenissen zorgt voor een grotere kans op depressie dan een laag aantal levensgebeurtenissen”. Hier wordt de variabele levensgebeurtenissen dichotoom gemaakt, wat je in de uiteindelijke analyse niet doet.

Let ook op de formulering van het niveau van je afhankelijke variabele. Heb je het over “de kans op depressie” dan doel je op de variabele DSM-IV diagnose (0 – 1). Heb je het over “de mate van depressieve symptomen/klachten” dan doel je op de variabele Beck’s Depression Index (BDI).

En verderBedenk steeds goed: Wat wil je precies weten? Wat wil je onderzoeken? Formuleer het ook zo.

Zorg dat je uiteindelijk je hypotheses zó formuleert dat je met verschillende complexe statistische analyses aan de slag kan gaan (met drie variabelen).

Let op de APA regels! Lettertype, lettergrootte, regelafstand.

Voorbeelden“Ik verwacht dat kinderen met weinig vrienden die weinig doen aan sport hoog scoren op depressie.”

57

Page 58: Syllabus Statistiek 2 2014-2015

Beter: “Er wordt een negatief verband verwacht tussen aantal vrienden en het beoefenen van sport en de mate van depressieve klachten”.

Personen met een grote variatie in intensiteit van boze gevoelens hebben meer kans op een depressie.Wat bedoel je met een grote variatie? Hoe is dit terug te vinden in de variabelen? Hier wordt de onafhankelijke variabele onterecht gedichotomiseerd omdat het suggereert dat je ook een kleine variatie hebt, het gaat eerder om een ‘grotere’ variatie. Beter is weer om over ‘positief verband’ te spreken en over grotere en meer te hebben een eventuele uitleg van de hypothese.

Zorg ook dat er alarmbellen gaan rinkelen als je in je hypothese een vergelijking maakt, of wat vaak misgaat: dat je alleen het eerste gedeelte van een vergelijking maakt. Bijvoorbeeld: “Kinderen uit Eenoudergezinnen hebben een hogere kans op depressie” Een hogere kans dan wie?

Sporten speelt een modererende rol in de relatie tussen piekeren en depressie.Hoe dan? Specificeer.

In de volgende hypothese was niet duidelijk dat het om drie variabelen gaat: Jongens die snel boos zijn, zijn meer depressief dan jongens die niet snel boos zijn.Let op: er lijken hier 3 variabelen in de hypothese te zijn opgenomen, maar dat is eigenlijk niet zo. Als je straks een analyse zou gaan uitvoeren om deze hypothese te toetsen, zie je dat je alleen de variabelen Boosheid en Depressie meeneemt. Je voert de analyse echter alleen uit voor de groep jongens. Beter is: “Er wordt verwacht dat voor jongens er een positief verband bestaat tussen de snelheid waarin ze boos worden en de mate van depressieve symptomen, maar dat dit verband voor meisjes niet bestaat/anders is, namelijk…”.

Veel conflicten thuis speelt een modererende rol bij depressie.Modererend waartussen? In ieder geval depressie, maar de onafhankelijke variabele (predictor) is nog niet vermeld. Bekijk het schema van een moderatie (ook wel: interactie. Zie ook het schema in het boek van Agresti & Finlay (2009) op blz 315 en in de syllabus vooraan bij werkcollege 3).

Kinderen die hoog scoren op piekeren hebben vaker te maken met een depressie.Wat bedoel je precies? Dit suggereert dat je onderzoekt of kinderen in contact komen met een depressie, terwijl het echt gaat over depressie bij kinderen. Wees zorgvuldig in je formulering.

58