datamanagement - helen klip

34
Data management 26 mei 2015 Helen Klip

Upload: karakter-kinder-en-jeugdpsychiatrie

Post on 08-Aug-2015

141 views

Category:

Science


1 download

TRANSCRIPT

Data management

26 mei 2015

Helen Klip

Deze presentatie is gemaakt met behulp van informatie van verschillende websites:

1. Research data management UvA: http://rdm.uva.nl/

2. http://datasupport.researchdata.nl/over-de-cursus/

3. http://nl.wikipedia.org/wiki/Diederik_Stapel

4. http://www.wanttoknow.nl/hoofdartikelen/wetenschappelijk-onderzoek-toont-

wetenschapsfraude-aan/

5. Research Data Management Plan Radboud:

http://www.ru.nl/library/services/research/researchdata/dmp/

6. http://www.rug.nl/bibliotheek/researchdata/data-management-plan-2.pdf

7. http://www.rug.nl/frw/workshop_-hoe-schrijf-je-een-research-data-management-plan_

Bronnen

Wie heeft er afspraken

gemaakt over

bestandsnamen?

• Hoe zien die bestandsnamen eruit?

5/28/2015www.karakter.com 3

Worden alle gegevens

gearchiveerd?

• Welke gegevens?

• Waarom wel?

• Waarom niet?

5/28/2015www.karakter.com 4

Wie weet er zeker dat

zijn onderzoek

reproduceerbaar is?

• En als je het niet weet, hoe verantwoord

je dit?

5/28/2015www.karakter.com 5

• Wat is Datamanagement

• Waarom Data Management

• Research Data Management plan

• Data Management tijdens onderzoek

• Discussie/vragen

Inhoud

5/28/2015www.karakter.com 6

Datamanagement zorgt ervoor dat alle onderzoeksgegevens op de lange

termijn reproduceerbaar zijn.

Dat wil zeggen onderzoeksgegevens zijn:

• vindbaar

• toegankelijk

• begrijpelijk

Wat is Data Management

5/28/2015www.karakter.com 7

Datamanagement zorgt ervoor dat alle onderzoeksgegevens op de lange

termijn reproduceerbaar zijn.

Dat wil zeggen onderzoeksgegevens zijn:

• vindbaar

• toegankelijk

• begrijpelijk

Wat is Data Management

5/28/2015www.karakter.com 8

1. Financiers en andere partijen stellen eisen tav datamanagement

2. Zorgt voor goede planning

3. Verhoging van de impact van het onderzoek

4. Documenteren vermindert stress

5. Delen versterkt je reputatie

Waarom Data Management

5/28/2015www.karakter.com 9

1. Financiers en andere partijen stellen

eisen

• Er bestaat in Nederland een Gedragscode Wetenschapsbeoefening.

Door te werken met een Data Management Plan voldoet de

onderzoeker aan deze gedragscode.

• Steeds meer onderzoeksfinanciers vragen om een Data Management

Plan. Bijvoorbeeld ZonMW: http://www.zonmw.nl/fileadmin/documenten/Toegang_Tot_Data__TTD/Achtergrondinformatie_bij_dataparagraaf_en_dataman

agementplan.pdf

5/28/2015www.karakter.com 10

2. Zorgt voor goede planning

• Goed data management zorgt voor een goed verloop van de studie.

5/28/2015www.karakter.com 11

3. Verhoging van de impact van het

onderzoek

• Publicatie en hergebruik van de data vergroot de impact van het

onderzoek.

• Goed datamanagement draagt bij aan de uitstraling en reputatie van

karakter als onderzoeksinstelling.

5/28/2015www.karakter.com 12

4. Documenteren vermindert stress

• Goed documenteren zorgt ervoor dat bestanden vindbaar zijn.

Scheelt een hoop stress!

5/28/2015www.karakter.com 13

5. Delen versterkt je reputatie

• Anderen zijn eenvoudig in staat om de data en de bevindingen te

verifiëren.

• De data kan worden gebruikt om nieuwe onderzoeksvragen te

beantwoorden.

• Delen verkleint de kans op wetenschapsfraude!

5/28/2015www.karakter.com 14

Wetenschapsfraude

5/28/2015www.karakter.com 15

Bron: http://www.nrc.nl/wp-content/uploads/2012/11/wetenschapsfraude.jpg

Wetenschapsfraude

• De Tilburgse hoogleraar

sociale psychologie Diederik

Stapel blijkt op grote schaal te

hebben gefraudeerd met

onderzoeksgegevens (2010).

Bron: http://nl.wikipedia.org/wiki/Diederik_Stapel

5/28/2015www.karakter.com 16

Onjuist omgaan met data - grijs gebied? (1 van 2)

• Het compleet verzinnen van data.

• Ghostwriting: (biomedische wetenschap). Het raamwerk voor een artikel

wordt geschreven door een externe expert, die niet zelden werkt bij een

farmaceutisch bedrijf dat belang heeft bij de voorgenomen publicatie.

‘Onafhankelijke’ wetenschappers zetten vervolgens hun namen boven het

stuk..!

• Fishing: het lukraak, ongericht zoeken in databestanden naar gegevens. En

als er wat interessants opduikt, dit dan presenteren als een doelbewust

uitgevoerd onderzoek.

Bron: http://www.wanttoknow.nl/hoofdartikelen/wetenschappelijk-onderzoek-toont-wetenschapsfraude-aan/

5/28/2015www.karakter.com 17

Onjuist omgaan met data - grijs gebied? (2 van 2)

• Knijpen en kneden: gegevens uit datasets zolang bewerken en aanpassen

totdat er ‘iets significants’ uitrolt.

• Strategisch publiceren: een mooi onderzoek opknippen in meerdere

hapklare publicatiebrokjes en deze dan in verschillende wetenschappelijke

bladen publiceren om zoveel mogelijk publicaties te scoren.

• Name dropping: vaak staan er tussen de auteursnamen boven artikelen

namen van wetenschappers die niets of bijna niets aan het artikel hebben

bijgedragen. Vooral hoogleraren willen graag als mede-auteur worden

opgevoerd. Dat scheelt weer in de publicatielijst.

Bron: http://www.wanttoknow.nl/hoofdartikelen/wetenschappelijk-onderzoek-toont-wetenschapsfraude-aan/5/28/2015www.karakter.com 18

https://www.youtube.com/watch?v=gYDb-GP1CA4&feature=player_embedded

Research Data Management plan (DMP)

5/28/2015www.karakter.com 19

1. Wat staat er in een Data Management plan (DMP)

2. Templates en checklists

Research Data Management plan (DMP)

5/28/2015www.karakter.com 20

1. Wat staat er in een DMP (1 van 2)

De volgende vragen komen aan de orde in een DMP

• Welke data gaat u verzamelen? Wat voor type data of welke

bestandsformaten? Hoeveel?

• Waar en hoe gaat u uw data opslaan? Hoe zorgt u voor back-ups?

• Hoe gaat u uw data organiseren en beschrijven?

• Wie krijgt toegang tot uw data? Wanneer? Hoe gaat u die toegang beheren?

• Welke data worden na afloop van het project gearchiveerd? Waar en voor hoe

lang?

Bron: http://rdm.uva.nl/

5/28/2015www.karakter.com 21

1. Wat staat er in een DMP (2 van 2)

De volgende vragen komen aan de orde in een DMP

• Komen de gearchiveerde data beschikbaar voor anderen? Wanneer? Onder

welke licentie?

• Wie is de eigenaar van uw data? Wie is verantwoordelijk voor het beheer van

uw data?

• (Hoe) is voorzien in de middelen die nodig zijn om dit plan uit te voeren?

Bron: http://rdm.uva.nl/

5/28/2015www.karakter.com 22

2. Templates en checklists

Voor het opstellen van een datamanagementplan zijn verschillende

modellen (templates) en checklists beschikbaar.

Radboud Expert Centre Research Data

http://www.ru.nl/library/services/research/researchdata/dmp/

5/28/2015www.karakter.com 23

Onderzoeksdata zijn waardevol!

Als verzamelde data verloren gaan of onbruikbaar worden, kan het

uiterst kostbaar of zelfs onmogelijk zijn om de data opnieuw te

verwerven.

Goed beheer van onderzoeksdata is een van de belangrijkste taken

van een onderzoeker

Bron: http://rdm.uva.nl/

Data Management tijdens onderzoek

5/28/2015www.karakter.com 24

1. Opslagplaats voor digitale data

2. Organiseren van digitale bestanden

3. Versiebeheer

Data Management tijdens onderzoek

5/28/2015www.karakter.com 25

1. Opslagplaats voor digitale data (1 van 3)

beschikbare ruimte (zo veel mogelijk),

prijs (zo laag mogelijk)

gebruiksgemak (zo groot mogelijk)

Bron: http://rdm.uva.nl/

5/28/2015www.karakter.com 26

1. Opslagplaats voor digitale data (2 van 3)

betrouwbaarheid: kan ik erop vertrouwen dat mijn data niet wegraken en

ik er altijd bij kan?

veiligheid: waar staat de server waarop mijn data opgeslagen zijn precies

en welke wetgeving geldt daar?

exportmogelijkheden: kan ik de data die ik erin stop - bijvoorbeeld in

software voor data-analyse - er ook weer uithalen en in welk

bestandsformaat?

Bron: http://rdm.uva.nl/

5/28/2015www.karakter.com 27

1. Opslagplaats voor digitale data (3 van 3)

• Computer (netwerkschijven)

• Cloud

Vertrouwelijke en gevoelige onderzoeksgegevens NOOIT bij een een publieke cloud-opslagdienst bewaren.

Als je toch gebruik maakt van een Cloud service altijd een back-up op een andere plaats aan houden. Daarnaast de bestanden beveiligen met behulp van encryptie

Bron: http://rdm.uva.nl/

5/28/2015www.karakter.com 28

2. Organiseren van digitale bestanden (1 van 3)

Vier tips

• Organiseer de gegevens in logische categorieën/mappen

• Maak bestanden eenvoudig sorteerbaar

• Maak duidelijk onderscheid tussen versies

• Houd bestandsnamen kort en duidelijk

Bron: http://rdm.uva.nl/

5/28/2015www.karakter.com 29

2. Organiseren van digitale bestanden (2 van 3)

• Zorg ervoor dat bestandsnamen consistent benoemd

worden. Gebruik je bijvoorbeeld de datum in de

bestandsnaam, kies dan hoe je de datum noteert

(bijvoorbeeld YYYYMMDD of yymmdd).

• Plaats geen rare karakters zoals ?\!@*%{[<> in de

bestandsnaam.

Bron: http://datasupport.researchdata.nl/over-de-cursus/

5/28/2015www.karakter.com 30

2. Organiseren van digitale bestanden (3 van 3)

• Geef herleidbare bestandsnamen, zoals

Project_Instrument_locatie_YYYYMMDD.ext.

• Zorg ervoor dat elk bestand maar één keer in de

folderstructuur voorkomt. Als je een bestand op meerdere

plekken opslaat en je gaat één van beiden bewerken, dan

kunnen er ongewild meerdere versies van hetzelfde

bestand ontstaan.

Bron: http://datasupport.researchdata.nl/over-de-cursus/

5/28/2015www.karakter.com 31

3. Versiebeheer – WEES CONSEQUENT

Verschillende versies van bestanden onderscheiden door middel van een versienummer in de

bestandsnaam, voorafgegaan door een kleine v.

Bijvoorbeeld:

ADHD_IQ_20150422_v1

Meelezers kunnen vervolgens hun initialen erachter plakken

ADHD_IQ_20150422_v1_HK

Volgende versie wordt dan:

ADHD_IQ_20150525_v2

Maak ook altijd een definitieve versie en zet deze in een aparte map!

ADHD_IQ_20150615_DEFINITIEF

5/28/2015www.karakter.com 32

Welke acties ga je nu

ondernemen na

aanleiding van deze

presentatie?

5/28/2015www.karakter.com 33

Hartelijk

Dank voor uw

aandacht

5/28/2015www.karakter.com 34