introduction to pangaea & euro-basin data management, by janine felden

22
Data Management & Integration – Janine Felden Statistical Modeling Workshop, 26. – 28.10.2011 Data Management and Integration within EUROBASIN Janine Felden & Stéphane Pesant

Upload: euro-basin-programme

Post on 31-Oct-2014

788 views

Category:

Education


0 download

DESCRIPTION

Key lecture for the EURO-BASIN Training Workshop on Introduction to Statistical Modelling for Habitat Model Development, 26-28 Oct, AZTI-Tecnalia, Pasaia, Spain (www.euro-basin.eu)

TRANSCRIPT

Page 1: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Data Management and Integration within EUROBASIN

Janine Felden & Stéphane Pesant

Page 2: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Who I am.......

• Master Marine Microbiology • PhD: quantification benthic biogeochemical processes and in situ 

flux measurements in cold seep ecosystems (chemosynthetic environments) 

• PostDoc: – data manager in the EU Project HERMIONE (Hotspot Ecosystem Research and Man's 

Impact On European Seas) & benthic activity of arctic deep sea sediment

• NOW: data curator in EUROBASIN (WP1) – to support project partners during data submission and mining to and 

from PANGAEA 

© MARUM, Bremen © MARUM, Bremen © MARUM, Bremen © MARUM, Bremen

Page 3: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

EUROBASIN WP 1  Objectives:

• Develop methods to consolidate and integrate long‐term observations from European and international databases

• Assemble historical data, new field observations andexperimental results into comprehensive datasets formodelling and prediction of the Atlantic Ocean ecosystem andrelated services.

work with PANGAEA as database 

Page 4: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

What is PANGAEA?

Data are stored georeferenced in space and time in a relational database and a tape archive.

The data content is accessible on the Internet via a search engine, a data warehouse and web services.

The system is open to any scientist or project to archive and publish data.

Rijksmuseum Research Library, Amsterdam

©http://libraryjum

pers.web

s.com/

(...is a data library for earth system research.)

Page 5: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Data submission via

Online ticket system (JIRA Client):

Page 6: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Data PublicationPANGAEA provide

• free and Open Access or Restricted Access (password) to data, 

according to data policy 

Page 7: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Page 8: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Data Publication

Page 9: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Data Publication‐ PANGAEA provide‐

• free and Open Access or Restricted Access (password) to data, 

according to data policy 

• free and Open Access to metadata

• Persistent and web‐resolvable Digital Object Identifiers (DOI)

Page 10: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Data Publication‐ DOI Model ‐

• Each data point is fully citable with a persistent identifier (DOI)

• Cross‐reference with journal articles

• Pre‐publication, peer‐review process

• Thomson Reuters and Elsevier will soon launch Data Citation 

Impact Factors based on data DOI

• Creative Commons Attribution license which requires that 

datasets are cited when data are used & re‐used

Page 11: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Page 12: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Data Publication

Page 13: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

PANGAEA Data Mining

• Google‐like & advanced metadata discovery (public)

Page 14: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

PANGAEA Search

Page 15: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

PANGAEA Data Mining

• Google‐like & advanced metadata discovery (public)

• Data Warehouse for mass extraction (EuroBASIN partners)

Page 16: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Data Warehouse

Page 17: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Data Warehouse

Page 18: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Data Warehouse

Page 19: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Data Warehouse

Page 20: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

PANGAEA Data Mining

• Google‐like & advanced metadata discovery (public)

• Data Warehouse for mass extraction (EuroBASIN partners)

• Web‐services linking data publications and journal 

publications, e.g. Elsevier, Copernicus, AGU and Springer

Page 21: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Link to publisher

Page 22: Introduction to PANGAEA & EURO-BASIN Data Management, by Janine Felden

Data Management & Integration – Janine Felden Statistical  Modeling Workshop,  26. – 28.10.2011

Sum up

• PANGAEA offers various tools and support for data submission and data mining

• PANGAEA data publications provide benefits for the authors and scientific community  (e.g.DOI, permanent data storage)

! PANGAEA data quantity & quality depends on the data that are provided by the scientist !

Thus:• support the work of EUROBASIN WP1! • for any data work including worries and ideas contact us 

(Stéphane Pesant ([email protected])  or me (jfelden@mpi‐bremen.de))