digital curation

15
Digital Curation Pavla Švástová [email protected] Moravská zemská knihovna v Brně 14.5.2014 MZK Brno

Upload: pavluskas

Post on 27-Jun-2015

100 views

Category:

Data & Analytics


3 download

TRANSCRIPT

Page 1: Digital curation

Digital Curation

Pavla Švástová[email protected]á zemská knihovna v Brně

14.5.2014 MZK Brno

Page 2: Digital curation

Moravská zemská knihovna

Co to je digital curation?

● Digital curation involves maintaining, preserving and adding value to digital research data throughout its lifecycle (Digital Curation Centre)

○ Digitální kurátorství zahrnuje správu, ochranu a zhodnocení digitálních výzkumných dat během jejich životního cyklu.

○ http://www.dcc.ac.uk/digital-curation/what-digital-curation

● Digital curation is the selection, preservation, maintenance, collection and archiving of digital assets. Digital curation establishes, maintains and adds value to repositories of digital data for present and future use. (Wikipedia)

○ Digitální kurátorství zahrnuje výběr, ochranu, správu, shromažďování a archivování digitálního jmění. Digitální kurátorství vytváří, spravuje a přidává hodnotu repozitářům digitálních dat pro současné i budoucí využití.

○ http://en.wikipedia.org/wiki/Digital_curation

● Informační kurátorství

○ http://www.inflow.cz/co-je-informacni-kuratorstvi

Page 3: Digital curation

Moravská zemská knihovna

Rozdíl mezi DP a DC

Jaký je rozdíl mezi Digital Preservation a Digital Curation?● http://blogs.loc.gov/digitalpreservation/2011/08/digital-preservation-digital-curation-digital-

stewardship-what%E2%80%99s-in-some-names/● Digital Preservation je podmnožinou Digital Curation

○ DC se zabývá všemi částmi životního cyklu všech digitálních dokumentů v instituci včetně jejich ochrany (nebo naopak “neochrany”) od vzniku dokumentu až po smazání

○ DP zahrnuje “pouze” část ochrannou - tedy jak nakládat s již vytvořenými dokumenty, které jsme vybrali pro dlouhodobou archivaci

Page 4: Digital curation

Moravská zemská knihovna

Curation Lifecycle Model (CLM)

● data○ digital objects○ databases

● full lifecycle actions○ description and representation○ preservation planning○ community watch and

participation○ curate and preserve

● sequential actions○ conceptualise○ create or recieve○ appraise and select○ ingest○ preservation action○ store○ access, use and reuse○ transform

● occasional actions○ dispose○ reappraise○ migrate

Page 5: Digital curation

Moravská zemská knihovna

Curation Lifecycle Model (CLM)

● Model vyjadřuje grafický více-úrovňový přehled stupňů potřebných pro úspěšnou správu a ochranu dat.

● Může být použit v instituci, která spravuje digitální data, k ujištění, že jsou pokryty všechny kroky nutné ke správě dat.

● Jedná se o ideální model - v reálu je samozřejmě model upraven podle potřeb instituce a závisí také na konkrétním repozitáři dat.

Page 6: Digital curation

Moravská zemská knihovna

CLM I. - Data

● Jakékoliv informace v digitální podobě

● Digital Objects (digitální objekty)

○ jednoduché DO - textové soubory, obrázky, zvukové soubory a audiovizuální soubory atd. včetně příslušných identifikátorů a metadat

○ komplexní DO - objekty, které kombinují množství jednoduchých digitálních objektů, např. webové stránky

● Databases (databáze)

○ strukturované kolekce záznamů nebo dat uložených v počítačovém systému

Page 7: Digital curation

Moravská zemská knihovna

CLM II. - Full Lifecycle Actions

● Description and Representation Information (popis a reprezentace informací)○ přiřazení administrativních, deskriptivních, technických, strukturálních a ochranných metadat,

které poskytují takový popis, který budeme potřebovat pro dlouhodobou ochranu dokumentů, vše ve vhodných standardech

○ sbírání a přiřazení reprezentačních informací potřebných pro porozumění a zobrazení digitálních dokumentů včetně příslušných metadat

● Preservation Planning (plánování ochrany)○ plán ochrany během životního cyklu digitálních materiálů○ plán řízení a administrace celého procesu všech akcí

● Community Watch and Participation (sledování a zapojení se do komunity)○ udržování povědomí o aktivitách komunity kolem digital

curation a zapojování se do vývoje standardů, nástrojů asoftwaru

● Curate and preserve (spravovat a chránit)○ provádět správu a administrativní akce plánované

k podpoře kurátorství po celou dobu jeho životního cyklu

Page 8: Digital curation

Moravská zemská knihovna

CLM III. - Sequential Actions

● Conceptualise (vytvoření koncepce)○ vymyslet a naplánovat tvorbu dat včetně pořizovacích metod a možností uložení

● Create or Recieve (vytvoření nebo příjem)○ vytváření dat včetně administrativních, popisných, strukturálních, technických a ochranných

metadat○ přijímání dat (v souladu se zdokumentovanými pravidly takového příjmu) od tvůrců, jiných

archivů, repozitářů nebo datacenter včetně příslušných metadat

● Appraise and Select (odhad a výběr)○ zhodnocení dat a výběr pro dlouhodobou správu a ochranu○ držet se dokumentačních příruček, pravidel nebo právních požadavků

● Ingest○ přesun data do archivu, repozitáře, datacentra apod.○ držet se dokumentačních příruček, pravidel nebo

právních požadavků

Page 9: Digital curation

Moravská zemská knihovna

CLM III. - Sequential Actions

● Preservation Action (ochranné akce)○ provedení opatření k zajištění dlouhodobé ochrany a udržení autoritní povahu dat○ ochranné akce by měly zajišťovat, že data zůstanou autentická, důvěryhodná a použitelná při

zachování integrity○ akce zahrnující čištění dat, validaci, přiřazení ochranných metadat, uvedení reprezentačních

informací a ujištění se o vhodnosti datových struktur a formátech souborů

● Store (uložení)○ bezpečné uložení dat podle příslušných standardů

● Access, Use and Reuse (přístup, použití a znovupoužití)○ ujištění se, že data jsou každodenně přístupná uživatelům

i “znovuuživatelům”○ může to být ve formě veřejně dostupných informací○ může být použit robustní systém kontroly přístupových

práv a autentikačních postupů

● Transform (konverze)○ vytváření nových dat z původních originálů

např. migrací z jiného formátu nebo vytvořenímpodmnožiny dat výběrem nebo dotazem třeba prozpřístupnění

Page 10: Digital curation

Moravská zemská knihovna

CLM III. - Sequential Actions

● pro každou ze Sequential Actions existuje Checklist s několika otázkami, na které by měl kurátor znát odpověď

● např. pro fázi Create or Receive○ Know who you are creating your data for and what you want them to be able to do (and not do)

with it. Communicate this with others on the project. ○ Identify any data protection requirements that you need to address in the course of your

research and ensure that these are communicated to all staff.○ Agree from an early stage any standards you will be making use of for content, syntax, and

structure. Once these have been agreed, make sure they are communicated - both to other researchers on the project and to the data/information managers you will be working with. Provide training if necessary.

○ Identify data quality metrics as soon as possible and ensure that these are communicated and monitored.

○ Work together - researchers and information managers need to communicate regularly. Neither can do their job in isolation.

○ Be realistic – strike a balance between what is sufficient and what is ideal based on your practical realities.

Page 11: Digital curation

Moravská zemská knihovna

CLM IV. - Occasional Actions

● Dispose (odstranění)○ odstranění dat, která nebyla vybrána pro dlouhodobou archivaci, v souladu se směrnicemi○ typicky se může jednat o přesun do jiného archivu, repozitáře nebo data centra, v některých

případech mohou být odstraněna úplně např. z právních důvodů a musí být odstraněna bezpečně

● Reappraise (přehodnocení)○ vrátit data, která neprošla validací, k přehodnocení

● Migrate (migrace)○ migrace dat do jiného formátu○ může být provedeno kvůli souladu s prostředím

úložiště nebo kvůli nezávislosti dat na konkrétním hardwaru nebo softwaru

Page 12: Digital curation

Moravská zemská knihovna

Curation Lifecycle Model (CLM)

● model byl publikován v roce 2007● pro nás to znamená zejména:

○ začít přemýšlet nad workflow ○ udělat si výchozí analýzu (co máme, co chceme)○ začít sepisovat směrnice a návody○ vyčlenit osobu/y, které se o data starají a znají jejich historii○ zamyslet se nad financováním○ ...

Page 13: Digital curation

Moravská zemská knihovna

Curation Reference Manual (CRM)

● manuál je tvořen od roku 2006 a stále se pokračuje na nových kapitolách● obsahuje např. kapitoly:

○ Appraisal and Selection○ Archival Metadata○ File Formats○ Curating E-mails○ Preservation Metadata○ Scientific Metadata○ Automated Metadata Generation○ Lifecycle Planning (chystá se, bohužel není napsáno na kdy)○ Using the OAIS Reference Model for Curation (chystá se)○ Video Data (chystá se)

Page 14: Digital curation

Moravská zemská knihovna

Co sledovat?

● Digital Curation Forum https://groups.google.com/forum/#!forum/digital-curation● Digital Preservation CZ http://digital-preservation-cz.blogspot.cz/ ● International Journal of Digital Curation http://www.ijdc.net/index.php/ijdc/issue/current● D-Lib Magazine http://www.dlib.org/● The Signal - Digital Preservation http://blogs.loc.gov/digitalpreservation/ (LoC)● DigCurV http://www.digcur-education.org/● Digital Preservation Coalition http://www.dpconline.org/

Použité zdroje:

● http://digital-scholarship.org/dcbw/dcb.pdf● http://alistapart.com/article/content-strategist-as-digital-curator● http://kevinthelibrarian.wordpress.com/2012/07/20/an-introduction-to-the-data-curation-lifecycle-

model-where-do-librarians-fit-in/

Page 15: Digital curation

Moravská zemská knihovna v Brněwww.mzk.cz

Děkuji za pozornost

Pavla Švástová[email protected]