„Keeping data: The process of data curation“

 

Ve dnech 19. a 20. května se ve Vídni konala konference „Keeping data: The process of data curation“. Toto setkání pořádala asociace LIBER, která je s více než 420 členy největším sdružením vědeckých knihoven v Evropě. Konference se zúčastnilo téměř sto účastníků převážně z evropských zemí. Mezi nimi se nacházeli nejen zástupci vědeckých a univerzitních knihoven, ale také vědečtí pracovníci a zástupci IT firem spolupracujících s knihovnami.

Většina příspěvků tohoto setkání se týkala problematiky ukládání digitálních dat, jejich co nejširšího sdílení mezi institucemi, dlouhodobého uchovávání a zachování jejich dostupnosti. V současné době jsou digitální data velikým zdrojem informací pro vědecké pracovníky a jejich role neustále roste. Stále se rozšiřují možnosti jejich ukládání, zpřístupňování i „strojového zpracování“. Vědecké knihovny by měly v této situaci plnit roli zprostředkovatele – stávají se místem koncentrace informací a zprostředkovatelem přístupů k dalším zdrojům digitálních dat. Cílem tohoto setkání bylo na konkrétních i obecných příkladech ukázat cesty, kterými je možné tuto změnu provádět, jak navazovat a prohlubovat spolupráci mezi knihovnami a vědeckými institucemi v oblasti uchovávání a sdílení dat v digitální podobě.

První a současně jeden z hlavních příspěvků přednesl dr. Herbert Van de Sompel, který nám představil své dokončené i probíhající projekty. Tento původem belgický knihovník a matematik v současné době působí v Národní laboratoři v Los Alamos v USA, kde vede tým pracovníků zabývající se problematikou uchovávání vědeckých dat v digitální době, informační infrastruktury a repozitářů. Velká část výstupů jeho vědecké práce byla pozitivně přijata a jsou v dnešní době používány v praxi. Mezi ně patří např. protokol OAI-PMH – systém sklízení metadat jednotlivých repozitářů umožňující sdílení dat. Tento projekt měl velký ohlas, což dokládá velké rozšíření tohoto protokolu mezi vědeckými a paměťovými institucemi. Mezi další dokončené projekty jeho týmu patří MESUR a MEMENTO. V rámci tohoto příspěvku autor publiku představil svůj aktuální projekt ResourceSync, kterým navazují na protokol OAI-PMH a nadále ho rozšiřují. Druhý probíhající výzkum tohoto týmu se jmenuje Hiberlink, který si klade za cíl prostudovat problematiku dlouhodobé dostupnosti odborných dokumentů zveřejňovaných na internetu a možných způsobů archivování těchto dat, ale i vazeb a struktur mezi nimi.

Velká část prezentujících přednášela o vytváření sítí repozitářů na národní i mezinárodní úrovni. Ayhan Kaygusuz, ředitel knihovny Istanbulské univerzity, představil probíhající projekt zřizování sítě akademických repozitářů v Turecku. O podobném projektu realizovaném v Rakousku hovořil dr. Paolo Budroni z Vídeňské univerzitní knihovny. Na tomto projektu nazvaném e-Infrastructures Austria spolupracuje 25 vědeckých institucí. Výsledkem projektu by měla být nejen vytvořená síť lokálních repozitářů ve všech zapojených institucích, ale i vznik centrálního vědeckého repozitáře.

Dalším velkým tématem konference byl data management plan. Tímto pojmem je označována strategie zacházení s daty, která vznikají při vědeckém výzkumu. Tato strategie by měla předcházet každému vědeckému projektu a měla by definovat, jakým způsobem budou uchována a zveřejněna nejen výstupní, ale i „pomocná“ data. Obecně o realizaci tohoto projektu referoval profesor Andreas Rauber z Technické univerzity ve Vídni. Konkrétní informace o úspěších a úskalích data management plánu v praxi na půdě Univerzitní knihovny v Leidenu představil Hans Fransen.

Poslední příspěvek na konferenci přednesla Marjan Grootveldová z Data Archiving and Network Services sídlící v Haagu, která se zabývá problematikou digitálních repozitářů a podílí se na projektech udělování certifikátů důvěryhodnosti digitálních repozitářů. Tyto certifikáty slouží zřizovateli k ověření, zda jeho repozitář splňuje všechny parametry dlouhodobé funkčnosti a dlouhodobé dostupnosti zde uložených dat po stránce hardwarové a softwarové. V tomto příspěvku byly představeny a porovnány tři standardy certifikace – Data Seal of Approval, DIN 31644 a ISO 16363. První z nich poskytuje základní certifikaci, která již byla udělena téměř třiceti repozitářům. DIN 31644 poskytuje vyšší úroveň certifikace, klade více požadavků na zřizovatele repozitáře a jeho provedení je náročnější. Poslední zmíněná certifikace ISO 16363 poskytuje nejvyšší (formální) ověření důvěryhodnosti repozitáře, což dokládá i fakt, že na rozdíl od předchozích dvou certifikátů probíhá formou externího auditu.

Tato konference přinesla mnoho zajímavých nápadů, otázek i odpovědí, které můžeme využít v projektu České digitální knihovny, ale i v ostatních projektech digitalizace a práce s digitálními daty v českém prostředí.

http://liber2014.univie.ac.at/home/

 

 

Daněčková, Michala; Lhoták, Martin. „Keeping data: The process of data curation“. Informace [online]. , č. [cit. 2020-10-27]. ISSN 1805-2800. Dostupné z: https://www.lib.cas.cz/casopis_informace/keeping-data-the-process-of-data-curation/

Tisknout stránku