Digitální knihovna Akademie věd ČR

 

Článek byl převzat a aktualizován ze sborníku: České oborové bibliografie: sborník z interdisciplinárního semináře. Praha: Ústav pro českou literaturu AV ČR, 2017. Bibliographica (Ústav pro českou literaturu AV ČR). ISBN 978-80-88069-46-1.

Digitální knihovna Akademie věd České republiky

Digitalizační centrum Knihovny Akademie věd České republiky bylo vybudováno v roce 2003 a otevřeno na počátku roku 2004. Začal v něm probíhat proces digitalizace a zpřístupnění knihovního fondu vědecké produkce Akademie věd České republiky (dále jako AV ČR) a jejích předchůdkyň. Hlavním výstupem Digitalizačního centra se stala Digitální knihovna AV ČR (dále jen jako Digitální knihovna), která se zaměřuje na ukládání a zpřístupnění vědeckých publikací. Jako prezentační rozhraní Digitální knihovny byl zvolen systém Kramerius – software vyvinutý pro zpřístupnění digitalizovaných materiálů.

Digitální knihovna soustředí digitalizovanou produkci vědeckých ústavů AV ČR. Její součástí jsou jak periodika (v polovině roku 2017 je to 190 titulů), tak monografie (aktuálně 3 000 titulů). Digitální knihovna obsahuje přes 3 miliony digitalizovaných stránek vědeckých publikací, převážně z 20. a 21. století. Nejstarší publikace v Digitální knihovně jsou z přelomu 16. a 17. století. Nově přibývají také digitální dokumenty, které vznikají jako born digital. Jedná se především o články z akademických periodik a knihy z nakladatelství Academia. Takto vzniklých článků obsahuje Digitální knihovna již více než 14 700. Navíc jsou v Digitální knihovně postupně zpřístupňovány speciální kolekce dokumentů. Chloubou mezi nimi je sbírka starých tisků, z nichž jako první byla zpřístupněna unikátní Martinická bible, dále pak soubor starých čínských tisků z fondu Orientálního ústavu AV ČR.

Analytická báze Knihovny AV ČR a její využití pro Digitální knihovnu

V Digitální knihovně jsou archivovány a zpřístupněny plné texty a k nim se vztahující bibliografické záznamy článků, periodik a monografií. Plné texty článků jsou získávány buď jako dokumenty vzniklé v digitální podobě od vydavatelů periodik nebo digitalizací tištěných předloh.

Pro tvorbu metadatových záznamů jsou využívány systémy Aleph a ProArc. Záznamy jsou zpracovávány z online verzí článků, dostupných volně na webu, z digitálních verzí článků dodávaných redakcemi periodik a z tištěných verzí článků. Schéma zpracování záznamů článků znázorňuje obrázek 1.

Obrázek 1: Schéma zpracování analytických záznamů periodik

Zpracování analytických záznamů z periodik v systému Aleph

Databáze článků Knihovny AV ČR je přístupná na adrese http://aleph20.lib.cas.cz/F/?func=file&file_name=find-b&local_base=KNAVA.

Systém Aleph je pro všechny ústavy Akademie věd ČR provozován Knihovnou AV ČR (dále jako KNAV). Každá ústavní knihovna, která se rozhodne Aleph používat, v něm má přidělenou svou bázi, případně báze. Do nich ukládá své záznamy. V Knihovně AV ČR jsou pro zpracování záznamů využívány tři báze – KNA pro monografie, KNAVC pro seriály a KNAVA pro analytické záznamy.

Záznamy v Alephu jsou ukládány ve formátu MARC 21[1] a jsou zpracovány podle katalogizačních pravidel RDA[2], aktuálně platných v ČR. Zpracovávání analytických záznamů se řídí metodikou, která byla vypracována analytickým oddělením Národní knihovny ČR.

Báze KNAVA byla spuštěna v testovacím režimu v roce 2012. V ostrém provozu jsou v ní články zpracovávány od začátku roku 2013. Počátek zpracování článků v Alephu se pojí s účastí KNAV na projektu „Vytváření a obohacení záznamů článků pro databázi ANL“. Projektu se KNAV účastní od roku 2013 do současnosti. Projekt je financován z programu Veřejné informační služby knihoven (VISK) 9/I Ministerstva kultury České republiky. Jedná se kooperační projekt krajských knihoven a KNAV. Hlavním požadavkem pro získání dotace z programu VISK je zasílání záznamů ve formátu MARC 21 do Souborného katalogu ČR, konkrétně do báze ANL. Dalším požadavkem je dodržování pravidel pro popis Souborného katalogu „Záznam pro soubornou databázi: MARC 21. Fyzicky nesamostatné části dokumentu. Tištěné monografie a seriály“, stanovených Národní knihovnou ČR.

Tituly periodik pro zpracování v Alephu a odeslání do ANL jsou vybírány po konzultaci s koordinátorem celého projektu – Studijní a vědeckou knihovnou v Hradci Králové. Tím se zamezuje duplicitnímu zpracování ve spolupracujících knihovnách. Výhodou účasti na kooperačním projektu a přispívání do souborné databáze je možnost stahování záznamů z báze ANL do báze KNAVA. Záznamy článků z akademických periodik, které v rámci kooperačního projektu zpracovávají ostatní knihovny, mohou být stahovány přes protokol Z39.50. Knihovny spolupracující na projektu jsou povinny dodržovat stejný formát dat a stejná pravidla popisu. To při stahování záznamů zaručuje stejnou kvalitu a úroveň zpracování.

V letech 2013–2017 bylo v Alephu KNAV zpracováno přes 28 000 záznamů z 56 titulů periodik. Primárním cílem je souběžné zpracování aktuálního roku vydání. Současně probíhá i retrospektivní zpracování do roku 1999. Zpracovanou retrospektivu jednotlivých titulů přehledně shrnuje Tabulka 1:

Tabulka 1: Přehled periodik zpracovaných v systému Aleph
Název ISSN Zpracovaná retrospektiva
A / věda a výzkum 2533-784X 2017
Acta geodynamica et geomaterialia 1214-9705 2004–2008
Acta onomastica 1211-4413 2010–2016
Akademický bulletin 1210-9525 2002–2016
Applications of mathematics 0862-7940 1999–2017
Archiv orientální 0044-8699 2012–2017
Biologia plantarum 0006-3134 2012–2017
Botanika 2336-2243 2013–2016
Byzantinoslavica 0007-7712 2011–2015
Czechoslovak mathematical journal 0011-4642 2015–2017
Časopis pro moderní filologii 0862-8459 2007–2016
Časopis zdravotnického práva a bioetiky 1804-8137 2011–2017
Česká literatura 0009-0468 2012–2017
Československá psychologie 0009-0468 2012–2017
Československý časopis pro fyziku 0009-0700 2007–2017
Český časopis historický 0862-6111 2012–2017
Český lid 0009-0794 2012–2017
Data a výzkum – SDA info 1802-8152 2003–2015
Echo 1214-7982 2004–2017
Ergo 1802-2006 2006–2017
Estetika 1802-2006 2012–2017
European journal of entomology 1210-5759 2011–2017
Filosofický časopis 0015-1831 2012–2017
Folia historica Bohemica 0231-7494 2007–2015
Folia parasitologica 0015-5683 2011–2017
Gender, rovné příležitosti, výzkum 1213-0028 2007–2016
Germanoslavica 1210-9029 2009–2017
Historická demografie 0323-0937 2003–2017
Historická geografie 0323-0988 2003–2016
Hospodářské dějiny 0231-7540 2009–2012
Hudební věda 0018-7003 2012–2013
Jemná mechanika a optika 0447-6441 2000–2017
Linguistica Pragensia 0862-8432 2006–2014
Listy filologické 0024-4457 2012–2016
Mathematica Bohemica 0862-7959 2009–2017
Mediaevalia historica Bohemica 0862-979X 2007–2015
Moderní dějiny 0862-979X 2004–2016
Naše řeč 0027-8203 2009–2017
Naše společnost 1214-438X 2003–2016
Nový Orient 0029-5302 2012–2016
Photosynthetica 0300-3604 2012–2017
Physiological research 0862-8408 1999–2017
Právník 0231-6625 2012–2017
Preslia 0032-7786 2012–2017
Přehled výzkumů 1211-7250 2003–2015
Slavia 0037-6736 2010–2016
Slovanský přehled 0037-6922 2012–2016
Slovo a slovesnost 0037-7031 2012–2017
Sociologický časopis 0038-0288 2011–2017
Soudobé dějiny 1210-7050 2012–2015
Studia geophysica et geodaetica 0039-3169 2002–2017
Studia mediaevalia Bohemica 1804-0977 2009–2014
Studia Rudolphina 1213-5372 2009–2015
Teorie vědy 1210-0250 2003–2016
Umění 0049-5123 2012–2017
Živa 0044-4812 2012–2017

Zpracování analytických záznamů z periodik v systému ProArc

ProArc je produkční a archivační systém pro digitalizaci, který umožňuje vytvářet záznamy článků a přikládat k nim plné texty. Záznamy jsou v něm ukládány ve formátu MODS[3] a jsou vytvářeny podle standardů Národní digitální knihovny pro periodika[4], rozšířených o interní pravidla Knihovny AV ČR. Metadata do ProArcu jsou vkládána přes webový formulář. V něm také probíhá přidávání plných textů. Zpracování v tomto systému začalo v roce 2015 (zkušební provoz), resp. 2016 (ostrý provoz).

Obrázek 2: Metadatový formulář v systému ProArc

Systém ProArc umožňuje také stahování a upravování záznamů z analytické báze v Alephu Knihovny AV ČR a ze Souborného katalogu ČR. Stažené záznamy jsou v ProArcu konvertovány do metadatového formátu MODS, doplněny o potřebná metadata a jsou k nim přiloženy plné texty článků. Takto obohacené záznamy jsou využívány pro Digitální knihovnu.

V letech 2016–2017 bylo v ProArcu zpracováno 40 titulů periodik. Primárním cílem je, stejně jako v případě zpracování v Alephu, souběžné vytváření záznamů z aktuálního roku vydání. Současně probíhá i retrospektivní zpracování do roku 1994. Zpracovanou retrospektivu jednotlivých titulů přehledně shrnuje Tabulka 2.

Tabulka 2: Přehled periodik zpracovaných v systému ProArc
Název ISSN Zpracovaná retrospektiva
Acta Comeniana 0231-5955 2014
Acta geodynamica et geomaterialia 1214-9705 2017
Acta onomastica 1211-4413 2016
Acta technica 1210-714X 2008, 2012–2017
Akademický bulletin 1210-9525 2009–2016
Archeologické rozhledy 0323-1267 2012–2017
Critical housing analysis 2336-2839 2014–2017
Časopis zdravotnického práva a bioetiky 1804-8137 2011–2017
Česká literatura 0009-0468 2012–2017
Československá psychologie 0009-062X 2009–2017
Český časopis historický 0862-6111 2012–2016
Český lid 0009-0794 2013–2017
E-psychologie 1802-8853 2007–2017
Estetika 1802-2006 2016–2017
Filosofický časopis 0015-1831 2005, 2007–2017
Folia historica Bohemica 0231-7494 2012–2016
Folia zoologica 0139-7893 2012–2017
Gender, rovné příležitosti, výzkum 1213-0028 2015–2016
Historica 1210-8499 2002–2010
Historická demografie 0323-0937 2010–2017
Historická geografie 0323-0988 2012–2016
Hudební věda 0018-7003 2014–2016
Journal of hydrology and hydromechanics 0042-790X 2017
Knihy a dějiny 1210-8510 1994–2003, 2009–2016
Kybernetika 0023-5954 2017
Mediaevalia historica Bohemica 0862-979X 2016
Moderní dějiny 0862-979X 2012–2016
Naše řeč 0027-8203 2016–2017
Physiological research 0369-9463 1995–2017
Právník 0231-6625 2013–2017
Preslia 0032-7786 2012–2017
Slovo a slovesnost 0037-7031 2016–2017
Sociologický časopis 0038-0288 2016–2017
Střed 1803-9243 2015–2016
Studie o rukopisech 0585-5691 2016
Teorie vědy 1210-0250 2016
Theatralia 1803-845X 2015–2016
Umění 0049-5123 2013–2016
Vesmír 0042-4544 2017
Živa 0044-4812 2003–2004, 2012–2017

Systém ProArc umožňuje využití metadat nejen v Digitální knihovně, ale také jejich odesílání do různých vědeckých databází článků a periodik. Nyní prvním rokem probíhá odesílání článkových metadat do databáze CEJSH[5]. V listopadu 2016 bylo spuštěno také odesílání informací do databáze CrossRef[6]. Zprostředkovaně přes prezentační software Kramerius probíhá také odesílání záznamů článků do databází Web of Science[7] a Scopus[8]. Zároveň je ProArc kompatibilní s již existujícími řešeními v České republice, mezi něž patří zejména Registr digitalizace[9], takže je možné metadata odesílat také do něj.

Zpřístupnění Digitální knihovny AV ČR v systému Kramerius

Obrázek 3: Úvodní strana Digitální knihovny AV ČR

Webové rozhraní Digitální knihovny je přístupné na adrese http://kramerius.lib.cas.cz/. Úvodní obrazovka je určena k vyhledávání v plných textech dokumentů a v metadatech. Prohledávání plných textů digitalizovaných dokumentů je umožněno díky rozpoznávání textu metodou OCR. Výsledky vyhledávání lze zpřesnit použitím filtrů, například podle dostupnosti dokumentu nebo klíčových slov. Hned na úvodní stránce je možné si také zobrazit nejžádanější, nejnovější nebo vybrané dokumenty. Systém v neposlední řadě nabízí prohledávání názvového a autorského rejstříku, vyhledávání na časové ose podle data vzniku dokumentu a prohlížení sbírek – tematických kolekcí, vytvořených administrátorem.

Vyhledané dokumenty lze buď prohlížet přímo online v Digitální knihovně, nebo je uložit na vlastní zařízení ve formě originálního souboru nebo ve formátu PDF. Systém podporuje také vyhledávání v plných textech konkrétního článku nebo určité stránky. Dále Kramerius poskytuje možnost ukládání vyhledaných dokumentů do oblíbených a jejich sdílení na sociálních sítích.

Obrázek 4: Zobrazení článku v Digitální knihovně AV ČR

Zpřístupnění plných textů v Digitální knihovně je limitováno Autorským zákonem. Proto jsou na internetu volně dostupné ty dokumenty, které již nespadají pod ochranu Autorského zákona. Výjimku tvoří případy, kdy licenční smlouva s příslušnými vydavateli umožňuje zpřístupnění před uplynutím této lhůty. Některá periodika jsou volně dostupná v režimu open access, nebo jen s několikaletým embargem od data vydání. Volný přístup k plným textům všech dokumentů je zajištěn ve studovně Knihovny AV ČR.

Použitá literatura

  1. GEC, Tomáš. Rozhovor s Martinem Lhotákem. Duha [online]. 2012, roč. 26, č. 1.
  2. LHOTÁK, Martin. Česká digitální knihovna. Duha [online]. 2016, roč. 30, č. 3.
  3. ŠLAPÁKOVÁ, Ivana: Zpracování a zpřístupňování časopiseckých článků v Digitální knihovně AV ČR – část 1. Informace [online]. 2014, č. 3.
  4. ŠLAPÁKOVÁ, Ivana: Zpracování a zpřístupňování časopiseckých článků v Digitální knihovně AV ČR – část 2. Informace [online]. 2014, č. 4.

 


[1] Machine-Readable Cataloging; https://www.loc.gov/marc/

[2] Resource, Description and Access; https://www.loc.gov/aba/rda/

[3] Metadata Object Description Schema; http://www.loc.gov/standards/mods

[4] http://www.ndk.cz/standardy-digitalizace/metadata

[5] The Central European Journal of Social Sciences and Humanities; http://cejsh.icm.edu.pl

[6] http://www.crossref.org/

[7] https://webofknowledge.com/

[8] https://www.scopus.com/

[9] http://www.registrdigitalizace.cz/

 

 

 

Šlapáková, Ivana. Digitální knihovna Akademie věd ČR. Informace [online]. , č. [cit. 2024-03-19]. ISSN 1805-2800. Dostupné z: https://www.lib.cas.cz/casopis_informace/digitalni-knihovna-akademie-ved-cr/

Tisknout stránku