Digitální knihovna Akademie věd ČR

 

Článek byl převzat a aktualizován ze sborníku: České oborové bibliografie: sborník z interdisciplinárního semináře. Praha: Ústav pro českou literaturu AV ČR, 2017. Bibliographica (Ústav pro českou literaturu AV ČR). ISBN 978-80-88069-46-1.

Digitální knihovna Akademie věd České republiky

Digitalizační centrum Knihovny Akademie věd České republiky bylo vybudováno v roce 2003 a otevřeno na počátku roku 2004. Začal v něm probíhat proces digitalizace a zpřístupnění knihovního fondu vědecké produkce Akademie věd České republiky (dále jako AV ČR) a jejích předchůdkyň. Hlavním výstupem Digitalizačního centra se stala Digitální knihovna AV ČR (dále jen jako Digitální knihovna), která se zaměřuje na ukládání a zpřístupnění vědeckých publikací. Jako prezentační rozhraní Digitální knihovny byl zvolen systém Kramerius – software vyvinutý pro zpřístupnění digitalizovaných materiálů.

Digitální knihovna soustředí digitalizovanou produkci vědeckých ústavů AV ČR. Její součástí jsou jak periodika (v polovině roku 2017 je to 190 titulů), tak monografie (aktuálně 3 000 titulů). Digitální knihovna obsahuje přes 3 miliony digitalizovaných stránek vědeckých publikací, převážně z 20. a 21. století. Nejstarší publikace v Digitální knihovně jsou z přelomu 16. a 17. století. Nově přibývají také digitální dokumenty, které vznikají jako born digital. Jedná se především o články z akademických periodik a knihy z nakladatelství Academia. Takto vzniklých článků obsahuje Digitální knihovna již více než 14 700. Navíc jsou v Digitální knihovně postupně zpřístupňovány speciální kolekce dokumentů. Chloubou mezi nimi je sbírka starých tisků, z nichž jako první byla zpřístupněna unikátní Martinická bible, dále pak soubor starých čínských tisků z fondu Orientálního ústavu AV ČR.

Analytická báze Knihovny AV ČR a její využití pro Digitální knihovnu

V Digitální knihovně jsou archivovány a zpřístupněny plné texty a k nim se vztahující bibliografické záznamy článků, periodik a monografií. Plné texty článků jsou získávány buď jako dokumenty vzniklé v digitální podobě od vydavatelů periodik nebo digitalizací tištěných předloh.

Pro tvorbu metadatových záznamů jsou využívány systémy Aleph a ProArc. Záznamy jsou zpracovávány z online verzí článků, dostupných volně na webu, z digitálních verzí článků dodávaných redakcemi periodik a z tištěných verzí článků. Schéma zpracování záznamů článků znázorňuje obrázek 1.

Obrázek 1: Schéma zpracování analytických záznamů periodik

Zpracování analytických záznamů z periodik v systému Aleph

Databáze článků Knihovny AV ČR je přístupná na adrese http://aleph20.lib.cas.cz/F/?func=file&file_name=find-b&local_base=KNAVA.

Systém Aleph je pro všechny ústavy Akademie věd ČR provozován Knihovnou AV ČR (dále jako KNAV). Každá ústavní knihovna, která se rozhodne Aleph používat, v něm má přidělenou svou bázi, případně báze. Do nich ukládá své záznamy. V Knihovně AV ČR jsou pro zpracování záznamů využívány tři báze – KNA pro monografie, KNAVC pro seriály a KNAVA pro analytické záznamy.

Záznamy v Alephu jsou ukládány ve formátu MARC 21[1] a jsou zpracovány podle katalogizačních pravidel RDA[2], aktuálně platných v ČR. Zpracovávání analytických záznamů se řídí metodikou, která byla vypracována analytickým oddělením Národní knihovny ČR.

Báze KNAVA byla spuštěna v testovacím režimu v roce 2012. V ostrém provozu jsou v ní články zpracovávány od začátku roku 2013. Počátek zpracování článků v Alephu se pojí s účastí KNAV na projektu „Vytváření a obohacení záznamů článků pro databázi ANL“. Projektu se KNAV účastní od roku 2013 do současnosti. Projekt je financován z programu Veřejné informační služby knihoven (VISK) 9/I Ministerstva kultury České republiky. Jedná se kooperační projekt krajských knihoven a KNAV. Hlavním požadavkem pro získání dotace z programu VISK je zasílání záznamů ve formátu MARC 21 do Souborného katalogu ČR, konkrétně do báze ANL. Dalším požadavkem je dodržování pravidel pro popis Souborného katalogu „Záznam pro soubornou databázi: MARC 21. Fyzicky nesamostatné části dokumentu. Tištěné monografie a seriály“, stanovených Národní knihovnou ČR.

Tituly periodik pro zpracování v Alephu a odeslání do ANL jsou vybírány po konzultaci s koordinátorem celého projektu – Studijní a vědeckou knihovnou v Hradci Králové. Tím se zamezuje duplicitnímu zpracování ve spolupracujících knihovnách. Výhodou účasti na kooperačním projektu a přispívání do souborné databáze je možnost stahování záznamů z báze ANL do báze KNAVA. Záznamy článků z akademických periodik, které v rámci kooperačního projektu zpracovávají ostatní knihovny, mohou být stahovány přes protokol Z39.50. Knihovny spolupracující na projektu jsou povinny dodržovat stejný formát dat a stejná pravidla popisu. To při stahování záznamů zaručuje stejnou kvalitu a úroveň zpracování.

V letech 2013–2017 bylo v Alephu KNAV zpracováno přes 28 000 záznamů z 56 titulů periodik. Primárním cílem je souběžné zpracování aktuálního roku vydání. Současně probíhá i retrospektivní zpracování do roku 1999. Zpracovanou retrospektivu jednotlivých titulů přehledně shrnuje Tabulka 1:

Tabulka 1: Přehled periodik zpracovaných v systému Aleph
NázevISSNZpracovaná retrospektiva
A / věda a výzkum2533-784X2017
Acta geodynamica et geomaterialia1214-97052004–2008
Acta onomastica1211-44132010–2016
Akademický bulletin1210-95252002–2016
Applications of mathematics0862-79401999–2017
Archiv orientální0044-86992012–2017
Biologia plantarum0006-31342012–2017
Botanika2336-22432013–2016
Byzantinoslavica0007-77122011–2015
Czechoslovak mathematical journal0011-46422015–2017
Časopis pro moderní filologii0862-84592007–2016
Časopis zdravotnického práva a bioetiky1804-81372011–2017
Česká literatura0009-04682012–2017
Československá psychologie0009-04682012–2017
Československý časopis pro fyziku0009-07002007–2017
Český časopis historický0862-61112012–2017
Český lid0009-07942012–2017
Data a výzkum – SDA info1802-81522003–2015
Echo1214-79822004–2017
Ergo1802-20062006–2017
Estetika1802-20062012–2017
European journal of entomology1210-57592011–2017
Filosofický časopis0015-18312012–2017
Folia historica Bohemica0231-74942007–2015
Folia parasitologica0015-56832011–2017
Gender, rovné příležitosti, výzkum1213-00282007–2016
Germanoslavica1210-90292009–2017
Historická demografie0323-09372003–2017
Historická geografie0323-09882003–2016
Hospodářské dějiny0231-75402009–2012
Hudební věda0018-70032012–2013
Jemná mechanika a optika0447-64412000–2017
Linguistica Pragensia0862-84322006–2014
Listy filologické0024-44572012–2016
Mathematica Bohemica0862-79592009–2017
Mediaevalia historica Bohemica0862-979X2007–2015
Moderní dějiny0862-979X2004–2016
Naše řeč0027-82032009–2017
Naše společnost1214-438X2003–2016
Nový Orient0029-53022012–2016
Photosynthetica0300-36042012–2017
Physiological research0862-84081999–2017
Právník0231-66252012–2017
Preslia0032-77862012–2017
Přehled výzkumů1211-72502003–2015
Slavia0037-67362010–2016
Slovanský přehled0037-69222012–2016
Slovo a slovesnost0037-70312012–2017
Sociologický časopis0038-02882011–2017
Soudobé dějiny1210-70502012–2015
Studia geophysica et geodaetica0039-31692002–2017
Studia mediaevalia Bohemica1804-09772009–2014
Studia Rudolphina1213-53722009–2015
Teorie vědy1210-02502003–2016
Umění0049-51232012–2017
Živa0044-48122012–2017

Zpracování analytických záznamů z periodik v systému ProArc

ProArc je produkční a archivační systém pro digitalizaci, který umožňuje vytvářet záznamy článků a přikládat k nim plné texty. Záznamy jsou v něm ukládány ve formátu MODS[3] a jsou vytvářeny podle standardů Národní digitální knihovny pro periodika[4], rozšířených o interní pravidla Knihovny AV ČR. Metadata do ProArcu jsou vkládána přes webový formulář. V něm také probíhá přidávání plných textů. Zpracování v tomto systému začalo v roce 2015 (zkušební provoz), resp. 2016 (ostrý provoz).

Obrázek 2: Metadatový formulář v systému ProArc

Systém ProArc umožňuje také stahování a upravování záznamů z analytické báze v Alephu Knihovny AV ČR a ze Souborného katalogu ČR. Stažené záznamy jsou v ProArcu konvertovány do metadatového formátu MODS, doplněny o potřebná metadata a jsou k nim přiloženy plné texty článků. Takto obohacené záznamy jsou využívány pro Digitální knihovnu.

V letech 2016–2017 bylo v ProArcu zpracováno 40 titulů periodik. Primárním cílem je, stejně jako v případě zpracování v Alephu, souběžné vytváření záznamů z aktuálního roku vydání. Současně probíhá i retrospektivní zpracování do roku 1994. Zpracovanou retrospektivu jednotlivých titulů přehledně shrnuje Tabulka 2.

Tabulka 2: Přehled periodik zpracovaných v systému ProArc
NázevISSNZpracovaná retrospektiva
Acta Comeniana0231-59552014
Acta geodynamica et geomaterialia1214-97052017
Acta onomastica1211-44132016
Acta technica1210-714X2008, 2012–2017
Akademický bulletin1210-95252009–2016
Archeologické rozhledy0323-12672012–2017
Critical housing analysis2336-28392014–2017
Časopis zdravotnického práva a bioetiky1804-81372011–2017
Česká literatura0009-04682012–2017
Československá psychologie0009-062X2009–2017
Český časopis historický0862-61112012–2016
Český lid0009-07942013–2017
E-psychologie1802-88532007–2017
Estetika1802-20062016–2017
Filosofický časopis0015-18312005, 2007–2017
Folia historica Bohemica0231-74942012–2016
Folia zoologica0139-78932012–2017
Gender, rovné příležitosti, výzkum1213-00282015–2016
Historica1210-84992002–2010
Historická demografie0323-09372010–2017
Historická geografie0323-09882012–2016
Hudební věda0018-70032014–2016
Journal of hydrology and hydromechanics0042-790X2017
Knihy a dějiny1210-85101994–2003, 2009–2016
Kybernetika0023-59542017
Mediaevalia historica Bohemica0862-979X2016
Moderní dějiny0862-979X2012–2016
Naše řeč0027-82032016–2017
Physiological research0369-94631995–2017
Právník0231-66252013–2017
Preslia0032-77862012–2017
Slovo a slovesnost0037-70312016–2017
Sociologický časopis0038-02882016–2017
Střed1803-92432015–2016
Studie o rukopisech0585-56912016
Teorie vědy1210-02502016
Theatralia1803-845X2015–2016
Umění0049-51232013–2016
Vesmír0042-45442017
Živa0044-48122003–2004, 2012–2017

Systém ProArc umožňuje využití metadat nejen v Digitální knihovně, ale také jejich odesílání do různých vědeckých databází článků a periodik. Nyní prvním rokem probíhá odesílání článkových metadat do databáze CEJSH[5]. V listopadu 2016 bylo spuštěno také odesílání informací do databáze CrossRef[6]. Zprostředkovaně přes prezentační software Kramerius probíhá také odesílání záznamů článků do databází Web of Science[7] a Scopus[8]. Zároveň je ProArc kompatibilní s již existujícími řešeními v České republice, mezi něž patří zejména Registr digitalizace[9], takže je možné metadata odesílat také do něj.

Zpřístupnění Digitální knihovny AV ČR v systému Kramerius

Obrázek 3: Úvodní strana Digitální knihovny AV ČR

Webové rozhraní Digitální knihovny je přístupné na adrese http://kramerius.lib.cas.cz/. Úvodní obrazovka je určena k vyhledávání v plných textech dokumentů a v metadatech. Prohledávání plných textů digitalizovaných dokumentů je umožněno díky rozpoznávání textu metodou OCR. Výsledky vyhledávání lze zpřesnit použitím filtrů, například podle dostupnosti dokumentu nebo klíčových slov. Hned na úvodní stránce je možné si také zobrazit nejžádanější, nejnovější nebo vybrané dokumenty. Systém v neposlední řadě nabízí prohledávání názvového a autorského rejstříku, vyhledávání na časové ose podle data vzniku dokumentu a prohlížení sbírek – tematických kolekcí, vytvořených administrátorem.

Vyhledané dokumenty lze buď prohlížet přímo online v Digitální knihovně, nebo je uložit na vlastní zařízení ve formě originálního souboru nebo ve formátu PDF. Systém podporuje také vyhledávání v plných textech konkrétního článku nebo určité stránky. Dále Kramerius poskytuje možnost ukládání vyhledaných dokumentů do oblíbených a jejich sdílení na sociálních sítích.

Obrázek 4: Zobrazení článku v Digitální knihovně AV ČR

Zpřístupnění plných textů v Digitální knihovně je limitováno Autorským zákonem. Proto jsou na internetu volně dostupné ty dokumenty, které již nespadají pod ochranu Autorského zákona. Výjimku tvoří případy, kdy licenční smlouva s příslušnými vydavateli umožňuje zpřístupnění před uplynutím této lhůty. Některá periodika jsou volně dostupná v režimu open access, nebo jen s několikaletým embargem od data vydání. Volný přístup k plným textům všech dokumentů je zajištěn ve studovně Knihovny AV ČR.

Použitá literatura

  1. GEC, Tomáš. Rozhovor s Martinem Lhotákem. Duha [online]. 2012, roč. 26, č. 1.
  2. LHOTÁK, Martin. Česká digitální knihovna. Duha [online]. 2016, roč. 30, č. 3.
  3. ŠLAPÁKOVÁ, Ivana: Zpracování a zpřístupňování časopiseckých článků v Digitální knihovně AV ČR – část 1. Informace [online]. 2014, č. 3.
  4. ŠLAPÁKOVÁ, Ivana: Zpracování a zpřístupňování časopiseckých článků v Digitální knihovně AV ČR – část 2. Informace [online]. 2014, č. 4.

 


[1] Machine-Readable Cataloging; https://www.loc.gov/marc/

[2] Resource, Description and Access; https://www.loc.gov/aba/rda/

[3] Metadata Object Description Schema; http://www.loc.gov/standards/mods

[4] http://www.ndk.cz/standardy-digitalizace/metadata

[5] The Central European Journal of Social Sciences and Humanities; http://cejsh.icm.edu.pl

[6] http://www.crossref.org/

[7] https://webofknowledge.com/

[8] https://www.scopus.com/

[9] http://www.registrdigitalizace.cz/

 

 

 

Šlapáková, Ivana. Digitální knihovna Akademie věd ČR. Informace [online]. , č. [cit. 2019-10-19]. ISSN 1805-2800. Dostupné z: https://www.lib.cas.cz/casopis_informace/digitalni-knihovna-akademie-ved-cr/

Tisknout stránku

Komentáře nejsou povoleny.