Aktuální stav produkčního a archivačního systému ProArc

 

Knihovna AV ČR začala v loňském roce řešit nový výzkumný projekt, na němž se úzce podílí Digitalizační centrum Jenštejn. Projekt s názvem Česká digitální knihovna bude realizován v letech 20122015 a je financován z fondů Ministerstva kultury ČR. Česká digitální knihovna bude plnit úlohu centrálního rozhraní digitálních knihoven v České republice. Toto prostředí bude sloužit nejen koncovým uživatelům, ale také jako zdrojové místo dat pro mezinárodní projekty digitálních knihoven, zejména projektu Europeana.

V rámci projektu budou vyvinuty nástroje pro zpracování, evidenci, sledování workflow, archivaci a zpřístupnění digitálních dokumentů.

Jednou z částí projektu je systém ProArc. Pod tímto názvem se skrývá produkční a archivační systém, čili nástroj pro výrobu a úpravu popisných, administrativních a technických metadat a zároveň řešení pro dlouhodobé uchování digitálních dokumentů. V systému ProArc bude rovněž možné převádět obrazové soubory do textových dokumentů pomocí připojení komerčního softwaru ABBY Recognition Server 3.0. Rovněž bude možná obrazová konverze do formátu Jpeg2000 pomocí softwaru KAKADU. Systém bude zároveň sloužit pro dlouhodobé uchovávání a správu digitálních dokumentů, což v budoucnu výrazně usnadní práci s digitalizovanými materiály nejen našemu pracovišti, ale i dalším institucím, které digitalizují své dokumenty. Tento systém bude dostupný jako open source.

Nyní k samotnému ProArcu. Podání žádosti o grant předcházela řádná analýza. Počáteční vývoj byl zahájen již v roce 2011 a byl v něm použit výstup projektu KNAV připravovaný v rámci programu VISK v roce 2010. Digitalizační centrum od počátku úzce spolupracuje na tomto projektu s firmou INCAD, která zajišťuje analytické a programátorské práce.

Jak už bylo naznačeno, systém ProArc se skládá ze dvou hlavních částí a plní dvě společně provázané funkce. První částí je produkční systém, který slouží k tvorbě digitálních dokumentů. Jedná se především o základní popis souborů podle aktuálních standardů Národní knihovny ČR a o vytváření a případnou editaci záznamů pro systém Kramerius 4. Druhá část slouží k archivaci digitálních objektů a k nim vytvořených záznamů. Na rozvoji této části se začne pracovat v průběhu roku 2013, přičemž východiskem bude analýza s výčtem požadavků na archivační část, která byla připravena v minulém roce. Standardy pro archivační část budou kompatibilní se zadáním pro LTP systém v rámci projektu Národní digitální knihovny, počítá se např. s podporou modelu OAIS. V našem Digitalizačním centru běží v pilotním provozu produkční část, která slouží k základnímu popisu souborů. Po založení nového objektu a načtení nové dávky obrazových souborů se otevře editor, který je rozdělen do tří částí. V prvním oddíle (viz. obr.) se zobrazuje řádkový výpis názvů jednotlivých souborů s číslem a typem strany. Na začátku popisování jsou sloupce s čísly i popisy prázdné. V posledním sektoru je náhled pouze s jedním vybraným souborem, na kterém jsou vidět všechny jeho detaily. Pro popis je nejdůležitější prostřední část, ve které se zobrazují malé náhledy jednotlivých stran. V této části lze postupně po jednom, případně selekcí více nebo i všech digitálních obrazů, číslovat a popisovat soubory na základě jednoduchého označení a výběru z možností daných předpřipravenou tabulkou. Tato editace je snadná a uživatelsky přívětivá. Dalším krokem je vyčítání textu pomocí OCR. Důkladně popsané soubory se importují spolu s vygenerovaným UUID zpět na úložiště.

V současné době probíhají na produkční části systému ProArc závěrečné úpravy a finální testování. Do ostrého provozu bude nasazen v prvním čtvrtletí roku 2013.

Celý projekt České digitální knihovny bude dokončen do konce roku 2015.

 

ProArc

(Pro zvětšení obrázku na něj klikněte)

 

 

Daněčková, Michala; Nezbedová, Martina; Pšenička, Michal. Aktuální stav produkčního a archivačního systému ProArc. Informace [online]. , č. [cit. 2024-03-28]. ISSN 1805-2800. Dostupné z: https://www.lib.cas.cz/casopis_informace/aktualni-stav-produkcniho-a-archivacniho-systemu-proarc/

Tisknout stránku