Datový repozitář

1. Datový repozitář ASEP
2. Ukládání datasetů
3. Datové záznamy v online katalogu
4. Správa repozitáře
5. Navrhované úpravy repozitáře


 

1. Datový repozitář ASEP

Datový repozitář ASEP je institucionální multidisciplinární on-line repozitář, ve kterém jsou uloženy bibliografické záznamy o výstupech, plné texty dokumentů a datové soubory opatřené metadaty (popisem) autorů ústavů AV ČR. Správu a služby týkající se repozitáře zajišťuje Knihovna AV ČR. Data uložená v databázi jsou zveřejněna v on-line katalogu, který je dostupný z: https://asep.lib.cas.cz/arl-cav/cs/rozsirene-vyhledavani/

Ústavy mají podepsanou Rámcovou smlouvu o využívání repozitáře ASEP k ukládání datových souborů. Seznam pracovišť, jejichž pracovníci mohou využívat repozitář k ukládání datesetů.

2. Ukládání datasetů

Do repozitáře ASEP ukládají datové soubory a datasety vkladatelé, což jsou všichni autoři, kteří působí na pracovištích AV ČR, případně další pověřené osobyzpracovatelé, individuální zpracovatelé.

Vkladatel ukládá metadatové záznamy a datové soubory do repozitáře přes individuální účty.

  • Vkladatel se seznámí s licenčním ujednáním pro autory, pokud s ním souhlasí, požádá si o vytvoření individuálního uživatelského účtu myASEP. Dohoda o uložení datasetů do datového repozitáře ASEP zde.
  • Individuální účet se vytvoří vyplněním jednoduchého formuláře předregistrace na hlavní stránce on-line katalogu. Zpracovatel pracoviště (supevizor pracoviště) registraci zkontroluje a následně žadateli přijde E-mail o aktivaci individuálního účtu.

Aktivace individuálního uživatelského účtu (IU)

Vytvoření individuálního uživatelského účtu je plně v kompetenci zpracovatele pracoviště.

  • Zpracovateli obdrží E-mail, ve kterém je žádán o potvrzení registrace vkladatele.
  • Pokud se jedná o pracovníka ústavu, zpracovatel aktivuje individuální účet vkladatele přes klienta.
  • Vkladateli následně příjde E-mail, že má vytvořen uživatelský účet.
  • Pokud vkladatel přestane být zaměstnancem, měl by být jeho IU zrušen. Smazání uživatele přes klienta.

Příprava, tvorba, kontrola, zveřejnění

Na obrázku 1 je zjednodušené schema zpracování:



Důkladná příprava metadat a datasetů je prvním a zcela zásadním krokem, připravili jsme několik příkladů postupu (pro autory).

Co si musí vkladatel uvědomit a zkontrolovat před uložením/zveřejněním dat

  • Máte všechna potřebná práva pro zpřístupnění dat?
  • Máte souhlas spoluautorů a ostatních držitelů práv k datům?
  • Máte uvedeny všechny nezbytné informace v metadatech tak, aby citace, která bude u dat k dispozici byla správná a úplná?
  • Máte dostatečně anonymizována svá data, nebo výslovný souhlas od všech subjektů, jejichž totožnost by mohla být odhalena z dat?
  • Znáte svá práva a povinnosti při ukládání dat do repozitáře a jste s nimi srozuměni?
  • Můžete dokázat, že máte všechna práva k uložení dat v datovém repozitáři? V případě, že KNAV obdrží důkaz o porušení autorských práv, příslušná položka(y) budou ihned odstraněny.
  • Jste si vědomi, co vyplývá ze smlouvy Využívání repozitáře ASEP k ukládání datových souborů, pokud jde o uchovávání, migrace souborů a odebrání položek?

Příprava datového záznamu (metadat) a datasetů

  • Struktura dat je podrobně popsána v manuálu. U každého záznamu se musí vyplnit povinná pole a pole podmíněně povinná.
  • Licence je pole, kde vkladatel určuje, jakým způsobem může uživatel, který si data stáhne, nebo vyžádá s daty pracovat. Vkladatel si musí rozmyslet jakou licenci nastaví pro práci s datasety. K výběru jsou licence Creative Commons, případně může vkladatel přiložit text vlastní licence – dokument ve formátu pdf. Pokud se vyskytne licence, které by mohla být přidána do seznamu licencí (jako je to u licencí CC), obraťte se na arl@lib.cas.cz.
  • Pro datasety je důležité, aby byla vhodně zvolena velikost a formáty souborů, případně i jejich počet. Maximální velikost jednoho ukládaného souboru jsou 2 GB, celková maximální velikost uložených souborů u jednoho datasetu je 20 GB. Po domluvě se správcem repozitáře lze uložit i soubory větší velikosti. Při výběru formátů souborů doporučujeme použít vhodné standardy, ale lze využít i formátů, které se běžně využívají v daném oboru. Pokud se ukládá větší počet souborů, je vhodné je komprimovat (arj, zip).
  • Zpřístupnění souborů – Přístupné ihned, na vyžádání, s embargem – veřejně zpřístupňujeme až po určité době.
  • V repozitáři ASEP může být uložen datový záznam a dataset. Je možné uložit datový záznam a odkaz na datasety v jiném repozitáři.
  • Propojení datových a bibliografických záznamů. V bibliografických záznamech lze uvést odkazy na datasety uložené v repozitáři ASEP, ale i na datasety, které jsou uloženy na jiných úložištích, a naopak.

Uložení záznamů a datasetů z myASEP

Uživatelský účet myASEP:

  • Vkladatel může vytvořit nový datový záznam (metadata) + uložit dataset do ASEP, nebo odkaz do jiného repozitáře. Dokud záznam neodešle ke zveřejnění zpracovateli, má ho uložen mezi rozepsanými záznamy. Rozepsané záznamy může editovat a mazat.
  • Pokud se vkladatel rozhodne data zveřejnit v on-line katalogu ASEP, předá data ke kontrole zpracovateli. Jakmile záznam odešle zpracovateli ke kontrole, záznam již nemůže editovat a mazat, záznam se přesune mezi záznamy předané ke kontrole.

3. Datové záznamy v on-line katalogu

  • Pokud jsou data v pořádku, zpracovatel potvrdí zveřejnění datového záznamu (odešle záznam do IPAC).
  • Systém přidělí datovému záznamu identifikátor handle a dataset je zveřejněn v on-line katalogu. Uživatelé si mohou datasety vyhledat, stáhnout nebo požádat o jejich poskytnutí.

Datasety lze v on-line katalogu vyhledat v rozšířeném vyhledávání výběrem limity „dataset“. Limitu „dataset“ lze libovolně kombinovat s ostatními limitami, tak lze najít datasety, které se váží např. k projektům, pracovištím apod.

U vyhledaného datového záznamu lze zobrazit všechny údaje, které jsou uloženy v datovém formuláři. K dispozici jsou různé zobrazovací formáty: základní, základní s s popisem, citace dat. Pokud se ukládá dataset s větším množstvím souborů, doporučujeme je „zabalit“ do jednoho souboru (zip, rar). U každého souboru je zobrazena velikost souboru, typ souboru, počet stažení a přístup a jakým způsobem může se soubory pracovat. U souborů na vyžádání – uzavřený zámek – pro získání souboru musí uživatel požádat autora o zaslání datasetu (vyplnění formuláře).

Datasety lze v on-line katalogu (IPAC) vyhledatrozšířeném vyhledávání výběrem limity „dataset“. Limitu „dataset“ lze libovolně kombinovat s ostatními limitami, tak lze najít datasety, které se váží např. k projektům, pracovištím apod.

Příklad propojení datového a bibliografického záznamu v ASEP:

Pravidla pro uživatele datového repozitáře:

Data v repozitáři jsou k dispozici na základě licence uvedené u jednotlivých zdrojů (položek). Uživatel před tím, než si stáhne vystavené soubory, musí potvrdit (zaškrtnutím políčka „souhlasím“), že bude se soubory pracovat dle uvedené licence – zde. Uživatelé jsou povinni dodržovat licence, které jsou uvedeny u datových souborů v repozitáři a uživatel pokud je použije je povinen je citovat.

Pravidla pro citace: V datovém repozitáři ASEP používáme Systém Handle. Který poskytuje jedinečné a stálé („perzistentní“) identifikátory digitálních objektů. Každá citace dat musí obsahovat handle, vedoucí k záznamu metadat příslušného datového souboru.

4. Správa repozitáře ASEP

Uživatelská podpora

  • Veškerou podporu zajišťují zaměstnanci KNAV.
  • Uživatelé mohou své dotazy a připomínky zadávat buď vyplněním formuláře na hlavní stránce on-line katalogu, pro nebo je k dispozici hot-line zasláním E-mailu na adresu arl@lib.cas.cz.
  • Řešení dotazu a připomínek obdrží uživatelé E-mailem.
  • KNAV zajišťuje pro zájemce školení a semináře.

5. Navrhované úpravy repozitáře ASEP

Úpravy datového repozitáře – požadavky  ústavů AV

IPAC

  1. Nová limita – typ datového souboru, aby šly najít datové soubory dle typu  
    Dataset \ dataset
    Text \ text
    Image \ obrázek
    Moving Image \ video, film
    Sound \ audio
    Software \ software
  2. Nová limita – způsob uložení datového soubory, aby šlo vyhledat datové soubory uložené v ASEP a datové soubory uložené v jiném repozitáři.