Knihovny současnosti 2009
Knihovny současnosti 2009 : sborník ze 17. konference, konané ve dnech 23.-25. června 2009 v Seči u Chrudimi. Brno: Sdružení knihoven ČR, 2009. – ISBN 978-80-86249-54-4
Také v rámci konferencí Knihovny současnosti, pořádaných tradičně od r. 1995 v Seči, je tématu digitalizace věnována stále větší pozornost.
Ohlédneme-li se jen trochu zpět, není možno nechat bez povšimnutí příspěvek B. Stoklasové, který zde zazněl v r. 2007 a týkal se koncepce trvalého uchování knihovních dokumentů. Tato koncepce navazuje na evropské trendy, iniciativy a projekty, zejména pak na iniciativu i2010: Digitální knihovny. V daném příspěvku byla velmi dobře nastíněna potřebnost nejen Národní digitální knihovny (zaštiťované financemi MK), která je repozitářem pro Manuscriptorium, Kramerius a WebArchiv (rozvoji všech těchto projektů je na Seči již několik let věnována pozornost), ale i širší České digitální knihovny, která je tvořena velkým množstvím dalších digitálních dokumentů oborového, regionálního, institucionálního i jiného charakteru. Byly zde uvedeny základní funkce centrálního digitálního repozitáře (dodávání digitálních objektů, příjem digitálních dokumentů a metadat, archivní sklad, správa dat, administrace, plánování trvalé ochrany a přístup). Na závěr bylo zdůrazněno, že bez odpovídajícího finančního zajištění není možné koncepci v podstatě realizovat.
O cílech, postupu a vývoji projektu Národní digitální knihovny, informovala B. Stoklasová rovněž na Seči v roce 2008, i v letošním roce. Bohužel, ve svém příspěvku byla nucena konstatovat, že k předpokládanému projednání Koncepce vládou ČR a k uvolnění finančního objemu 210 mil. Kč na její realizaci nikdy nedošlo. Je však naděje, že by mohlo dojít v brzkém časovém horizontu k potřebné změně, neboť Ministerstvem kultury a českou vládou byla Národní digitální knihovně přidělena strategická priorita s tím, že se tak stane kandidátem pro financování z prostředků strukturálních fondů Evropské unie (viz příloha vládního usnesení č. 536 ze 14. května 2008 o strategických projektových záměrech pro čerpání finančních prostředků ze strukturálních fondů Evropské unie v rámci Smart Administration).
Pro konkrétnější představu o obsahu i rozsahu zmíněného IOP-Integrovaného Operačního Programu (Smart Administration) pro projekt Národní digitální knihovny jsou v příspěvku uvedena tato čísla: jádro českého národního kulturního dědictví (dokumenty publikované na našem území od roku 1801 včetně + historické dokumenty do roku 1800 uložené v českých knihovnách) tvoří přibližně 1,2 milionu dokumentů, což představuje 350 milionů stránek. Pokud by digitalizace pro tento objem pokračovala současným tempem, byl by časový horizont ukončení asi 300 let, což v případě dokumentů vytištěných na kyselém papíře a/nebo často využívaných by znamenalo, že digitalizace by už nebyla vzhledem k jejich stavu možná. Předpokládané uvolnění finančních prostředků urychlí práce tak, že výše uvedené množství stránek bude digitalizováno během 20 let. Nejohroženější a nejvyužívanější dokumenty (většinou noviny) by měly být digitalizovány během prvních pěti let projektu v letech 2009−2014.
Výsledkem projektu by tedy měla být digitalizace dokumentů vydaných v a po r. 1801 (540 000 dokumentů, 137 milionů stran), digitalizace historických dokumentů vydaných do r. 1800 (20 000 dokumentů, 9 milionů stran), WebArchiv (sklízení a archivace 5 miliard souborů). Uložení by pak mělo být v certifikovaném digitálním repozitáři a přístup k digitalizovaným dokumentům v uživatelsky příjemném prostředí. Celkový rozpočet celého projektu bude 706 milionů Kč (85 % podpora, 15 % spoluúčast).
Na okraj tématu digitalizace je možné ještě zmínit další cestu k uchování národního kulturního dědictví, a to odkyselování papíru, který byl používán od poloviny 19. století do konce století dvacátého (než byla přijata norma ISO 9706, ve které jsou stanoveny požadavky na trvanlivost papíru pro dokumenty).
Informace o výzkumu a metodách odkyselení papíru v největších světových knihovnách (Kongresová knihovna, Státní knihovna v Mnichově, národní knihovny Francie, Nizozemí, Rakouska, Švýcarska, Polska) přinesl příspěvek J. Kubíčka a B. Sapákové z Moravské zemské knihovny v Brně. Dále nás seznámili s perspektivními způsoby odkyselování, a to s metodou Bookkeeper, postavené na kapalném procesu (metoda vyvinutá firmou Preservation Technologies v USA) a metodou Neschen, která je vhodnější pro archivy. Zprostředkování těchto technologií zajišťuje CEIBA s.r.o. Praha.
Již v r. 2007 byl projednán záměr vytvořit Technické centrum knihoven při Moravské zemské knihovně, které by bylo zaměřeno na dlouhodobé a účinné konzervování a restaurování dokumentů. V rámci již zmíněného IOP byl podán projekt na vytvoření Národního metodického centra ochrany knihovních dokumentů.
Kromě zmíněného příspěvku B. Stoklasové o projektu Národní digitální knihovny, který zazněl hned v úvodu konference, byla tématu digitalizace na Seči 2009 věnována celá jedna sekce nazvaná „Digitalizujeme pro uživatele“. V této sekci zaznělo 8 příspěvků, o kterých bude podrobněji pojednáno níže. Avšak k tématu jistě patří informace o elektronickém publikování díla Karla Čapka – společném projektu Městské knihovny v Praze, Ústavu Českého národního korpusu FF UK, Společnosti bratří Čapků a Památníku Karla Čapka, která zazněla v sekci Knihovna jako samoobsluha: pro a proti.
1. MODS a další metadatová schémata v oblasti digitalizace dokumentů
Pavla Švástová, Moravská zemská knihovna, Brno
V příspěvku bylo představeno schéma MODS (Metadata Object
Description Schema) jako vhodné schéma popisných metadat obsahující
soubor bibliografických prvků, a tak splňující požadavky digitálních
knihoven mít možnost bohatého popisu jakéhokoliv dokumentu v XML.
Přitom je zajištěna jednoduchá konverze do formátu MARCXML pomocí
šablon. V červnu 2008 byla vytvořena verze 3.3. tohoto schématu. V této
verzi je 20 základních prvků popisu dělících se dále na podprvky (dílčí
prvky), přičemž k jednotlivým prvkům i podprvkům lze přiřadit atributy,
takže lze popsat prakticky jakýkoliv dokument (monografie, CD-ROM,
speciální druhy jako mapy, hudební partitury, obrazy, videa, 3D
objekty, webové stránky). Popis všech prvků, podprvků a atributů MODS
lze nalézt na adrese:
http://www.loc.gov/standards/mods/v3/mods-userguide-elements.html
2. Knihovny významných českých osobností – informace z depozitářů veřejně přístupné na internetu
Blanka Vorlíčková, Ústav informačních studií a knihovnictví FF UK, Praha
„Knihovny významných českých osobností“ – jedná se o digitální knihovnu vytvořenou v rámci projektu „Informační systémy zpřístupňující knihovní celky osobností kultury jako součást národního kulturního dědictví“, který je řešen Ústavem informačních studií a knihovnictví Filozofické fakulty Univerzity Karlovy v Praze s grantovou podporou Ministerstva kultury ČR (Odbor umění a knihoven – Výzkum a vývoj). S projektem bylo započato v březnu 2007 a jeho dokončení se předpokládá v prosinci roku 2009.
V rámci projektu bylo zpracováno šest knihoven:
- osobní knihovna Jaroslava Ježka, uchovávaná ve fondech Českého muzea hudby (součást Národního muzea), umístěná v Modrém pokoji Jaroslava Ježka v Kaprově ulici (634 sv. knih a 152 hudebnin)
- osobní knihovna Karla Čapka, dochovaná v majetku Čapkových potomků (2 000 sv.)
- torzo zachované z početné sbírky osobní knihovny Karla Havlíčka Borovského. Knihy jsou umístěny ve fondech Literárního archivu Památníku národního písemnictví, Knihovny Národního muzea a Muzea Vysočiny v Havlíčkově Brodě (zatím celkem 25 svazků)
- torzo knihovny Boženy Němcové uchovávané ve fondech Literárního archivu Památníku národního písemnictví (4 svazky)
- část osobní knihovny Zdeňka Fibicha, která je umístěna v knihovně Ústavu hudební vědy FF UK v Praze (808 sv.)
- osobní knihovna Mikoláše Alše, kterou uchovává Knihovna Památníku národního písemnictví (zatím ve zpracování).
Domovskou stránku „Knihoven významných českých osobností“ lze prozatím nalézt na adrese http://knihovny.mathan.cz/ a vstup je umožněn všem uživatelům. Je třeba zdůraznit, že jde o zachycení výjimečných památek v konkrétních knihách, jako např. podpisy, věnování, exlibris, vpisky a zatrhávání apod.
3. Nedigitalizoval to už někdo?
Pavel Kocourek, INCAD
Již v r. 2008 zazněl na Seči příspěvek o projektu RD.CZ (Registru digitalizace České republiky: evidence digitalizovaných dokumentů a sledování procesu zpracování). Na tomto projektu se podílí Národní knihovna a Knihovna Akademie věd, přičemž technickou realizaci zastřešuje společnost INCAD).
Na Seči 2009 pak toto téma zaznělo opět, a to z hlediska potřeby zabránit duplicitnímu zpracování a nutnosti evidence digitalizovaných dokumentů. RD.CZ umožňuje digitalizačním centrům získat informace nejen tom, co se digitalizuje, ale i o plánovaných digitalizačních pracích. Uživatelé pak mají možnost vyhledávat odkazy na příslušnou digitální knihovnu. Přístup do registru je http://www.registrdigitalizace.cz
4. Metadatový editor pro digitální knihovny
Martin Šárfy, Ústav výpočetní techniky MU, Brno
Příspěvek navázal na informace o metadatovém editoru, které zazněly
na Seči 2008. Metadatový Editor (http://sf.net/projects/dme, dále
jen ME) byl původně vyvíjen na Masarykově univerzitě v Brně pro potřeby
projektu „Česká digitální matematická knihovna DML-CZ“ programu
„Informační společnost“ Akademie věd ČR (http://project.dml.cz). Na tento
původní projekt pak navázal projekt „Metadatový editor pro systém
Kramerius“ (grant MK přidělený Moravské zemské knihovně v Brně).
Metadatový Editor je vyvíjen tak, aby zabezpečil celý průběh
digitalizace tištěných materiálů, tj. od vložení naskenované předlohy
až po export do publikačního systému, s možností velké flexibility v
pracovních postupech a též v hloubce metadat (možnost popisu od
analytické po soubornou úroveň). ME zajišťuje následující konkrétní
kroky:
- Vkládání skenovaných stránek (časopisů, sborníků či monografií).
- Manipulace se stránkami (korekce pořadí, duplicit, vakátů apod.).
- Vytvoření textové reprezentace stránek pomocí OCR nástrojů.
- Vytvoření hierarchické struktury (článek, kapitola, číslo, ročník, ...).
- Detekce článkových citací, provázání s citačními databázemi.
- Popis metadat − článků, periodik, sborníkových řad, monografií apod.
- Vytvoření popisu z MARC záznamu staženého přes Z39.50 protokol.
- Správa autoritní databáze − jmenné formy, transliterace apod.
- Generování dvouvrstvých článkových PDF souborů včetně metadat.
- Export dat do publikačního systému (např. DSpace nebo
Kramerius).
5. Dosavadní zkušenosti s budováním digitální knihovny starých a vzácných tisků na Mendelově zemědělské a lesnické univerzitě v Brně
Věra Svobodová – Vladimíra Perlová, Ústav vědecko-pedagogických informací a služeb MZLU, Brno
V příspěvku jsme byly seznámeny se zkušenostmi s budováním digitální knihovny starých a vzácných tisků, pocházejících většinou z bývalé lichtenštejnské knihovny lednického zámku, kterou knihovna MZLU získala v roce 1954. V současné době jsou tyto fondy uloženy v archivu s řízenou klimatizací v rekonstruované budově Zahradnické fakulty v Lednici. Díky Fondu rozvoje vysokých škol se staly dostupnými finanční prostředky potřebné k zahájení digitalizace. Již v r. 2005 univerzita zakoupila skenovací zařízení Atlas a následně software Sirius, který umožňuje indexaci naskenovaných knih, vytvoření metadat a jejich odeslání do databáze Kramerius. Postup tvorby digitální knihovny pak začíná katalogizací knihy (v KPWinSQL), vlastním skenováním, ořezem a vyrovnáním obrázků, kontrolou naskenovaných dat, indexací a vytvořením metadat přes OCR a export do XML, s následujícím uložením a archivací dat a zpřístupněním veřejnosti (v současné době v systému Kramerius na adrese http://kramerius.mendelu.cz ). Uživatelé však mají též k dispozici online souborný katalog na adrese http://katalog.mendelu.cz/index.php, který umožňuje, je-li nalezena publikace, u niž je k dispozici digitalizovaná forma, přímý link na tento plný text. Závěrem zaznělo přání docílit potřebného financování digitalizačního pracoviště MZLU, aby nemusela být práce po ukončení projektu úplně zastavena.
6. Účast NK ČR v projektu TELplus – vytváření OCR souborů
Autor: Tomáš Foltýn, Národní knihovna ČR
TELplus patří mezi evropské projekty (je financován Evropskou komisí v rámci podprogramu eContentplus), které mají rozšířit služby a obsah Evropské knihovny (“The European Library”). Projekt započal v říjnu r. 2007, skončí v prosinci r. 2009, hlavním koordinátorem je Eremo s.r.o. a Národní knihovna Estonska. Portál Evropské knihovny zajišťuje rychlý přístup k plným textům dokumentů uložených ve fondech více než 45 národních knihoven Evropy. Kromě bibliografického záznamu vyhledaného dokumentu je totiž umožněn přístup do digitalizované verze (není-li dokument chráněn autorským právem). V současné době je zde k dispozici více než 150 miliónů záznamů.
Jedním z hlavních cílů projektu TELplus (kromě zlepšení propojení jednotlivých digitálních knihoven pomocí OAI-PMH a vylepšení fulltextového vyhledávání) je vytvoření více než 20 mil. OCR textových souborů. Národní knihovna ČR (jako člen „Workpackage 1“ tj. pracovní skupiny pro „OCR dříve digitalizovaných materiálů“) přispěje do projektu slíbenými 3 400 000 textových souborů (2,4 mil. stran monografií a cca 1 mil. stran periodik), přičemž jejich kvalita je vysoká v případě českých dokumentů psaných latinkou, určité problémy způsobují texty ve švabachu, popř. kombinace více jazyků či fontů (pro ty je zapotřebí vytvářet znalostní báze termínů).
7. Účast NK ČR v projektu Norské fondy – digitalizace bohemikálních
monografií ohrožených degradací papíru
Jiří Polišenský, Národní knihovna ČR
Tento projekt – jako jeden z největších digitalizačních projektů - umožní digitalizaci a zpřístupnění prostřednictvím internetu asi 20 000 monografií 19. století, což představuje cca 2 400 000 stran dokumentů. V rámci projektu Národní knihovna dále rozvíjí činnost pracoviště digitalizace vybudovaného koncem 90. let, jehož postupy jsou založeny na hybridní metodě využívající mikrofilm. Projekt byl připravován v r. 2005, kdy byly odhadnuty jak objemy digitalizace, které budou zadány dodavatelským firmám aplikujícím danou technologii, tak odhadnut objem dat, které bude možné archivovat prostřednictvím předpokládané kapacity datového úložiště. Následně proběhla cenová kalkulace, která dosáhla výše 1,2 mil. EUR (1 mil. dotace, 0,2 mil. spoluúčast ČR). V současné době je digitalizováno nebo připraveno pro zpracování více než 16 000 svazků publikací 19. stol. Dokončení projektu se očekává v pol. r. 2010, do té doby by též měl proběhnout import všech hotových digitálních dokumentů na úložiště a do Systému Kramerius. Po dokončení importů jsou doplněny některé údaje ze Systému Kramerius do RD.CZ, což umožní do záznamu v bázi NKC doplnit odkaz na digitalizovaný dokument. Pro úplnost je třeba dodat, že NK ČR se zavázala v rámci propagace projektu označovat všechny mikrofilmy i digitální dokumenty logem Norských fondů a že součástí projektu je zhotovování ochranných obalů pro nejvíce zničené dokumenty (cca pro 4000 svazků).
8. Projekt Gutenberg – digitalizace vedená boomem e-readerů a e-knih
S tímto komerčním projektem nás seznámil Pavel Čejka. Cílem projektu
je docílit v českém prostředí co nejširšího rozšíření knih v
elektronické podobě a k tomu potřebných čteček. Někteří nakladatelé již
dali souhlas s distribucí jimi vydaných digitalizovaných knih, které
jsou samozřejmě chráněny jak časovým kódem, tak mají zabudovánu ochranu
proti nezákonnému kopírování. Více o projektu je možno nalézt na http://www.gutenberg.cz.
Podrobné informace o jednotlivých projektech lze nalézt ve sborníku
citovaném v úvodu, na webové stránce konference, kde jsou
prezentace ve formátu pdf a na webových stránkách příslušných
projektů.
