Moderní zpřístupnění historických pramenů (2018-2021)

V současné době jsou digitalizované archivní prameny v česko-bavorském příhraničí k dispozici prostřednictvím portálu "Porta Fontium". Tento systém vznikl především pro fyzickou ochranu cenných dokumentů, proto je vyhledávání informací stále závislé na ručním procházení a pročítání mnohostránkových textů. Zároveň v aktuální verzi systému nejsou obsaženy historické mapy. Hlavním cílem předkládaného projektu je zpřístupnění archivních pramenů z česko-bavorského příhraničí širokému spektru uživatelů z řad odborné i laické veřejnosti pomocí nejmodernějších informačních technologií.

Prvním dílčím cílem společného projektu je vůbec první spojení historických map a plánů ke společným česko-bavorským dějinám až do roku 1918 a jejich online prezentace. V prvním kroku dojde k vyhledání relevantních map a plánů z pohraničí (spadajících do dotačního území). Nalezené archiválie budou popsány a oklíčovány. Návazně budou vybrané mapy a plány adjustovány a připraveny k digitalizaci. Na závěr budou všechny digitalizáty i příslušná metadata zveřejněny v portálu.

Dalším dílčím cílem bude umožnění vyhledávání informací podle lokalizačních údajů. Portál bude propojen s mapovými podklady. Bude možno tak vyhledávat různé typy dokumentů podle jejich místa na mapě s možností filtrace zobrazovaných typů dokumentů (např. pouze kroniky). Dále bude umožněno zobrazit vybrané dokumenty na mapě.

Dále se zaměříme na přehlednou prezentaci a efektivní vyhledávání obrazových dokumentů. Nejdříve bude provedena podrobná analýza a jejím základě bude provedena segmentace a související anotace. Uživatel tak uvidí dokument ve vrstvách (text, obrázky s popisem), což bude přehlednější. Dále bude nabídnuto vyhledávat v rukopisných kronikách podle extrahovaných vzorů. Bude tak možno omezit výsledek vyhledávání jen na strany, kde se vyskytuje určitá část textu (např. “klášter”), případně fotografie, které jsou podobné dané předloze.

Čtvrtý dílčí cíl se zabývá inteligentním full-textovým zpřístupněním dokumentů. Nejdříve bude proveden optický převod znaků vybraných tištěných dokumentů do textové podoby. Tyto dokumenty budou dále analyzovány metodami automatického zpracování přirozeného jazyka. Uživatel bude moci provádět dotazy v přirozeném jazyce a odpověď systému bude více relevantní (např. budou nalezeny všechny dokumenty, kde se vyskytuje slovo “pes” v libovolném tvaru).

Posledním cílem je prezentace výsledků projektu odborníkům i širší veřejnosti prostřednictvím workshopů a školení. Portál tak bude sloužit odborné i laické veřejnosti v mnohem větší míře, než dosud. Zároveň bude od uživatelů získána zpětná vazba, která přispěje k řešení výše uvedených dílčích cílů.

Při řešení projektu dojde k unikátnímu navázání spolupráce odborníků ze dvou sousedních států a různých výzkumných oblastí: historie, stavebně historický průzkum, archeologie a informatika.