Zprávy o raněných a nemocných rakousko-uherských vojácích – zapojte se do databázového zpracování cenného pramene z první světové války
Ze série tištěných pramenů vydávaných v průběhu první světové války rakousko-uherskou vojenskou správou se do hledáčku Spolku pro počítačovou genealogii dostal po Seznamech ztrát i druhý nejrozsáhlejší soubor: Zprávy o raněných a nemocných (Nachrichten über Verwundete und Kranke).
Do nového projektu pod osvědčeným vedením dr. Jespera Zedlitze a Ingrid Reinhardtové VHÚ Praha poskytl jak digitální obrazová data pořízená před lety ve spolupráci s Národní knihovnou ČR, tak především zásadně vylepšené strojové přepisy textu (OCR) i s metadatovými soubory pro přesnou lokalizaci textu na stránce (ALTO-XML). Za takřka bezchybný přepis všech záznamů vděčíme spolupráci s Michalem Hradišem, který na Fakultě informačních technologií Vysokého učení technického v Brně vede tým pracující na vývoji velmi přesného nástroje PERO OCR pro strojové rozpoznání rukopisného i tištěného písma. Díky tomu, že prakticky odpadla nutnost opravovat překlepy v textu, se práce v prostředí Dateneingabesystem (DES) webového editačního nástroje používaného spolkem, výrazně zrychlila a usnadnila. Dosavadní zkušenosti nicméně ukázaly, že vzhledem k proměnlivější struktuře záznamů (v porovnání se Seznamy ztrát) se ne vždy úspěšně podařilo všechna data automaticky rozřadit do odpovídajících databázových polí, proto asi nejčastější náplní dobrovolníka-editora bývá právě náprava těchto nedostatků přesunem údajů na správné místo.
Už se mnohokrát prokázalo, jak efektivní mohou být crowdsourcingové projekty na internetu. Pokud mají dobře fungující infrastrukturu, intuitivní ovládání, kvalitní data a dost nadšených dobrovolníků, nemusí pro ně být žádné sousto příliš velké. A proto se opět touto cestou obracíme na všechny zájemce, aby se podle svých možností zapojili do dalšího z unikátních databázových počinů. Každý, kdo pátrá po osudech svých předků zavlečených do víru první světové války, může mít užitek z jeho výsledků. A nejen to, získaná velká data představují neocenitelný zdroj pro budoucí statistická zpracování.
Pro bližší informace pište na e-mail: [email protected]