Strukturdatenerfassung

Teil meiner Arbeit am Repositorium ZentralGut ist die möglichst tiefe Strukturierung abgeschlossener wie laufender Periodika. Die Strukturelemente die dabei zur Verwendung kommen orientieren sich am Strukturset der DFG (DFG-Viewer: Strukturdatenset) bzw. sind auch an spezielle Vorkommnisse oder auch persönlicher Relevanzüberzeugungen angepasst (d.h. konkret um Strukturelemente, wie zB „Interview“ erweitert.)

Was sind denn eure Erfahrungen damit? Agiert ihr manuell in der Strukturierung, kommen maschinelle Verfahren zur Anwendung? Definiert ihr eigene Strukturelemente und wie seht ihr die Abgrenzung zu den beschreibenden Daten?

Agiert ihr manuell in der Strukturierung, kommen maschinelle Verfahren zur Anwendung?

An der Stabi Berlin wird Layouterkennung (OLR, Optical Layout Recognition) bei der Digitalisierung von Zeitschriften angewandt und im OCR-D Projekt wurden meines Wissens Verfahren dazu entwickelt.

1 „Gefällt mir“

Wir verwenden normalerweise Kitodo Production für die Durchführung von Digitalisierungsprojekten inkl. Qualitätskontrolle und der Erfassung von Strukturdaten (z.B. Paginierung oder Kapiteleinteilung). Die Eingaben werden dabei hauptsächlich manuell gemacht. Für die Präsentation verwenden wir Kitodo Präsentation, von welchem der DFG Viewer eine Variante ist. Ich glaube nicht, dass wir eigen definierte Strukturelemente verwenden, zumindest dürften die dann in dem Setting auch nicht einfach angezeigt werden.