Metadatenstandards für Webarchivierung

Wir sind bei der Digitalen Landesbibliothek (https://digital.zlb.de) der Zentral- und Landesbibliothek Berlin dabei, das Metadaten-Schema für archivierte Webseiten und zugehörige Crawls/Zeitschnitte zu erstellen.

Als eine gute Referenz haben wir dies hier auf dem Schirm: Dooley, Jackie, and Kate Bowers. 2018. Descriptive Metadata for Web Archiving: Recommendations of the OCLC Research Library Partnership Web Archiving Metadata Working Group. Dublin, OH: OCLC Research. Descriptive Metadata for Web Archiving: Recommendations of the OCLC Research Library Partnership Web Archiving Metadata Working Group. Direktlink: https://www.oclc.org/content/dam/research/publications/2018/oclcresearch-wam-recommendations-a4.pdf

Wir selbst werden die Daten in METS/MODS (möglichst nah an den Empfehlungen der DFG-Praxisregeln) und MARC verwenden.

Habt ihr denn Tipps und Hinweise für weitere nützliche Ressourcen zum Thema?

Hi @mgoetze, herzlich willkommen im metadaten.community-Forum und danke für deinen Beitrag!

Im hbz betreiben Kolleg:innen die Sammlung rheinland-pfälzischer Netzpublikationen edoweb und greifen dabei auch Software & Tools > lobid zurück, weshalb ich mit dem Thema in der Vegrangenheit ein wenig Kontakt hatte. Die Metadaten werden mittlerweile in Alma erfasst mit entsprechenden Angaben im MARC-Feld 856, das ja auch in dem von dir verlinkten Dokument genannt wird. In Regelwerks-/Standardisierungsfragen dazu stecke ich allerdings nicht weiter drin.

Falls relevant: Für die RDF/JSON-LD-Repräsenation der MARC-Angaben aus 856 haben wir vor zehn Jahren den Typ lv:ArchivedWebPage und die Property lv:webPageArchived geprägt, um Webschnitte als solche in RDF zu typisieren und die URL der archivierten Webseite anzugeben. Hier ein Edoweb-Beispiel: HTML, MARC, JSON-LD.

1 Like

Vielen herzlichen Dank!!!

Das ist eine gute Gelegenheit auch bei uns diese Thematik mal anzugehen.
Wir liefern aktuell die Webseiten noch sehr unspezifisch aus, so dass man sie eigentlich gar nicht so gut erkennen kann.

Beispiel „Webseiten Kollektion“:

<https://d-nb.info/1359058109> a bibo:Series .

Beispiel „Archivierte Webseite“:

<https://d-nb.info/1048103730> a bibo:Periodical .

Beispiel „Zeitschnitte“ (haben bisher gar keine Klasse)

<https://d-nb.info/1048103749> dcterms:medium <http://rdaregistry.info/termList/RDACarrierType/1018> .

Da würde ich gerne lv:ArchivedWebPage und lv:webPageArchived nachnutzen. Allerdings fehlt mir dann aktuell noch der Typ des Zeitschnitts.

Spannendes Thema, zu dem es anscheinend noch kein Standard Vokabular gibt…