Wir sind bei der Digitalen Landesbibliothek (https://digital.zlb.de) der Zentral- und Landesbibliothek Berlin dabei, das Metadaten-Schema für archivierte Webseiten und zugehörige Crawls/Zeitschnitte zu erstellen.
Hi @mgoetze, herzlich willkommen im metadaten.community-Forum und danke für deinen Beitrag!
Im hbz betreiben Kolleg:innen die Sammlung rheinland-pfälzischer Netzpublikationen edoweb und greifen dabei auch Software & Tools > lobid zurück, weshalb ich mit dem Thema in der Vegrangenheit ein wenig Kontakt hatte. Die Metadaten werden mittlerweile in Alma erfasst mit entsprechenden Angaben im MARC-Feld 856, das ja auch in dem von dir verlinkten Dokument genannt wird. In Regelwerks-/Standardisierungsfragen dazu stecke ich allerdings nicht weiter drin.
Falls relevant: Für die RDF/JSON-LD-Repräsenation der MARC-Angaben aus 856 haben wir vor zehn Jahren den Typ lv:ArchivedWebPage und die Property lv:webPageArchived geprägt, um Webschnitte als solche in RDF zu typisieren und die URL der archivierten Webseite anzugeben. Hier ein Edoweb-Beispiel: HTML, MARC, JSON-LD.
Das ist eine gute Gelegenheit auch bei uns diese Thematik mal anzugehen.
Wir liefern aktuell die Webseiten noch sehr unspezifisch aus, so dass man sie eigentlich gar nicht so gut erkennen kann.
Beispiel „Webseiten Kollektion“:
<https://d-nb.info/1359058109> a bibo:Series .
Beispiel „Archivierte Webseite“:
<https://d-nb.info/1048103730> a bibo:Periodical .
Beispiel „Zeitschnitte“ (haben bisher gar keine Klasse)
Bisher sind uns als relevante Vokabulare nur die zwei Terme von lobid und DOWARC [1] der National Archives (UK) über den Weg gelaufen.
Wir haben über die Einträge die die Internals eines WARCfiles abbilden DOWARC geschrieben, da wir das Vokabular mit einbeziehen wollen aktuell ist es aber nicht in der Form modelliert.
Möglicherweise verstehe ich die Internals der WARC files und der PWIDs noch nicht richtig.
Die Grafiken sind mit plantuml gemacht, ihr könnt euch aus der URL also die Beschreibung ziehen und Änderungen vornehmen.
@mgoetze was sind eure use cases für das metadaten modell?