Hallöchen, das ist mein erstes Posting in diesem Forum. Ich bin u. a. tätig im Bereich Webarchivierung. Das, was ich so mache, spielt sich vor allem im Bereich des Archival Information Packets (AIP) ab, um hier mal OAI-Fachwörter zu bemühen, also auch viel Erschließung. In dem Zusammenhang arbeite ich an einem bereits vorhandenen Metadata Application Profile (MAP). Bei diesem fehlen mir aber noch die technischen Metadaten, vor allem zur Provenienz, also zu den Programmen, Profilen und Konfigurationen, die zur Entstehung der Archivalie geführt haben. Bei Webarchivierung können das beispielsweise Angaben zur Software Heritrix sein, zur Konfiguration des crawls und zu den entsprechenden logs und reports (nur Beispiele!). Diese Daten wären aus zwei Perspektiven heraus wichtig: Zum einen für die Nutzer:innen, die so die vorliegende Quelle möglichst gut beurteilen können. Zum anderen für die Archivar:innen, die so auf bewährte Konfigurationen zurückgreifen können, um die (fortlaufende) Quelle erneut zu archivieren.
Ich frage mich nun, ob all das tatsächlich in ein MAP gehört oder nicht. Und ich bin mit Sicherheit nicht der Erste oder Einzige, der sich das fragt. Was ich bräuchte, wäre Material aus der webarchivarischen Praxis: Texte, Konzepte, MAPS. Ich wende mich an euch, weil es mir leider bisher nicht gelungen ist, hier Erhellendes zu finden, was natürlich die unterschiedlichsten Ursachen haben kann Danke für’s Lesen und für die Geduld,
Herzlich willkommen im metadaten.community-Forum, @jochen_walter !
Diese Frage kann ich dir leider nicht beantworten, weil ich keine Erfahrung in der Webarchivierung habe. Allerdings haben wir in lobid-resources mal recht umfangreiche Provenienzdaten ergänzt, die strukturiert beschreiben, dass die RDF/JSON-LD-Metadaten einer Ressource auf einem MARC-Datensatz im Verbundkatalog basieren, der zu einem bestimmten Zeitpunkt mit einer bestimmten Softwareanwendung transformiert wurde. Dabei hat uns die PROV-O: The PROV Ontology gute Dienste geleistet. Solltest du dich also zu einer Umsetzung entscheiden, dann kann ich dazu gerne unsere Erfahrungen teilen.
Ansonsten gibt es ja auch schon das Thema Metadatenstandards für Webarchivierung, hast du das gesehen? Die technischen Provenienzdaten spielen da aber bisher keine Rolle, wenn ich das richtig sehe. @Tracy_Arndt und/oder @natanael können da aber sicher mehr zu sagen.
Hallo @jochen_walter willkommen. Das ist ein schönes Thema, mit dem du dich beschäftigst. Wie @acka47 schon geschrieben hat, beschäftigen sich @Tracy_Arndt und ich mit der Erstellung eines Metadatenmodells. Deine Gedanken, Überlegungen und das Metadata Application Profile, von dem du sprichst, können dabei nur hilfreich sein.
Was technische Provenienzdaten angeht, finden die in unserer Überlegung über das DOWARC Vokabular welches wiederum auf PROV-O aufsetzt einen Platz. Daher möchte ich dich an der Stelle auch auf PROV-O hinweisen. Konkret habe ich es im Fall der Werbarchivierung noch nicht angewendet aber das können wir gerne gemeinsam erarbeiten.
Guten Morgen @acka47 und @natanael und vielen Dank für die schnellen und umfangreichen Rückmeldungen. Damit hab ich ganz klar erstmal zu tun. Mit Ergebnissen und/oder Rückfragen meld ich mich auf jeden Fall wieder. Grüße,