Ich öffne diesen Thread auf Basis dieses Fediverse-Posts und auf Anregung von @acka47 und @nichtich .
Ich versuche aktuell etwas genauer auf die Nachnutzbarkeit von GLAM-Daten zu schauen. Ausgangsthese/-beobachtung ist, dass Daten zwar zunehmend verfügbar sind, doch nicht immer in einer Weise, dass sie gerne nachgenutzt werden können/wollen (bislang habe ich hierzu nur ein paar Folien unter Collections as data. Potenziale und Herausforderungen der Nutzung offener Kulturerbedaten). Bibliotheksdaten werden von Bibliotheksmenschen für Bibliotheksmenschen gemacht. Wenn nun jemand diese Daten z.B. als Forschungsdaten nachnutzen will, dann stolpert man immer wieder über Hürden.
Das fängt schon beim Zugriff an, weil die Schnittstellen nicht immer optimal beworben und dokumentiert sind. Da tut sich gerade in den letzten Jahren einiges, was sehr gut ist (ich nenne hier nur mal die Angebote des DNBLab).
Bibliothekarische Metadaten zu parsen ist ebenfalls kein Spaß. Die Interpretation der Feldnummern in Pica oder MARC ist für Außenstehende nicht trivial. Man findet ggf. die MARC-Felddoku der LOC und wird nostalgisch, die Beschreibung der Felder erschließt sich aber auch nicht immer zwingend sofort. Die K10plus-Formatdokumentation ist für Pica nützlich, aber etwas versteckt (ich wüsste nicht, wie ich mich systematisch zu ihr durchklicken könnte).
Ein konkretes Beispiel zur Demonstration: Ich rufe in der DNB einen Datensatz auf: https://d-nb.info/1075880920/about/marcxml und möchte MARC-Feld 337 verstehen:
<datafield tag="337" ind1=" " ind2=" ">
<subfield code="a">ohne Hilfsmittel zu benutzen</subfield>
<subfield code="b">n</subfield>
<subfield code="2">rdamedia</subfield>
</datafield>
337$a
ist laut LOC „Media type term“. Wenn ich nun mit „ohne Hilfsmittel zu benutzen“ als Medientyp" nicht so viel anfangen kann, suche ich auf der DNB-Seite nach Erläuterungen und komme auf DNB - MARC 21 . Dort gibt’s den Link zu einer Excel-Datei (passwortgeschützt) mit > 1400 Zeilen. Da werde ich dann auf Arbeitshilfen - rda-info - Deutsche Nationalbibliothek - Wiki verwiesen - die Wiki-Seite ist aber nicht mehr aktuell und bietet mir auf Anhieb auch keine Erläuterung. Unter „Publikationstypen“ ist eine PDF verlinkt, in der ich dann ein paarmal „ohne Hilfsmittel zu benutzen“ für versch. Medientypen finde und mir ungefähr einen Reim darauf machen kann, was dahintersteckt. Die PDF ist aber natürlich auch von der Erschließung her gedacht.
Wenn ich dasselbe Spielchen ausgehend vom GVK machen möchte (https://unapi.k10plus.de/?id=gvk:ppn:834422018&format=marcxml), muss ich gefühlt schon etwas länger googlen und suchen, um auf dieses JSON-Schema zu kommen. Systematisch von der GVK-Seite aus komme ich da irgendwie gar nicht hin.
Wenn ich nun bei einer kleineren GBV-Bibliothek anfangen würde, wäre ich noch einen Schritt weiter weg von der gewünschten Information und die Chance, über die entscheidenen Hinweise zu stolpern, schwänden zusätzlich.
Der Weg zur effektiven Datennutzung ist also mitunter lang und steinig und ich frage mich, was bibliotheksseitig getan werden könnte, um Nachnutzenden da etwas unter die Arme zu greifen.
Das zum Hintergrund. Im Mastodon-Thread kam die Frage:
Was hättest du denn gerne? a) in Bezug auf PICA und die Einführung? b) für MARC?
Vielleicht klarere Pfade zu relevanten Informationsressourcen, die im Idealfall auch ohne ausgeprägte Domänenexpertise verständlich sein sollten. Die meisten Informationen sind theoretisch da, in der Praxis ranzukommen und sie dann auch nutzen zu können, bleibt aber eine Herausforderung. Die Perspektive ist, wie gesagt, immer die der nicht-bibliothekarischen Nachnutzung.