Daten-Anamnese für Alle

Ich habe zur #vBIB24 eine Session mit dem Titel Daten-Anamnese für Alle eingereicht. In diesem Thread könnt ihr auf beliebige (Meta)daten verweisen, die euch irgendwie nicht ganz gesund vorkommen oder zu denen ihr Fragen habt. Ich werde Sie dann öffentlich Sezieren und mit Tipps und Kunstkritik versehen.

Ob abschreckende Beispiele oder bewundernswerte Perlen - alle Daten sind willkommen!

4 „Gefällt mir“

Coole Session, Jakob. Ich hoffe Du trägst dabei einen weißen Kittel und Deinen Doktortitel!

1 „Gefällt mir“

Die Publikationen der Friedrich-Ebert-Stiftung waren die mit Abstand freiste Auslegung des MARC Formates, die ich dieses Jahr gesehen habe. Ich sehe allerdings keine öffentlichen Metadaten und es fühlt sich in unserer kleinen Community wie lästern an :thinking:

Lieber ein Beispiel vom großen EBSCO. Probleme in einer zufällig ausgewählten Datei (metacoll.GBVCP.new.M20241025.T111017.EBSCOALL.1.mrc):

  • HTML Tags (ID ocn855907513)
  • Bunt gemischte Inhalte in Code Feldern (100 $e)
  • Platzhalter in den Daten (Fragezeichen in ID on1444238131, Pipes in ID on1457074356, Hash Zeichen in ID ocn746985343)
  • Schnöde Tippfehler (700 $e in ID on1458055171, 100 $a in ID on1453424913)
  • URLs zum selber-deduplizieren (ID on1356800039)

Hattest du an solche Kleinigkeiten gedacht oder suchst du eher strukturelle Probleme?

In meinem Umsystematisierungsprojekt finde ich ständig Dinge, die alles umständlich machen, weil zb RVKs nicht in den Datensatz hinterlegt werden, sondern nur im String der Signatur zu finden sind:
https://opac.bibliothek.uni-augsburg.de/TouchPoint/perma.do?q=+1035%3D"BV045945486"+IN+[2]&v=uba&l=de
Das ist ein Beispiel und die Augsburger sind nicht das Problem, es ist nur das 1. Beispiel dafür, seit ich von dem Vortrag weiß.
Weiterer Fall
https://www.opac.fau.de/TouchPoint/start.do?Query=+1035%3D"BV012144954"+IN+[2]&View=uer&Language=de&Branch=

Ein häufiges Problem sind auch noch fehlende Verknüpfungen der Katalogisate bei Culturegraph, wenn mir da eins unterkommt ergänze ich hier.

Noch ein kleiner Nachtrag:
Ich finde inhaltserschliessende Daten, die nicht in die bibliographischen Daten miteingetragen worden sind unfassbar krass: wie viel Arbeitsaufwand halt einfach verpufft! Das einzige was bleibt, ist dass das Buch an der richtigen Stelle steht… man kann es nicht mal im eigenen Katalog filtern.

1 „Gefällt mir“