Ich habe zur #vBIB24 eine Session mit dem Titel Daten-Anamnese für Alle eingereicht. In diesem Thread könnt ihr auf beliebige (Meta)daten verweisen, die euch irgendwie nicht ganz gesund vorkommen oder zu denen ihr Fragen habt. Ich werde Sie dann öffentlich Sezieren und mit Tipps und Kunstkritik versehen.
Ob abschreckende Beispiele oder bewundernswerte Perlen - alle Daten sind willkommen!
Die Publikationen der Friedrich-Ebert-Stiftung waren die mit Abstand freiste Auslegung des MARC Formates, die ich dieses Jahr gesehen habe. Ich sehe allerdings keine öffentlichen Metadaten und es fühlt sich in unserer kleinen Community wie lästern an
Lieber ein Beispiel vom großen EBSCO. Probleme in einer zufällig ausgewählten Datei (metacoll.GBVCP.new.M20241025.T111017.EBSCOALL.1.mrc):
HTML Tags (ID ocn855907513)
Bunt gemischte Inhalte in Code Feldern (100 $e)
Platzhalter in den Daten (Fragezeichen in ID on1444238131, Pipes in ID on1457074356, Hash Zeichen in ID ocn746985343)
Schnöde Tippfehler (700 $e in ID on1458055171, 100 $a in ID on1453424913)
URLs zum selber-deduplizieren (ID on1356800039)
Hattest du an solche Kleinigkeiten gedacht oder suchst du eher strukturelle Probleme?
Noch ein kleiner Nachtrag:
Ich finde inhaltserschliessende Daten, die nicht in die bibliographischen Daten miteingetragen worden sind unfassbar krass: wie viel Arbeitsaufwand halt einfach verpufft! Das einzige was bleibt, ist dass das Buch an der richtigen Stelle steht… man kann es nicht mal im eigenen Katalog filtern.