Bibliotheksdaten in schema.org

Hallo Leute!

Hat sich hier eigentlich schon einmal jemand näher damit beschäftigt, Bibliotheksdaten in schema.org zu beschreiben?

Letztes Jahr gab es auf der SWIB einen Vortrag dazu (https://swib.org/swib23/slides/02_Richard%20Wallis__From%20Ambition%20to%20Go%20Live%20SWIB.pdf ) und wir spielen gerade mit dem Gedanken, ob es sinnvoll sein könnte, bibliographische Daten (MARC). Kulturobjektdaten (LIDO) und Forschungsdaten (DataCite) mit schema.org beschrieben gemeinsam findbar zu machen.

1 „Gefällt mir“

In lobid-resources nutzen wir teilweise schema.org. Aktuell sind im JSON-LD-Kontext 23 schema.org-Referenzen. Siehe dazu auch den Blogpost „Which vocabularies to use for bibliographic descriptions?“ von 2017.

Wir hatten mal testweise im HTML eines lobid-Titels schema.org-Markup eingebettet und sehr lange ein Ticket (mit Beispielumsetzung-JSON-LD im ersten Kommentar) dafür offen, es richtig umzusetzen. Letztendlich haben uns Indizien gefehlt, dass schema.org-Markup hilfreich für SEO ist, so dass wir den Aufwand gescheut und das schließlich nicht weiter verfolgt haben.

In der KIM-OER -Gruppe haben wir lange Zeit ein auf schema.org basierendes „Allgemeines Metadatenprofil für Bildungsressourcen“ (AMB) Anwendungsprofil entwickelt und letztes Jahr in einer ersten offiziellen Version publiziert, das hier evtl. auch relevant sein könnte. Zur OER-Metadatengruppe siehe auch den aktuellen Blogpost „OER-Standards gemeinsam entwickeln im Kompetenzzentrum Interoperable Metadaten“.

Wollt ihr alle drei Datenquellen auf ein Datenmodell mappen? Ich denke, dafür kann schema.org durchaus ein gutes Basisvokabular hergeben. Ggf. können ja Properties und Typen aus anderen Vokabularen ergänzt werden, falls es nicht ausreicht. (Falls ihr zu „Contributions“ Rollen angeben wollt, würde ich ggf. überlegen, direkt Bibframe zu verwenden. Dazu gibt es in schema.org auch einen Ansatz mit sdo:Role, der sich aber meines Wissens nie durchgesetzt hat. (Im Blogpost dazu laden auch nicht einmal mehr die Bilder).

1 „Gefällt mir“

Danke für die schnelle Antwort, Adrian!

Ja, die Überlegung geht tatsächlich in die Richtung die drei Datenquellen auf ein Datenmodell zu mappen. Aber das ist alles noch in einem sehr frühen Brainstorming-Stadium. Ich möchte die nächsten Wochen mal ein Proof-of-Concept versuchen und deswegen hier nach Erfahrungen fragen.

Wallis schlägt in seinen Vortrag ebenfalls den Weg über Bibframe vor.

1 „Gefällt mir“

FID Politikwissenschaft nutzt LD-JSON: Schema Markup Validator

Für SEO ist es vielleicht sinnvoller <meta>-Tags zu verwenden. Hier ein wenig mehr Info: Metadata tags for academic publications

In der Regel ist es ausreichend Highwire-Format zu implementieren, wobei bei https://freidok.uni-freiburg.de beispielweise Highwire + Dublin Core + PRISM implementiert sind.

1 „Gefällt mir“

Für Datacite gibt’s ein Crosswalk zu schema.org: Schema.org markup for repository landing pages und die „RDA Research Metadata Schemas Working Group“ hat noch mehr crosswalks gemacht FAIRsharing

Im Bereich Repositorien macht man das wegen SEO. Es ist aber fraglich, ob das überhaupt was bringt. Wenn ich mich richtig erinnere, spielt schema.org für die Indexierung in Google Scholar keine Rolle. Es ist aus meiner Sicht die Frage, was man genau erreichen möchte.

1 „Gefällt mir“

Ach ja, das Mapping von Datacite zu schema.org ist wahrscheinlich gut für die Aufnahme in Googles Dataset Search.

Hier das Beispiel aus der Datacite-Doku: https://doi.pangaea.de/10.1594/PANGAEA.932235

Und die Anzeige bei Google Dataset Search:
https://datasetsearch.research.google.com/search?src=0&query=Indian%20Summer%20Monsoon%20multi-proxy%20records%20from%20the%20Bay%20of%20Bengal%20across%20Marine%20Isotope%20Stage&docid=L2cvMTFubm53eXRmNA%3D%3D

Danke für die weiteren Links! SEO ist tatsächlich weniger das Thema und auch die Google Dataset Search haben wir auf dem Schirm.

Nein, wir überlegen gerade, ob eine Single Source of Truth sinnvoll ist für die verschiedenen Datenformate, mit denen wir umgehen müssen. Und aus diesem breiten Standardformat - schmema.org oder etwas anderes - heraus wird ein Sucheinstieg über alle Objekte ermöglicht. Natürlich könnten wir jedes einzelne Format auf SOLR mappen, aber dann fehlt mir langfristig die Dokumentation, die ein standardisiertes Format bietet.

Um das Thema noch einmal zu erweitern: Wurden abgesehen von schema.org auch andere One-size-fits-all-Formate wie bspw. EDM bei jemanden diskutiert?