Historische Bestände kleiner Einrichtungen über lobid ermitteln

aquast · 7. Februar 2024 um 13:27

Liebe Kolleginnen und Kollegen,

bei meiner Arbeit an einer Aufstellung bereits katalogisierter historischer Bestände aus kleinen Einrichtungen in NRW hat sich lobid als hilfreich erwiesen. Ich kann für viele Einrichtungen entsprechende Anfragen stellen. Zugleich ergeben sich für mich zwei Fragen:

In einem Screenshot von lobid habe ich mehrere eine zeitliche Begrenzung (Jahre 0 - 1900) genutzt und alle Einrichtungen aufgeklappt, die solche Ressourcen enthalten.
https://lobid.org/resources/search?issued=0-1900
Rufe ich jetzt die gleiche Anfrage nochmal auf, bekomme ich die gleiche Trefferzahl (2570714 Treffer), jedoch andere Einrichtungen in der Facette. Z.B. fehlen die Einrichtungen aus Steinfurt. Die hinter den Einrichtungen in der Facette angezeigten Treffer stimmen auch nicht mit den tatsächlichen Treffern (Siehe Corvey) überein.
→ Wie müsste also eine Anfrage an die lobid-API aussehen, die mir alle Einrichtungen auflistet, die einen Bestand zwischen 0 und 1900 haben?
Welche Parameter in der an eine einzelne Einrichtung sind relevant: Die durch die Oberfläche erzeugte Anfrage sieht überbordend Komplex aus.
https://lobid.org/resources/search?issued=0-1900&owner=http%3A%2F%2Flobid.org%2Forganisations%2FDE-5-13%23%21&aggregations=hasItem.heldBy.id

Anscheinend muss ich zudem zunächst alle Sigel ermitteln?

PS: Das bisher erreichte ist hier anzuschauen: Liste der im Fabian-Handbuch genannten Einrichtungen - Fabian Handbuch NRW - hbz Service-Wiki

acka47 · 7. Februar 2024 um 14:28

Hallo @aquast ,

willkommen auf metadaten.community! Es freut mich, hier von dir zu hören.

Zunächst nochmal zu deinem Use Case: Du suchst doch nach Titeldaten zu Digitalisaten von historischen Beständen aus diesen Einrichtungen, oder?

Eingrenzung auf Sekundärpublikationen: In lobid finden sich Publikationsmetadaten zu den Digitalisaten – wie auch die Publikationsdaten des historischen Werkes – unter publication, wobei die beiden Angaben durch den type (PublicationEvent oder secondaryPublicationEvent) unterschieden werden. Solltest du also nach Digitalisaten suchen könnte evtl. die Einbeziehung von publication.type:SecondaryPublicationEvent nützlich sein. Da dann auch Mikrofiches dazukommen, die du glaube ich nicht brauchst, solltest du noch auf „elektronisch“ filtern. Raus kommt dann das: publication.type:SecondaryPublicationEvent AND publication.startDate:[* TO 1900] AND medium.id:"http://rdaregistry.info/termList/RDAMediaType/1003"

Jetzt zu deinen eigentlichen Fragen.

Da lässt du dir am besten die Aggreagations für hasItem.heldBy.id rausgeben, wie du es in der zweiten Abfrage schon machst. Ich mache das hier mal für meine Abfrage oben: https://lobid.org/resources/search?q=publication.type%3ASecondaryPublicationEvent+AND+publication.startDate%3A[*+TO+1900]+AND+medium.id%3A"http%3A%2F%2Frdaregistry.info%2FtermList%2FRDAMediaType%2F1003"&aggregations=hasItem.heldBy.id&size=0&format=json` (Ich ergänze size=0, damit nur die aggregation kommt und format=json, damit es auch im Browser sichtbar ist.) Das Ergebnis ist ein Array, bei dem hinter key die URI der Einrichtungen steckt, die Bestand an Werken bis 1900 haben, die digitalisiert vorliegen.

Ich verstehe die Frage nicht ganz. Prinzipiell arbeite ich wenig mit den durch Klicken im UI generierten Abfragen (da haben wir aus Gründen ein paar Parameter ergänzt.) Ich gehe meist so vor, wie es in diesem Blogpost (allerdings für lobid-gnd) beschrieben ist: lobid-gnd: Formulierung komplexer Suchanfragen

Ich hoffe, das hilft dir erstmal weiter.

Adrian

aquast · 7. Februar 2024 um 15:01

Hallo @acka47 ,

teilweise beantwortet das eine meiner Fragen, leider aber noch nicht ganz. Was ich vorhabe - bzw. welche Informationen ich zusammentrage, lässt sich der Liste der im Fabian-Handbuch genannten Einrichtungen - Fabian Handbuch NRW - hbz Service-Wiki gut entnehmen.
Ich möchte historischen Bestand („Print“ etc. ) und davon bereits existierende Digitalisate ermitteln. Mein bisheriger Eindruck war, dass dafür die Anfrage nach „Online“ ausreichend sein könnte https://lobid.org/resources/search?issued=0-1900&medium=http%3A%2F%2Frdaregistry.info%2FtermList%2FRDACarrierType%2F1018&owner=http%3A%2F%2Flobid.org%2Forganisations%2FDE-5-13%23%21&aggregations=medium.id

Mh, jetzt bin ich mir da nicht mehr sicher…
VG Andres

acka47 · 8. Februar 2024 um 11:30

Dein bisheriger Eindruck war genau richtig und mein Tipp war nicht der gut. Online deckt auf jeden Fall mehr ab als nur elektronisch (ich weiß jetzt nicht, aus wlechen Gründen), denn es gibt über 800k Ressourcen, die Online-Medien sind aber nicht als elektronische Ressourcen markiert sind. Von daher: Mach weiter wie bisher!

Wie oben gesagt, könntest du Digitalisate wahrscheinlich auch gut anhand von publication.type = SecondaryPublicationEvent (plus „Online“) filtern. Mit einer ergänzenden Abfrage nach publication.publishedBy lässt sich das dann noch nach der digitalisierenden Institution filtern (zumindest bei dem Beispiel, was ich mir angeschaut habe).

Beispiel:

Ich möchte alle Online-Ressourcen, die Sekundärpublikationen von Ressourcen sind, die ursprünglich vor 1900 publiziert wurden und von der Lippischen Landesbibliothek publiziert wurden.

Query: medium.id:"http://rdaregistry.info/termList/RDACarrierType/1018" AND publication.type:SecondaryPublicationEvent AND publication.startDate:[* TO 1900] AND publication.publishedBy:"Lippische Landesbibliothek"

Hinweis: Es würden hier auch Ressourcen zurückgeliefert , die in einem publication-Objekt "publishedBy": "Lippische Landesbibliothek"stehen haben, das nicht vom Typ SecondaryPublicationEvent ist, m.a.W. es wird nicht die Koexistenz der beiden in einem JSON-Objekt abgefragt. Für eine solche Anfrage wäre eine nested Query nötig (siehe Doku), allerdings haben wir das publication-Feld derzeit nicht für eine nested-Query indexiert (siehe die Index config). Falls eine nested-Abfrage für dich nützlich wäre, könnten wir die Indexierung aber anpassen.

TobiasNx · 4. April 2024 um 09:57

Ein Hinweis, die Bestände kleiner Einrichtungen können mit Hilfe der ISIL nur in zwei Fällen über lobid gesucht werden:

Die Einrichtung ist selbst eine Hauptinstitution in ALMA sind.
Wenn lobid von den Bibliotheken eine Konkordanz für diese Einrichtung zum libraryCode ihrer Hauptinstitution erhalten. Die wir erhalten haben findest du hier:
lookup-tables/data/almaSublibraryCode2Isil at master · hbz/lookup-tables · GitHub

Bei den noch nicht ALMA-Bibliotheken bin ich mir gerade nicht sicher, ob wir das noch können. Eventuell haben wir da noch da noch die alte Sigel Konkordanz.

Die Suche nach Beständen geht auch anstelle der Owner-Facette über:
https://lobid.org/resources/search?q=hasItem.heldBy.isil:DE-A2