Fehlende Verlinkung zu Überordnungen

Hallo zusammen, Ich habe versucht, über lobid herauszufinden, ob Teile von Überordnungen mit der Bonner IZ DE-5 verknüpft sind. Dazu habe ich die ID der Überordnung aus MARC 830 bzw. 773 per API nach lobid geschickt und mir die ISIL der Überordnung ausgeben lassen. Wenn in der Ergebnisausgabe DE-5 als ISIL fehlt, ist die Überordnung nicht mit der Bonner IZ verknüpft. Das funktioniert. Einige IDs wurden jedoch gar nicht in lobid gefunden, z.B. HT019286510. In Alma kann man den Titeldatensatz dazu finden und die Überordnung ist auch mit der Bonner IZ verknüpft.
In lobid kann man jedoch mit dieser ID den Titeldatensatz der Überordnung nicht finden. Angezeigt werden nur die damit verknüpften Titel. Bei den Aufnahmen der Teile steht zwar „Erschienen als The history of oriental studies …“, aber die Verlinkung führt in Leere. Bei dieser Serie handelt es sich um eine Verbund-Kopie der ZDB-Serie (2819760-4), die laut Vorgaben auch so angelegt werden sollen. Man findet die Serien-Aufnahme in lobid nur dann, wenn man mit der abweichenden ID aus MARC 016 sucht, in diesem Fall HT018628300. Dann erhält man die ursprüngliche ZDB-Serien-Aufnahme und die kopierte Verbundserie. Ich hatte 18660 IDs der Bibliothek DE-5-141 prüfen lassen und bei 24 IDs diese Fehlermeldung erhalten. Vielleicht wollt ihr das mal prüfen. Schöne Grüße, Kai
HT003081166
HT004592371
HT015750725
HT015786965
HT015818486
HT015923172
HT016064821
HT016155713
HT016259299
HT016283974
HT016323477
HT016536579
HT016543307
HT016698578
HT017046484
HT017104078
HT017298673
HT017461006
HT017652377
HT018915772
HT018931314
HT019028125
HT019052883
HT019286510

Ich schau mir das gerne an, kannst du mal deine queries posten?

Und noch eine Verständnisfrage:

Bei der Suche nach HT019286510 hättest du https://lobid.org/marcxml/990217879290206441 erwartet?
Marc-Daten: https://lobid.org/marcxml/990217879290206441

Okay, ich hab eine Vermutung. Eigentlich wird die hbzId aus dem Feld 035 gebaut.

Wir haben eine internes Lookup für die alten HT-Nummern (hbzIds) der ZDB-Datensätze auf Basis der zdbId im hbz-Verbundkatalog. Mit dem Umzug auf ALMA sind die HT-Nummern bei den ZDB-Titeln im Verbundkatalog weggefallen, verschiedene Dienste haben die HT-Nummern aber weiterhin gebraucht. Wir nutzen für das Mapping eine tsv hbzIdzdbId auf dem letzten Stand von Aleph vor dem Switch zu ALMA als Master-Datenbank.

Ich vermute, dass dieses Mapping zdbId auf hbzId, das Mapping aus dem Marc-Feld 035 überschreibt.

Die Frage wäre nun, warum hat dieser Titel ZWEI HT Nummern.

Erwartet hätte ich als Ergebnis https://lobid.org/resources/HT019286510

Dies ist der code:

Einlesen der Datei

import pandas as pd
import requests
datei = „DATEI, DIE DIE IDS DER ÜBERORDNUNGEN ENTHÄLT MIT EINER SPALTE „ID““
df = pd.read_excel(datei)

Funktion zur Verkettung von URL und HT-Nummer

def erstelle_url(id):
return „lobid-resources“ + id

import requests

def check_bestand(request_url):
headers = {‚User-Agent‘: ‚khesslin@uni-bonn.de‘}
response = requests.get(request_url, headers=headers)

if response.status_code != 200:
    return "Fehler"

result = response.json()
isils = [item["heldBy"]["isil"] for item in result.get("hasItem", []) if "isil" in item.get("heldBy", {})]

return ", ".join(isils) if isils else "Kein ISIL gefunden"

Neue Spalte „URL“ erstellen

df[‚URL‘] = df[‚ID‘].apply(erstelle_url)

Neue Spalte Check erstellen und Ergebnisse der Abfrage eintragen

df[‚Vorhanden in‘] = df[‚URL‘].apply(check_bestand)

DataFrame anzeigen

df

Hi Kai,
die URI der lobid resourcen basiert seit dem Switch von ALEPH nach ALMA auf der almaMmsId.

Die Links mit der HT-Nummer sind „nur“ Weiterleitungen und im depracatedUrigelistet. Für die Verlinkung zwischen Datensätzen nutzt ALMA leider auch weiterhin die HT-Nummer oder die ZDB ID, daher kommen die auch in den Verlinkungen bei uns vor. Leider.


Aber zu deinem Beispiel:

Ich habe jetzt auch nochmal in den Untiefen von unserem alten ALEPH Index geschaut.

https://aleph.lobid.org/resources/HT019286510
http://lobid.org/hbz01/HT019286510

<datafield tag="001" ind1="-" ind2="1">
<subfield code="a">HT019286510</subfield>
</datafield>
...
<datafield tag="020" ind1="a" ind2="1">
<subfield code="a">HT018628300</subfield>
<subfield code="b">DNB</subfield>
</datafield>
...
<datafield tag="025" ind1="a" ind2="1">
<subfield code="a">HT018628300</subfield>
</datafield>
...
<datafield tag="026" ind1="-" ind2="1">
<subfield code="a">ZDB2819760-4</subfield>
</datafield>

https://aleph.lobid.org/resources/HT018628300
http://lobid.org/hbz01/HT018628300

<datafield tag="001" ind1="-" ind2="1">
<subfield code="a">HT018628300</subfield>
</datafield>
...
<datafield tag="025" ind1="z" ind2="1">
<subfield code="a">2819760-4</subfield>
</datafield>
<datafield tag="026" ind1="-" ind2="1">
<subfield code="a">ZDB2819760-4</subfield>
</datafield>

Vermutlich handelt es sich hierbei um eine Dublette im alten Verbundkatalog. Ganz sicher bin ich mir aber nicht. Beide haben 2819760-4 als ZDB-ID in den MAB-Daten verlinkt. Die alte ALEPH → Lobid Transformation hat aber anscheinend NUR HT018628300 mit der ZDB-ID versehen.

Zusätzlich gibt es in den MAB Daten von HT019286510 eine Verlinkung zu HT018628300. Komischerweise mit Verweis auf die DNB.


Jetzt um alles mit Blick auf ALMA nochmal komplizierter zu machen:

Eigentlich sollten die ZDB Titeldaten, wie bereits angemerkt, keine HT-Nummern im Marc von ALMA mehr haben, sondern NUR eine ZDB-ID. Warum das bei deinem Datensatz nicht der Fall ist. Muss ich intern mal nachfragen.

In ALMA im Verbundkatalog scheint auch zdbId:2819760-4 doppelt in der NZ vorzukommen.

https://lobid.org/resources/990217879290206441
https://lobid.org/marcxml/990217879290206441 → hat HT-Nummer, die alte Verlinkung auf HT018628300 aber ausgewiesen als DNB, ZDB-Verlinkung mit Prefix: DE-599

<controlfield tag="001">990217879290206441</controlfield>
...
<datafield tag="016" ind1="7" ind2=" ">
<subfield code="a">HT018628300</subfield>
<subfield code="2">DE-101b</subfield>
</datafield>
...
<datafield tag="035" ind1=" " ind2=" ">
<subfield code="a">(DE-605)HT019286510</subfield>
</datafield>
...
<datafield tag="035" ind1=" " ind2=" ">
<subfield code="a">(DE-599)ZDB2819760-4</subfield>
</datafield>

https://lobid.org/resources/990207862820206441
https://lobid.org/marcxml/990207862820206441 → keine HT-Nummer. ZDB Verlinkung mit Prefix DE-600

<controlfield tag="001">990207862820206441</controlfield>
...
<datafield tag="035" ind1=" " ind2=" ">
<subfield code="a">(DE-599)ZDB2819760-4</subfield>
</datafield>
<datafield tag="035" ind1=" " ind2=" ">
<subfield code="a">(OCoLC)909716357</subfield>
</datafield>
<datafield tag="035" ind1=" " ind2=" ">
<subfield code="a">(DE-600)2819760-4</subfield>
</datafield>
<datafield tag="035" ind1=" " ind2=" ">
<subfield code="a">(DE-101)1070406724</subfield>
</datafield>

Hier scheinen mir insgesamt ein paar Ungereimtheiten aufzutreten.

Teil 2 kommt

Wir werden jetzt erstmal die Lobid Transformation anpassen, dass existierende hbzIds nicht überschrieben werden, dann sollte zumindest ein Großteil deiner Probleme nicht mehr existieren: 2095-noOverwritingHbzId by TobiasNx · Pull Request #2096 · hbz/lobid-resources · GitHub

Intern werde ich nochmal nachfragen, warum die ZDB Titel noch eine HT Nummer haben und woher die Dubletten kommen.

@TobiasNx Vielen Dank für die Erklärungen und Prüfungen.

@Kai kannst du mal schauen, ob deine Weiterleitungen jetzt nicht mehr ins leere laufen?

@TobiasNx Jetzt klappt es. Vielen Dank :grinning: