DNB_SRUQueryTool - neues Tool zur einfachen SRU-Schnittstellenabfrage der Deutschen Nationalbibliothek

Für die Arbeit mit den im DNBLab angebotenen freien Daten und digitalen Objekte benötigen Forschende in der Regel individuell ausgewählte Datensets. Die DNB stellt ihre Metadaten auf verschiedenen Wegen bereit und bietet im DNB-Portal neben einem Export für kleinere Datenmengen auch den Bezug über Schnittstellen oder Download an. Insbesondere größere Metadatensammlungen für Text und Data Mining können individuell über die SRU-Schnittstelle erstellt werden. Zusätzlich zu unseren Online Tutorials (Jupyter Notebooks) gibt es jetzt für einen noch niedrigschwelligeren Zugang das DNB SRU Query Tool.

Es steht als direkt ausführbare Anwendung zum Download für Windows, MacOS und Linux oder direkt als Python-Anwendung zur Verfügung: https://github.com/deutsche-nationalbibliothek/SRUQueryTool.

Mit wenigen Klicks kann über die Oberfläche des DNB SRU Query Tools ein Metadatenformat (MARC21-xml, oai_dc, RDFxml, mods-xml) und Katalogbereich der DNB (dnb, dnb.dma, authorities, zdb) ausgewählt werden. Über die Eingabe einer Suchanfrage analog zum DNB-Portal lassen sich nach Prüfung der Treffermenge die Metadaten direkt im XML-Format zur weiteren Bearbeitung herunterladen. Durch Hinzufügen des Suchparameters „location=onlinefree“ kann das Metadatenset auch auf Datensätze mit enthaltenen Links zu freien digitalen Objekten (größtenteils PDFs) eingeschränkt werden. Das aktuelle Limit der SRU-Schnittstelle liegt bei 100.000 Datensätzen. Für die Erstellung größerer Datensets kann die Treffermenge z. B. anhand einer zusätzlichen Einteilung nach Zeitabschnitten aufgeteilt werden.