Hallo in die Runde,
ich habe vor einiger Zeit angefangen ein neues Tool zur Verarbeitung von MARC-21 Daten zu schreiben. Die Grundidee ist die gleiche wie beim Tool pica-rs: Effiziente Filterung von Datensätzen und Tabellieren der Daten, um diese in Data Science oder Data Engineering Workflows zu nutzen.
Der erste Meilenstein ist nun geschaft und ich habe die Version 0.2.0 heute veröffentlicht. Es stehen grundlegende Verarbeitungsbefehle (concat, invalid) sowie Funktionen zum Filtern von Datensätzen (filter) zur Verfügung. Einen ersten Überblick über die Funktionen gibt es in der (noch unvollständigen) Dokumentation: Introduction - marc21
Das Projekt ist OpenSource und findet sich auf GitHub: GitHub - deutsche-nationalbibliothek/marc21-rs: Toolkit for processing MARC 21 records.
Über Feedback und neue Ideen (gerne als GitHub Issues) würde ich mich freuen!
BG
Nico