FID Metadata Streaming - Transformation großer XML Dateien als Datenstrom

Im Rahmen des durch die Deutsche Forschungsgemeinschaft (DFG) geförderten Fachinformationsdienst Romanistik haben wir eine Kommandozeilenanwendung entwickelt, die XML als Datenstrom im Verfahren des burst mode streaming prozessiert.

Burst mode streaming bedeutet, dass ausgewählte Teilbäume als Objekt materialisiert und mit XSLT transformiert werden. Das Ergebnis der Transformaton wird anstelle des Teilbaums in den Ausgabestrom geschrieben.

Der Anwendungsfall ist die Korrektur größerer Datenlieferungen in MARC21 XML, die Fehler enthalten, die nachgelagerte Werkzeuge wie Catmandu blockieren.

Die Anwendung ist unter der GPLv3 veröffentlicht und im Quelltextrepository abrufbar:

2 Likes