HTML-codierte Sonderzeichen im XML

Hallo,

wir haben XML-Daten erhalten, in denen HTML-codierte Sonderzeichen im XML enthalten sind. Ein Beispiel habe ich in der Sandbox gebaut [1]. Startet man dieses Projekt, so kommt es zu folgender Fehlermeldung:

Exception with Message „org.xml.sax.SAXParseException; lineNumber: 3; columnNumber: 37; The entity „eacute“ was referenced, but not declared.“.

Ich stehe gerade etwas auf dem Schlauch, wie ich das Problem beheben kann und bin für Lösungen dankbar.

[1] Metafacture Playground

Viele Grüße
Hans-Georg

Hi Hans-Georg,

da sind in den Daten undeklarierte XML-Entitäten drin.

a) Du kannst diese Entität im XML deklarieren. (welche Entitäten es gibt steht z.B. beim w3.org).

a.b) es müsste möglich sein, per MF die XML Daten mit der Entitätendeklaration zu impfen (als String lesen, per FIX und regex an der richtigen Stelle einfügen…) (das hab ich aber jetzt nicht probiert, wäre eine Fummelei …)

b) du könntest vorher, zur Not auch mit Metafacture (s. a.b) , die Daten als String lesen, dann in einer FIX per regex das é ersetzen mit é.

c) Falls du die XMLs vorher nicht „impfen“ kannst , also die Entitäten nicht deklarieren kannst, und das auch nur manchmal vorkommt, kannst du den Fehler abfangen, dann würde das nicht den kompletten Workflow abbrechen:Metafacture Playground Text wird unkenntlich gemacht[/spoiler]yaml%0A%7Cprint%0A%3B&data=%3C%3Fxml+version%3D%221.0%22%3F%3E%0A%3Crecord%3E%0A++++%3Cfield%3EPublications+en+s%26eacute%3Brie%3C/field%3E%0A%3C/record%3E

Hi Pascal,

danke für die Hinweise. Das wäre tatsächlich etwas Fummelei. Ich habe erstmal die Quelle angeschrieben :wink:

Gruß
Hans-Georg

1 „Gefällt mir“