Hallo alle,
wir sind immer noch damit zu Gange, Literaturreferenzen aus Literatur zu extrahieren, die aus den verschiedensten Gründen (noch) nicht in Scopus, Web of Science, OpenAlex, OpenCitations usw. vertreten ist. (Vgl. Christians Post vom Februar.) Wenn wir jetzt Trainingsdaten generieren, wollen wir die natürlich möglichst interoperabel gestalten, so dass andere darauf aufbauen und sie für eigenes Training nutzen oder vielleicht sogar weitere Beispiele zu unserer Sammlung beisteuern können.
Wir codieren unsere Beispiele in TEI XML (in einem quellennahen <bibl>
- und noch dazu in einem strukturierteren <biblStruct>
-Format) und bereiten Routinen für die automatische Konversion in andere Formate vor. Darunter ist uns die Erzeugung von RDF-Daten sehr wichtig, und wir stellen uns Fragen nach den einschlägigen Standards.
Für die interoperable Kodierung von Zitationsinformationen in RDF scheint mir die CiTO-Ontologie einschlägig und relativ unumstritten zu sein. (Oder?)
Was empfehlt ihr aber für die allgemeineren bibliographischen Daten? FaBiO, wie es offenbar z.B. die DDB verwendet? bibo (ist das der beste Link?), wie es - wenn ich es richtig verstanden habe - der Linked Data Service der DNB verwendet und welches in den DINI-Empfehlungen erwähnt wird? Oder gar so etwas wie BibFrame? Oder alles parallel, das schadet ja nichts?
Gibt es da eine Best Practice? Ich tendiere zu FaBiO mit DC „Einsprengseln“, wo diese sich anbieten, aber ich bin sehr unsicher. Zu was für einem Datensatz von Literaturverweisen könntet/würdet ihr am liebsten Daten beisteuern? Welches Format wäre für eure eigenen Bedarfe am hilfreichsten?
Entschuldigung für die lange Nachricht! Ich bin für jeden Kommentar dankbar, viele Grüße,
Andreas
PS. Was braucht/benutzt eigentlich wikidata/WikiCite? Oder ist deren Datenformat sowieso eigentlich eher für die „interne“ Nutzung gedacht und es käme in dieser Hinsicht darauf an, etablierte Import-Mechanismen gut mit einem anderen (o.g.?) Format bedienen zu können?