Hallo zusammen. Ich suche nach einem Datensatz, um einen zweisprachigen (EN und DE) DDC-Classifier für Titel (und, falls möglich, Abstracts) von wissenschaftlichen Artikeln, Büchern, Daten usw. zu trainieren. Die Labels sollten manuell zugewiesen sein.
Die BASE-Suche-Dokumentation für OAI-PMH besagt, dass sie „set=classcode“ für manuell zugewiesene DDC-Nummern und „set=autoclasscode“ für automatisch zugewiesene Nummern verwenden. Ich habe ein Formular ausgefüllt, um Zugang zur API zu erhalten, aber bisher keine Antwort bekommen.
Gibt es andere Quellen für manuell zugewiesene DDC-Annotationen?
Herzlich willkommen im metadaten.community-Forum, @renat_shigapov !
Die Master Thesis von Christoph Broschinski kennst du?
Dort beschreibt er das Verfahren für die Ersetzung des BASE-Klassifikators durch DDC und es gibt auch ein git-Repo mit den Rohdaten inklusive Anleitung, wie daraus ein Korpus zu erstellen ist, wenn ich das richtig sehe (habe nur oberflächlich reingeschaut): Christoph Broschinski / MALIS-21-Master_Thesis · GitLab
(Ich frage Christoph auch mal an, ob er sich nicht hier anmelden möchte.)
Ich weiß nicht, ob in der ZDB eine automatisierte Zuweisung von DDC-Notationen erfolgt, vielleicht kann da jemand anders hier was zu sagen (@Tracy_Arndt ?). Bei den restlichen gehe ich davon aus, dass die manuell vergeben wurden, weiß das aber nicht sicher.
Du kannst dir das von dir gewünschte Set von Titeln mit DDC-Nummern in bulk runterladen, siehe lobid-resources - API Falls du noch Fragen nach weiteren Filtermöglichkeiten hast, sag bescheid.