Im Austausch mit den Kolleg:innen vom NFDI-Projekt DALIA (siehe auch 1. DALIA-KIM-Treffen zum DIF und AMB), hat das OERSI verschiedene Möglichkeiten angedeutet, wie OERSI dem DALIA-Projekt nützlich sein könnte. Insbesondere könnte OERSI
- die in DALIA aggregierten, im NFDI-Kontext entstandenen Open Educational Resources (OER) indexieren und damit einer breiteren Öffentlichkeit zugänglich machen und
- als Backend dienen für die Integration außerhalb des NFDI-Kontext entstandener OER zum Thema Forschungsdaten.
Im folgenden werde ich diese beiden Punkte genauer betrachten.
NFDI-OER mit OERSI sichtbarer machen
DALIA zielt unter anderem darauf ab, die im NFDI-Kontext entstandenen OER einzusammeln, sie auf Basis des Metadatenprofils DALIA Interchange Format (DIF) (v1.3) zu vereinheitlichen und in einen Knowledge Graph zu überführen und dann interessante Dienste zu ermöglichen.
Um die Daten zustätzlich über OERSI auffindbar zu machen, muss lediglich der Dalia Knowledge Graph in OERSI integriert werden. Dafür benötigen wir:
- eine offene Schnittstelle oder einen regelmäßig aktualisierten Vollabzug der Daten
- einen konfiguierten ETL-Prozess, der die Daten holt, sie transformiert, so dass sie dem – auf dem Allgemeinen Metadatenprofil für Bildungsressourcen (AMB) basierten – OERSI-Schema entsprechen und dann in OERSI indexiert
Umgesetzt werden die ETL-Prozesse für OERSI entweder mit Metafacture (siehe oersi-etl) oder in Python (siehe oersi-import-scripts). Die existierenden Konfigurationen der momentan knapp fünfzig angeschlossenen Quellen finden sich vollständig in den beiden verlinkten git-Repositorien. Für DALIA würde das OERSI-Team eine weitere Konfiguration in Absprache mit dem DALIA-Team ergänzen, wir freuen uns aber natürlich auch über Merge Requests zum Anschluss einer neuen Quelle.
Nicht-NFDI-OER in den DALIA-Wissengraphen integrieren
Ein weiteres Ziel von DALIA ist es, nicht im NFDI-Kontext entstandene OER zum Thema Forschungsdaten in den DALIA Wissensgraphen zu integrieren. Dafür müssen:
- relevante Quellen identifiziert werden
- die Schnittstellen der Quellen inspiziert und die jeweiligen Datenstrukturen analysiert werden
- ETL-Prozesse zum Harvesten der Quellen und Transformieren der Daten konfiguriert werden, damit die Daten DIF-konform in den Wissensgraph geladen werden können
Für genau diese Dinge (bis auf den letzten Schritt der DIF-Konformität) existiert mit OERSI bereits eine funktionierende Infrastruktur. Auch werden von OERSI offenbar bereits einige für DALIA relevante Quellen angezapft, eine OERSI-Suche nach der Phrase „research data“ zum Beispiel gibt über 500 Ergebnisse zurück.
OERSI als auch DALIA könnten also von einer Kooperation profitieren. DALIA müsste nicht alle Quellen selbst harvesten und OERSI würde von DALIA neue relevante OER-Quellen zugespielt bekommen.
So könnte das Verfahren für DALIA aussehen:
- Aufsetzen eines Prozesses zum Import von OERSI-Daten in den DALIA-Wissensgraph
- Identifizierung relevanter OER, die übernommen werden sollen (etwa anhand der Quellen und anderer Filter)
- bei Bedarf Anschluss weiterer Quellen an OERSI
Zur Illustration, hier ein Mermaid-Diagramm:
flowchart TD
tibav(TIB-AV-Portal) --> etl{ETL\nnach\nAMB};
zoerr(ZOERR) --> etl;
twillo(twillo) --> etl;
edusources(edusources) --> etl;
weitere(...) --> etl;
etl --> oersi(OERSI)
oersi --> etl2{ETL\nnach\nDIF};
etl2 --> daliakg(DALIA-Wissensgraph)
OERSI als Infrastruktur in ComeIn und Folgeprojekten
Zum Abschluss möchte ich noch das ComeIn-Projekt (2020-2023) als erfolgreiches Beispiel vorstellen, das zeigt, wie zeitlich befristete Projekte auf der OERSI-Infrastruktur aufsetzen können.
Der Katalog von im ComeIn-Projekt entstandenen Ressourcen ist ein Frontend, das auf die OERSI-API zugreift. Die OER wiederum wurden in der EduSharing-Instanz von WirLernenOnline erfasst, bei der Erstellung des entsprechenden OERSI-Import-Skripts hat @oellers vom ComeIn-Projekt unterstützt. Letztlich hat ComeIn also – im Unterschied zu DALIA – gar keine dauerhaft instandzuhaltende technische Infrastruktur außer der Webseite. So ist sichergestellt, dass die Ressourcen ohne Maintenance-Aufwand auch lange nach Ende der Projektlaufzeit noch auffindbar sind. Siehe auch das ComeIn-Architekturkonzept.
Dieses Infrastruktur-Modell übernehmen auch die ComeIn-Folgeprojekte ComeMint, ComeSport und ComeArts.