Export von Metadaten für ausgewählte Institutionen

Besteht auch die Möglichkeit, nur die OER Metadaten für ausgewählte Institutionen herunterzuladen und in eine csv umzuwandeln? Ich habe mir die Anleitung angeschaut (Data API | OERSI), kann sie aber als IT-Laie nicht unmittelbar umsetzen und wäre für Hinweise dankbar.

Herzlich willkommen im metadaten.community-Forum, Wiebke!

Danke für die Anfrage, ich habe daraus mal ein eigenes Thema (einen separaten Diskussionsfaden) gemacht. Lass uns zunächst noch die Anforderungen ein wenig konkretisieren, damit wir die richtige Anfrage bauen können:

Was meinst du konkret mit „Metadaten für ausgewählte Institutionen“?

  1. Handelt es sich um OER, an deren Erstellung mindestens eine Person mitgewirkt hat, die mit der Institution affiliiert ist?
  2. Soll die Institution als Herausgeberin/Mitwirkende angegeben sein?
    3 Oder entweder 1.) und 2.)?

Hast du außerdem eine Liste der Institutionen (ein Link reicht), nach denen abgefragt werden soll?

Hi Adrian,

danke für Deine Klärungsanfrage. Ich suche nach einer Möglichkeit, die Metadaten für OER zu bekommen, an deren Erstellung mindestens eine Person mitgewirkt hat, die mit einer der 37 ORCA.nrw-Hochschulen (Netzwerkstellen | ORCA.nrw) affiliiert ist und diese Institution in den Metadaten angegeben hat.

Beispiel: Für OER aus der Uni Düsseldorf wären das die Metadaten aller OER, die mit dem Suchfilter Open Educational Resources Search Index erscheinen.

Verstehe, der Filter in der Oberfläche geht im Hintergrund auf ein Feld namens sourceOrganization. Dieses lässt sich aucgh über die API abfragen, so dass JSOn zurückkommt, z.B. ein Abfrage nach den ersten fün Institutionen: https://oersi.org/resources/api/search/oer_data/_search?q=sourceOrganization.name:("Bergische%20Universität%20Wuppertal"%20OR%20"Deutsche%20Sporthochschule%20Köln"%20OR%20"Fachhochschule%20Aachen"%20OR%20"Fachhochschule%20Dortmund"%20OR%20"Fachhochschule%20Südwestfalen"%20OR%20"Fachhochschule%20Südwestfalen")

Jetzt müssen wir zwei Dinge entscheiden:

  1. Wie holen wir am besten über die API die Daten zu den 37 ORCA.nrw-Hochschulen?
  2. Wie wandeln wir das in CSV um?

Zu 1.) kann der OERSI-Kollege Mirjan sicher etwas sagen, der hier noch nicht im Forum ist. Ich werde ihn aber mal anpingen.

Zu 2.) findet dann sicher @TobiasNx einen Ansatz mit dem Metafacture Playground, so dass du dir dynamisch eine CSV mit den jeweils aktuellen OERSI-Daten ziehen kannst. Dazu müssten wir noch klären:

  • Willst du tatsächlich einfach nur eine Liste der Metadaten zu den OERs?
  • Oder willst du lieber eine aggregierte Tabelle mit den Namen der Einrichtung in einer Spalte und der Anzahl der damit assoziierten OERs in einer anderen Spalte, plus ggf. ein Link auf die entsprechende Ergebnisliste?

Danke für Deine schnelle Antwort! Mir wäre eine nicht aggregierte Liste am liebsten, damit ich ggf. vorhandenen Dopplungen schauen kann und auch sehen kann, von wievielen Ersteller*innen sie stammen.

1 Like

Die wird dann recht groß, weil allein knapp 4700 Ressourcen mit der HHU Düsseldorf verknüpft sind (die meisten davon aus der HHU Mediathek). Oder möchtest du nur die Ressourcen die über twillo erfasst wurden?

Was die Abfrage angeht: Die relevanten Informationen stehen im Feld sourceOrganization. Dort steht einerseits der Namen der Institution und oftmals auch eine ID, Beispiel:

"sourceOrganization": [
    {
      "name": "Hochschule Bielefeld",
      "id": "https://ror.org/00edvg943",
      "type": "Organization"
    }
  ]

Prinzipiell empfehle ich die Nutzung und auch die Abfrage nach ID, weil die stabiler ist (falls sich mal ein Name ändert). Momentan bringt das aber im OERSI nicht unbedingt einen Vorteil und wir müssen auch die Konfiguration noch anpassen, damit das entsprechende Feld sourceOrganization.id abgefragt werden kann.

Von daher müsste die Abfrage mit einer OR-verknüpften Liste der Namen der entsprechenden Hochschulen gebaut werden, wie ich das oben gemacht habe. Das wir aber ziemlich lang und damit recht umständlich. Ich habe deshalb ein Ticket aufgemacht, damit wir OERSI-intern einmal diskutieren, ob wir nicht ein Kennzeichen in OERSI ergänzen, dass eine Institution zu ORCA gehört bzw. in NRW ansässig ist. Ähnliche Anforderungen wurden ja bereits beim Umstieg von ORCA.nrw auf twillo geäußert. Damals wurde OERSI-intern noch ein NRW-Marker einem ORCA-Marker vorgezogen und dieser NRW-Marker auch prototypisch umgesetzt. Wir nehmen den Faden jetzt in dem erwähnten Ticket wieder auf.

Falls die Datei für die 37 Hochschulen zu groß würde, wären auch Einzeldateien pro Hochschule für mich ok. Nach Möglichkeit bräuchte ich eine Liste mit allen Ressourcen, die mit die Hochschule als „source organization“ benennen, unabhängig davon, wo die Ressource hochgeladen wurde und ob ORCA.nrw in irgendeiner Form genannt wird. Für meine Zwecke könnte ich auch mit einem NRW-Marker arbeiten und würde mir dann einfach die Hochschulen rausfiltern, die ich brauche

1 Like

Wir haben im heutigen OERSI-Treffen beschlossen, den geobasierten Ansatz zu verfolgen, bei dem etwa ein NRW-Marker vergeben wird. Dazu gibt es dieses Ticket: Add geo information about institutions (#165) · Issues · OER Search Index / OER Search Index Setup · GitLab Ich melde mich, wenn wir das umgesetzt haben.

1 Like

Danke schonmal!!