Im Jahr 2023 wurden 205 neue Datensätze auf dem Datenrepositorium DaRUS veröffentlicht. Jeder dieser Datensätze durchläuft vor der Veröffentlichung einen Kurationsprozess, der die Auffindbarkeit, Verständlichkeit und Nachnutzung der Daten- und Softwaresätze sicherstellen soll und wird dabei von je einem Mitglied der Publikationsdienste (UB) und von FoKUS nach verschiedenen Kriterien geprüft und – in Absprache mit den Autoren – verbessert.
In einigen Dataverse-Sammlungen wird zusätzlich vorab ein weiterer Qualitätscheck zur inhaltlichen Datenqualität durch Data Stewards in den Projekten und Clustern durchgeführt. Dieser Aufwand für qualitativ hochwertige Metadaten und Daten lohnt sich: Wie schon im Vorjahr, so wurde auch im Jahr 2023 ein DaRUS-Datensatz mit dem NFDI4Chem-Award ausgezeichnet.
Um auch bei steigenden Publikationszahlen die Skalierbarkeit des Qualitätssicherungsprozesses zu gewährleisten, befasst sich das Projekt ScalableFDM@US unter anderem mit der Unterstützung und Automatisierung dieses Prozesses. Dabei werden die betrachteten Qualitätskriterien – soweit möglich – durch automatisierte Checks unterstützt. Hierzu gehört beispielsweise die Verknüpfung von Metadaten mit kontrollierten Vokabularen und persistenten IDs, die Prüfung von Links und die Vereinheitlichung von Metadaten. Auch wenn weiterhin eine manuelle Prüfung insbesondere der Nachvollziehbarkeit eines Datensatzes notwendig bleibt, beschleunigen dennoch die automatisierten Checks den Veröffentlichungsworkflow und ermöglichen eine weitere Skalierung des Prozesses bei steigendem Publikationsaufkommen von Datensätzen und Forschungssoftware.
Dorothea Iglezakis
Dr.Forschungsdatenmanagement (FoKUS)