Hands On: Working with DaRUS

Tasks for the HandsOn-Workshop with the data repository of the University of Stuttgart

Where to start

Links:

Terms:

Dataverse: Container of data sets

Dataset: Ein oder mehrere Dateien, beschrieben mit Metadaten

Metadaten: Beschreibende Informationen über ein oder mehrere Dateien wie Autor, Projekt, genutzte Methoden, Parameter... Dient als Such- und Filterkriterien und als Dokumentation für die Dateien.

Erste Schritte: Überblick und Suche

  1. Öffnen Sie DaRUS (https://darus.uni-stuttgart.de) and klicken auf den “Explore DaRUS”-Button, um auf die Hauptseite zu kommen
  2. Machen Sie sich mit der Hauptansicht von DaRUS vertraut:
    1. Filtern Sie die angezeigten Ergebnisse: Lassen sie sich einmal nur Dataverses anzeigen, einmal nur Datensätze
    2. Filter Sie nach Autor, Fach oder Veröffentlichungsjahr
    3. Wie viele Datensätze wurden 2020 in den Earth and Environmental Sciences veröffentlicht?
  1. Finden Sie Datensätze in DaRUS mit dem Suchfeld oder der Advanced Search:
    1. Wie viele Dateien enthält der Datensatz “Trained ANN Parameters for Physics-inspired Artificial Neural Network for Dynamic System”?
    2. Wie viele Versionen gibt es vom Datensatz “FLP Telemetry Data” des Flying Laptop Projects?
    3. Unter welcher Lizenz ist das “RePlay-DH Process Metadata Schema” veröffentlicht?
    4. Welche Version der Octopus Reconstruction Software wurde im Datensatz mit der doi 10.18419/darus-682 genutzt?

 

Login

Loggen Sie sich über ihre Heimatinstitution in DaRUS ein. Falls das nicht möglich sein sollte (Fehlermeldung wegen nicht übergebener eppn):

  1. Wählen Sie Universität Stuttgart als Institution
  2. Verwenden Sie fn102478 als Benutzername und das im Workshop angegebene Passwort für den Login

Datensätze hinzufügen

  1. Gehen Sie zum Interzell-Dataverse (https://darus.uni-stuttgart.de/dataverse/InterZell-IBVT) und finden Sie das Dataverse Ihres Projekts.
  2. Fügen Sie dem Dataverse einen neuen Datensatz hinzu:
    1. Füllen Sie die Pflichtfelder "Titel", "Autor", "Kontakt", "Beschreibung", "Thema" aus und speichern Sie den Datensatz.
    2. Wer könnte in 2, 5 oder 10 Jahren ein geeigneter Datensatzkontakt sein? Fügen Sie diese Person(en) dem Kontaktblock hinzu.
  3. Bearbeiten Sie die Metadaten für Ihren Datensatz und fügen Sie so viele Informationen zu den Metadaten hinzu, wie Ihnen bekannt sind. Bitte listen Sie alle Metadatenfelder auf, die für Sie unklar sind.
    1. Was sind die wichtigsten Informationen, die jemand wissen muss, um Ihren Datensatz zu finden und zu verstehen? Finden Sie Metadatenkategorien für diese Informationen?
    2. Wie können Sie ihre Daten am besten dokumentieren: durch eine Readme-Datei, Metadaten, einen Link zu einer Publikation?
    3. Fügen Sie das Zitat einer "Fake"-Publikation in das entsprechende Publikationsfeld ein.
    4. Versuchen Sie, die Software oder Instrumente zu dokumentieren, die Sie in Ihrer Forschung verwenden
    5. Versuchen Sie, die von Ihnen verwendeten Methoden zu dokumentieren und fügen Sie mindestens einen Parameter hinzu
    6. Versuchen Sie, die Variablen Ihrer Daten zu dokumentieren (falls zutreffend)
  4. Fügen Sie mindestens zwei verschiedene Dateien zum Datensatz hinzu:
    1. Laden Sie die Datei(en) über die Web-Schnittstelle hoch
    2. Markieren Sie eine Ihrer Dateien als Daten und eine andere als Dokumentation
    3. Fügen Sie eine zusätzliche Beschreibung zu Ihren Daten hinzu
    4. Verwenden Sie das Pfadfeld, um eine Verzeichnishierarchie zu erstellen

Dateien über die API hinzufügen

Versuchen Sie, mit Hilfe von CURL Ihrem Datensatz über die API eine zusätzliche Datei hinzuzufügen:

  1. Erstellen Sie ein API-Token (http://guides.dataverse.org/en/4.20/user/account.html#how-to-create-your-api-token)
  2. Verwenden Sie den Add-Data-Endpunkt (http://guides.dataverse.org/en/4.20/api/native-api.html#add-file-api), um Ihrem Datensatz eine Datei hinzuzufügen.

Disskussionspunkte

Haben Sie schon einmal Daten veröffentlicht? Haben Sie Daten innerhalb Ihrer Gruppe oder mit externen Partnern ausgetauscht?

Wie könnten Sie Datenmanagement in ihren Forschungsprozess einbetten:

  • Gibt es in Ihrer Arbeitsgruppe einen gemeinsamen Leitfaden für die Benennung von Dateien, für die Datenstruktur und die Datendokumentation?
  • Wann wäre ein guter Zeitpunkt für die Datendokumentation? Während oder kurz nach der Datengenerierung? Während der Analyse und Visualisierung? Kurz vor oder nach der Veröffentlichung der Ergebnisse?
  • Gibt es bereits Informationen über die Daten in (halb-)strukturierter Form, z.B. (elektronische) Laborbücher, Input- oder Log-Dateien oder Readme-Dateien? Wie könnten diese Informationen in strukturierte Metadaten überführt werden?
Zum Seitenanfang