FoKUS

DaRUS - das Datenrepositorium der Universität Stuttgart

DaRUS ist der Ort zum Archivieren, Teilen und Veröffentlichen der Forschungsdaten, Skripte und Codes der Angehörigen der Universität Stuttgart.

DaRUS beruht auf der OpenSource Software DataVerse und bietet Gruppen der Universität (Instituten, Arbeitsgruppen, SFBs, Projekten) die Möglichkeit, eigene Daten-Universen mit eigenen Suchkriterien und Beschreibungsmöglichkeiten zu pflegen. Die Datensätze werden so beschrieben, dass sie leicht auffindbar und unkompliziert zu teilen sind. Eine API bietet die Möglichkeit, den Upload und den Zugriff auf die Daten zu automatisieren. Die Datensätze müssen nicht veröffentlicht werden, können aber leicht zitierbar und mit DOI versehen der Öffentlichkeit zur Verfügung gestellt werden. Damit können nicht nur die Anforderungen von Fördermittelgebern oder Zeitschriften erfüllt werden, sondern gleichzeitig wichtige Forschungsergebnisse innerhalb einer Forschungsgruppe sichtbar und langfristig nutzbar gemacht werden. Neben dem Produktivsystem bietet DemoDaRUS eine Testumgebung, in der die Funktionalitäten von DaRUS ausprobiert werden können. 

Aktuelles

Aktuell befindet sich DaRUS im produktiven Pilotbetrieb. Wenn Sie DaRUS für Ihre Arbeitsgruppe oder ihr Projekt nutzen wollen, wenden Sie sich an das FoKUS-Team.

Häufig gestellte Fragen

Die Weboberfläche von DaRUS ist unter https://darus.uni-stuttgart.de zu finden. Als nicht angemeldeter Benutzer sehen Sie dort alle veröffentlichten Datensätze und Databereiche (Dataverses). 

Das Testsystem DemoDaRUS finden Sie unter https://demodarus.izus.uni-stuttgart.de/. Das Testsystem ist nur innerhalb der Universität Stuttgart erreichbar. 

Wenden Sie sich an uns (siehe Kontaktbox unten). Falls für Ihr Institut bereits ein Dataverse existiert, können wir Ihnen den lokalen Administrator dafür nennen. Im andern Fall legen wir nach einem Beratungsgespräch ihrem Institut einen Datenbereich (Dataverse) an, das sie dann selber verwalten können. Dafür muss der lokale Admin die Rolle "DaRUS-Administrator" im Uni-Admin-Portal haben. Inhalte des Beratungsgesprächs sind: Funktionen und Konfigurationsmöglichkeiten von DaRUS, Rechte und Pflichten als DaRUS-Admin, Anwendungsziele, Datentypen, -formate und -volumina, Beschreibungskategorien, Automatisierung.

Die Anmeldung geschieht auf der Startseite von DaRUS über Shibboleth. Klicken Sie rechts oben auf LogIn und wählen Sie bei Institution "Universität Stuttgart" aus. Anschließend werden Sie auf eine Anmeldeseite weitergeleitet, auf der Sie sich mit Ihrem AC-Account anmelden können. Sie sehen nun - zusätzlich zu den veröffentlichten Datensätzen und Dataverses - auch alle privaten Datensätze und Dataverses auf die Sie Rechte haben.

In der DaRUS Knowledge Base auf DaRUS finden Sie Anleitungen für die ersten Schritte auf DaRUS.

DaRUS bietet alle Möglichkeiten, um Ihre Forschungsdaten auffindbar (=findable), zugänglich (=accessible), interoperabel (=interoperable) und nachnutzbar (=reusable) und damit entsprechend den FAIR-Prinzipien aufzubereiten.

Alle auf DaRUS hochgeladenen Daten erhalten eine DOI als dauerhaften Identifikator, eine Lizenz (standardmäßig CC-BY) und können mit einem umfangreichen Satz von Metadaten beschrieben werden, die in Metadatenblöcken organisiert sind. Die Metadatenblöcke auf DaRUS ermöglichen die Beschreibung von Daten mit  Informationen zur Zitierung und allgemeinen Beschreibung, zum Kontext (Projekt, Finanzierung, Beziehungen zu anderen Datensätzen und Informationen), und zum Forschungsprozess mit den verwendeten Methoden und Werkzeugen, zum Untersuchungsgegenstand mit den erfassten Variablen und Parametern sowie technische Informationen über die Verwendung und Dokumentation von Software und Code. Ein minimaler Satz von Metadaten (Titel, Beschreibung, Autor, Kontakt, Thema) wird vom System technisch erzwungen. Weitere Metadaten können von lokalen Administratoren anhand der fachspezifischen Bedürfnisse konfiguriert werden. Die Metadatenblöcke basieren auf Metadatenstandards wie DDI, DataCite, EngMeta und CodeMeta. Alle Metadaten werden indiziert und können zum Auffinden und Filtern von Datensätzen über Suchfacetten, Volltextsuche und erweiterte Suchfunktionalitäten genutzt werden. 

Alle auf DaRUS veröffentlichten Daten sind über B2FIND, OpenAIRE und die Google Dataset Search auffindbar. 

Die Qualität der veröffentlichten Datensätze wird durch einen Publikations-Workflow sichergestellt. Jeder Datensatz durchläuft vor der Veröffentlichung einen inhaltlichen und einen formalen Qualitätscheck, bei dem er auf Vollständigkeit, Verständlichkeit und Reproduzierbarkeit geprüft wird. Die Autoren werden ermuntert, offene Datenformate zu verwenden. 

 

Falls Sie regelmäßg große Datenmengen auf DaRUS hochladen möchten, sprechen Sie bitte Ihren lokalen Administrator, bzw. als Administrator das DaRUS-Team an. Wir können dann für Ihr Dataverse den direkten Upload auf das Datenbackend aktivieren.

Mehr Informationen zu den verschiedenen Möglichkeiten zum Upload von Dateien finden Sie unter BigData

In Ihrem Dataverse können Sie selber entscheiden, welche Nutzer welche Rechte an den Datensätzen haben. Dazu können Sie Benutzergruppen anlegen und einzelnen Benutzern oder Benutzergruppen Rollen zuweisen. Um einem Benutzer Rechte geben zu können oder einen Benutzer einer Gruppe hinzuzufügen, muss sich dieser Benutzer zunächst einmal per Shibboleth bei DaRUS anmelden.

Zudem können Sie konfigurieren, welche Such- und Beschreibungskategorien (Metadaten) für ihre Forschungsdaten verfügbar sein sollen und welche davon optional oder verpflichtend ausgefüllt werden müssen.  Sie können auch Templates anlegen, die häufig genutzte Metadaten vorausfüllen, und das Dataverse mit Logo und Informationen ihres Instituts oder Projektes branden.

Jedes Dataverse hat seine eigene Rechteverwaltung. Rechte werden nicht von einem übergeordneten Dataverse an darunter liegendes Dataverse vererbt. Sie brauchen Admin-Rechte an einem Dataverse, um anderen Benutzern oder Nutzergruppen Rechte geben zu können. Rechte können auf der Ebene von Dataverses oder Datensätzen vergeben werden.

Zunächst brauchen Sie ein Dataverse für ihr Projekt. Falls ihr Institut bereits über ein Dataverse verfügt, kann der lokale Admin (mit der Rolle DaRUS-Administrator im Uni-Admin-Portal) ein Dataverse für Sie anlegen und Ihnen Admin-Rechte auf dieses Dataverse geben.

Anschließend müssen sich alle Projektpartner einmal per Shibboleth bei DaRUS anmelden, damit sie als Benutzer im System auftauchen. Dann können Sie den Partnern die gewünschten Rechte am Projektdataverse geben.

Damit sich externe Partner bei DaRUS authentifizieren können, muss die jeweilige Institution im EduGAIN-Verbund Mitglied sein und dem Dienst DaRUS (EntityID https://darus.uni-stuttgart.de/shibboleth) vier Attribute übergeben (eppn, givenName, sn, mail), damit DaRUS einen Benutzeraccount anlegen kann. Sollte es dabei Probleme geben, melden Sie sich beim FoKUS-Team.

Jeder Datensatz bekommt schon bei der Erstellung eine DOI (Digital Object Identifier) als ID zugewiesen. Damit der Datensatz tatsächlich unter dieser DOI permanent für die Öffentlichkeit erreichbar ist, müssen Sie den Datensatz veröffentlichen. Dabei durchläuft der Datensatz einen Publikationsworkflow, in dem der Datensatz zunächst in fachlicher Sicht und anschließend in formaler Sicht geprüft wird. Nach der Freigabe wird die DOI registriert und der Datensatz der Öffentlichkeit freigegeben.

Planen Sie für den Veröffentlichungsprozess mindestens eine Woche ein. Nach der internen inhaltlichen Kontrolle dauert es in der Regel etwa 3 Werktage, bis sie Rückmeldung vom DaRUS-Team bekommen. Bis zur eigentlichen Freischaltung und Veröffentlichung des Datensatzes kann dann noch eine Überarbeitung notwendig sein. 

DaRUS bietet verschiedene Grade von Öffentlichkeit:

  • Veröffentlicht mit DOI ohne Einschränkung: Sowohl die Beschreibung (Metadaten) wie auch die Daten selber sind uneingeschränkt für die Öffentlichkeit zugänglich. Die Zugriffe auf den Datensatz werden gezählt, aber keine Informationen über die Nutzer gesammelt. (Anwendungsbeispiel: OpenData)
  • Veröffentlicht mit DOI mit Gästebuch: Die Metadaten sind uneingeschränkt zugänglich, vor dem Herunterladen der eigentlichen Dateien müssen Nutzer einen Fragebogen ausfüllen. Die Daten werden unabhängig von den Antworten auf den Fragebogen zugänglich gemacht (Anwendungsbeispiel: Informationsbedürfnis über Nachnutzer von Daten)
  • Veröffentlicht mit DOI mit Datei-Schutz: Die Metadaten sind uneingeschränkt zugänglich, die Dateien können nur angefordert werden und müssen explizit durch einen Administrator freigegeben werden. (Anwendungsbeispiel: Einschränkung auf wissenschaftliche Nutzung von datenschutzrelevanten Daten)
  • Unveröffentlicht mit privater URL: Für einen unveröffentlichten Datensatz kann eine sog. private URL erzeugt werden. Jeder im Besitz dieser URL kann auf den Datensatz zugreifen. (Anwendungsbeispiel: Zugriff auf Daten für Gutachter) 
  • Unveröffentlicht: Auf unveröffentlichte Datensätze haben nur die Nutzer Zugriff, denen explizit Rechte an dem enthaltenden Dataverse eingeräumt wurden. (Anwendungsbeispiel: Teilen von Daten im Projektkontext)

Wenden Sie sich an ihren lokalen Administrator und verweisen ihn auf diese FAQs. 

Beim Herunterladen von Dateien leitet Dataverse auf den Object-Storage weiter, in dem die Dateien gespeichert wird. Curl folgt dieser Weiterleitung nicht automatisch. Daher funktioniert das im API-Guide beschriebene Vorgehen hier nicht ohne Probleme.

Wenn Sie per Data-Access-API eine Datei eines unveröffentlichten Datensatzes herunterladen, verwenden Sie am besten den folgenden Befehl:

wget "https://darus.uni-stuttgart.de/api/access/datafile/<fileId>" --header "X-Dataverse-key: <IhrApiKey>" --content-disposition

Ersetzen Sie <fileId> und <IhrApiKey> durch die entsprechenden Werte bei Ihnen.

Beim Zuweisen von Rechten an einem Dataverse werden diese zeitversetzt mit dem Index synchronisiert. Um die Synchronisation manuell anzustoßen, verändern Sie die Metadatenkonfiguration des betreffenden Dataverse.

DaRUS basiert auf der Open-Source-Software Dataverse, deren Funktionalitäten im User-Guide und deren REST-Schnittstellen im API-Guide beschrieben werden. Ein Foliensatz veröffentlicht in der DaRUS-Knowledge-Base beschreibt die ersten Schritte mit DaRUS als User und auch als Administrator.

Häufige Fragen rund um Datensätze

Sie können für jede Datei beim Hochladen einen Dateipfad angeben. Neben der Tabellenansicht bietet DaRUS dann alternativ eine Baumansicht (Table), in der die Dateien in den Dateipfaden organisiert angezeigt werden.

Alternativ können Sie mehrere Dateien in einer zip-Datei hochladen. Diese Datei wird von DaRUS automatisch ausgepackt, wobei die Ordnerstruktur innerhalb der zip-Datei erhalten bleibt.

Mehr Informationen dazu finden Sie im User-Guide von Dataverse.

Alle Metadatenfelder, bei denen eine mehrzeilige Textbox als Input-Element zur Eingabe der Inhalte vorgegeben sind, können mit Hilfe von HTML-Tags gestaltet werden.

So können Sie zum Beispiel Textabsätze mit Hilfe eines <p>-Tags kennzeichnen, Links mit einem <a>-Tag direkt anklickbar machen oder Aufzählungen mit <ul> und <li>-Elementen gestalten.

Ein Beispiel:

<p>Erster Textabsatz.</p>

<p>Zweiter Textabsatz mit einem <a href="http://link.ziel">Link</a>.</p>

<ul>

<li>Aufzählungselement 1</li>

<li>Aufzählungselement2</li>

</ul>

DaRUS, bzw. Dataverse versucht, tabellarische Daten (z.B. CSV, TSV, STATA, SAV, R) automatisch einzulesen und in ein internes Archivformat zu überführen. Nach dem erfolgreichen Einlesen der Daten gibt es auf der jeweiligen Datei-Seite eine Preview-Funktion, die den Inhalt anzeigt.

Damit das bei CSV-Dateien funktioniert, müssen diese in einem bestimmten Format sein:

  • Die Spalten müssen mit Kommas (keine Semikolons, keine Tabulatoren, keine Leerzeichen) getrennt sein
  • Die Datei beginnt mit einer Header-Zeile mit eindeutigen Spaltenüberschriften
  • Alle Zeilen haben die gleiche Anzahl Spalten
  • Tabellenzellen, die Kommas beinhalten, sind mit Anführungezeichen umgeben
Zum Seitenanfang