FAUDataCloud – IT-Services für Forschungsdaten
Überblick
Das FAU Competence Center for Research Data and Information (FAU CDI) und das Regionale Rechenzentrum Erlangen (RRZE) unterstützen das Forschungsdatenmanagement (FDM) an der FAU im Rahmen der FAUDataCloud-Initiative. Das Klinikum Erlangen soll mittelfristig über das Medizinische Zentrum für Informations- und Kommunikationstechnik (MIK) einbezogen werden.
Das FDM wird im Rahmen der FAUDataCloud zunächst in der passiven Phase des Forschungsdatenzyklus unterstützt (Publikation, Archivierung, Nachnutzung). Die aktive Phase (Planung, Datenerhebung und -analyse) geschieht weiterhin durch die Forschungsprojekte selbst. Lediglich die Datenerhebung wird durch zentrale Bereitstellung von Systemen erleichtert, in welchen die für die passive Phase notwendigen Metadaten bereits initial hinterlegt werden.
Konzeption
- Systeme für Storage und Standardanwendungen (z.B. Standard-Datenbanken) werden beschafft und betrieben vom RRZE bzw. MIK.
- Höhere Dienste der FAUDataCloud setzen darauf auf und werden in Abstimmung betrieben von FAU CDI, RRZE bzw. MIK.
- Eine FDM-Grundversorgung (siehe unten) ist für Organisationseinheiten der FAU kostenfrei.
- Darüber hinausgehende Ressourcenbedarfe für die Grundversorgung von der CDI geprüft und genehmigt – die Regelungen dafür entwickeln die Mitglieder der CDI zusammen mit RRZE / MIK,
- Forschungsprojekte müssen spezielle FDM-Mehrbedarfe innerhalb der Antragsphase berücksichtigen, das CDI kann beraten und oft kompetentes Personal vermitteln.
- Die organisationsinterne (Lehrstuhl, Professur, Projekt) Verteilung der Ressourcen erfolgt dezentral.
IT-Services für Forschungsdaten
Verfügbare Services
- Speicherplatz für heiße Forschungsdaten (aktiv in der Forschung genutzt, z.B. während Projektphase), realisiert als Netzlaufwerk (siehe unten).
- Speicherplatz für kalte Forschungsdaten (abgeschlossene Datensätze, mit und ohne Veröffentlichung): FAUDataCloud Repositorium (via FAU CRIS).
- Höhere Dienste: Elektronische Laborbücher und semantische Forschungsumgebung.
- Versionsverwaltung: gitlab.rrze.fau.de für FAU-interne Nutzung, gitos.rrze.fau.de mit Anbindung an DFN-AAI (auch externe Nutzung).
- Datenbanken – Testbetrieb.
Services im Aufbau
- Q2/2025 – Grundversorgung Datenbanken
Geplante Services
- Ende 2025 – jupyterhub für Lehre (exkl. HPC-Anbindung).
Self-Service-Dienste
Im Rahmen der Grundversorgung steht jeder Forschungsgruppe der FAU (Lehrstuhl, unabhängige Professur; alles mit einer Kostenstelle) die folgenden IT-Ressourcen unentgeltlich zu:
- 2 TB Archivplatz (kumulativ): Pro Datensatz müssen in CRIS die Metadaten (nach FAIR-Prinzipien; analog DataCite Schema) und ein FAU-Datentestament ausgefüllt werden. Anschließend erfolgt die Zuteilung automatisch.
- Dieser Bereich enthält nur abgeschlossene Datensätze (read-only), welche damit eindeutig referenziert werden können.
- Persistente Identifikatoren (PID) zur Referenzierung
- FAU-PID: immer
- DOI: bei Veröffentlichung der Metadaten
- Projektspeicher für Arbeitsgruppen (Netzlaufwerk; akademische Nutzung beliebig): Antrag und Rechte-/Rollen-Verwaltung zukünftig über IDM-Portal, derzeit über wap-speicher@fau.de. Volumen 250 GB / Person.
- (ab Mitte 2025) 50 GB Datenbankplatz (PostgreSQL/MySQL/?/…/NoSQL), Antrag und Rechteverwaltung über das IDM-Portal vorgesehen.
- Allgemeine Dienste (GitLab, Chat-Service, …) in RRZE-Regelbetrieb überführt.
- Höhere/Spezifische Dienste (ELN, WissKI, JupyterLab, etc) werden in der Regel unkonfiguriert bereitgestellt.
Erweiterte Grundversorgung
Bedarfe, die über die Grundversorgung hinausgehen, können bei der CDI beantragt werden. Dies gilt auch für Projekte/Forschungsdaten, die keiner Kostenstelle zugeordnet werden können (z.B. Projekte von Studierenden). Die Bedarfe werden dann von der CDI geprüft und nach Priorität eingeordnet; die Kriterien sind:
- akademische Begründung & Strategie zur Datenkuration;
- Gesamt-Ressourcenbedarf; warum konnte das nicht im Projekt beantragt werden.
- Gibt es ein Endorsement des Departments, …
- Intendierte Lizensierung des Datensatzes (freier/offener ist besser)
- Datentestament (was passiert, wenn Daten verwaisen, z.B. weil der „Eigentümer“ die FAU verlässt)
- Adäquatheit/Qualität der Metadaten.
Der Antrag auf erweiterte Grundversorgung sollte so ausführlich sein, dass diese Kriterien beurteilt werden können. Außerdem muss dieser alle administrativen Metadaten (zur automatischen Einrichtung; Impressum, etc; FAU-Datentestament) enthalten. Die erweiterte kostenlose Grundversorgung ist außerdem abhängig von den zur Verfügung stehenden zentralen Ressourcen.
Das CDI richtet zur Begutachtung der erweiterten Grundversorgung eine Kommission aus CDI-Mitgliedern (fachliche Abdeckung wird sichergestellt) ein, die die Anträge einmal im Monat bearbeitet.
FDM-Projektversorgung
Großprojekte wie GRK/SFB müssen gesondert zwischen Antragsteller, Kanzler, CIO und KL@CDI (vertreten durch Geschäftsführer) geplant/verhandelt/finanziert werden. Kriterien wie bei der erweiterten Projektversorgung (oben), wobei ein bewilligter SFB/GRK einen Teil der o.g. Kriterien automatisch erfüllt.