• Skip navigation
  • Skip to navigation
  • Skip to the bottom
Simulate organization breadcrumb open Simulate organization breadcrumb close
CDI Logo
  • FAUTo the central FAU website
  1. Friedrich-Alexander-Universität
  2. FAU Kompetenzzentren
Suche öffnen
  • Deutsch
  • Campo
  • StudOn
  • FAUdir
  • Jobs
  • Map
  • Help
  1. Friedrich-Alexander-Universität
  2. FAU Kompetenzzentren

CDI Logo

Navigation Navigation close
  • About FAU CDI
  • Support and Services
    • Electronic Lab Notebooks (ELN)
    • WissKI and FAUWissKICloud
    • FAU CRIS Research Information System
    Portal Support and Services
  • Research Data Management
  • How to get in touch
  1. Home
  2. Information on Research Data Management (RDM)
  3. A-Z Glossary Research Data

A-Z Glossary Research Data

In page navigation: Information on Research Data Management (RDM)
  • A-Z Glossary Research Data
  • National research data infrastructure (NFDI)
  • Quality of research data
  • Research data census
  • Wohin mit meinen Daten?

A-Z Glossary Research Data

  • A
  • B
  • C
  • D
  • E
  • F
  • G
  • H
  • I
  • J
  • K
  • L
  • M
  • N
  • O
  • P
  • Q
  • R
  • S
  • T
  • U
  • V
  • W
  • X
  • Y
  • Z

A

Analog research materials include photographs, handwritten notes, books, audio cassettes, paintings or 3D objects, such as fossils or architectural models. In order to make them usable in a repository, the materials must first be digitized or at least the associated metadata must be provided in a digital form. Analog materials differ from “born digital” data, which exist in digital form from the beginning, for example digital photos, CAD drawings, measurement data or blogs.

Analoge Forschungsmaterialien sind zum Beispiel Fotos, handschriftliche Notizen, Bücher, Audio-Kassetten, Gemälde oder 3D-Objekte, wie etwa Fossilien oder Architekturmodelle. Um sie in einem Repositorium nutzbar zu machen, müssen die Materialien zunächst digitalisiert (Digitalisat) oder zumindest die zugehörigen Metadaten digital zur Verfügung gestellt werden. Analoge Materialien unterscheiden sich von “born digital”-Daten, die von Beginn an in digitaler Form existieren, zum Beispiel digitale Fotos, CAD-Zeichnungen, Messdaten oder Blogs.

Unter einem Archiv versteht man allgemein eine Sammlung an Dokumenten. Diese sollen im Archiv zeitlich unbegrenzt aufbewahrt werden. Bezogen auf den Forschungsdatenmanagementkontext ist ein Archiv eine Sammlung von Daten.

An archive is generally understood to be a collection of documents with the intention of preserving documents indefinitely. In the research data management context, an archive is a collection of data.

B

Say no to data loss and back up your data

Datenverlust –  Nein Danke

 

C

Cold data are data records that have been finalized and will not be modified. These are usually data that are stored in repositories together with the descriptive metadata (e.g. for publication or archiving). Only cold research data can get a DOI.

Literary, artistic and scientific works are protected by German copyright law.
In specific terms, this means that without a corresponding license, reuse is only possible in a restrictive manner.

We recommend licensing that is as open as possible, because this increases data reusability and boosts the reputation of researchers. If you have any questions, the CDI will be happy to advise you.

Read this article for further details.

CRIS stands for Current Research Information System, the research information system at FAU. It stores information about research achievements, for example information about a publication, a research project, research data or inventions. Only metadata is stored, for example, the full text of a publication is not stored directly in CRIS, but it does indicate where this full text can be found (for example, by specifying the DOI).

In research information systems, the various data areas are linked: publications are not only assigned to persons, but also projects, projects in turn are assigned to specific research areas. For this purpose, internal data sources of the university are also used, which offers added value compared to classic list formats and data providers such as Scopus or Web of Science.

CRIS steht für “Current Research Information System”, also für ein Forschungsinformationssystem. In diesem werden Informationen über die Existenz von Forschungsleistungen gespeichert, beispielsweise Angaben zu einer Publikation, einem Forschungsprojekt, Forschungsdaten oder Erfindungen. Dabei werden nur Metadaten hinterlegt, so wird z.B. der Volltext zu einer Publikation nicht direkt im CRIS aufbewahrt, sehr wohl aber die Angabe, wo dieser Volltext zu finden ist (bspw. über Angabe der DOI).

In Forschungsinformationssystemen werden die verschiedenen Datenbereiche verknüpft: Publikationen werden nicht nur Personen, sondern auch Projekten zugeordnet, Projekte wiederum bestimmten Forschungsbereichen. Hierzu werden auch interne Datenquellen der Universität genutzt, was einen Mehrwert gegenüber klassischen Listenformaten und Datenanbietern wie Scopus oder Web of Science bietet.

D

Ein Data Custodian ist verantwortlich für die sichere Verwahrung und Zugangsverwaltung für Forschungsdaten der jeweiligen Organisationseinheit (OE) nach den jeweiligen Bestimmungen. Er oder sie begleitet und berät schon während laufender Projekte, um frühzeitig die spätere Veröffentlichung der Daten vorzubereiten. Es soll vermieden werden, dass erst am Schluss ein großer punktueller Aufwand entsteht, bevor die Übergabe der Daten an den Data Steward erfolgen kann. Wenn man gleich die richtigen Annotationen (Metadaten) hinzufügt, muss man sie später nicht mühsam rekonstruieren.

Data literacy is a key skill in the 21st century and, in short, describes the ability of an individual to handle data. What knowledge, skills and attitudes are needed in society, the world of work and science today? Aspects of data literacy are described in detail in this document. Data literacy is fundamental to the entire research process in collecting, organizing, using, publishing and re-using data.

The following video illustrates the importance of data literacy as a key skill.

“Data Literacy” (de: “Datenkompetenz”) gilt als Schlüsselkompetenz des 21. Jahrhunderts und beschreibt kurz gesagt die Fähigkeit eines Individuums mit Daten umzugehen. Welches Wissen, welche Fähigkeiten und welche Haltung benötigt man in Gesellschaft, Arbeitswelt und Wissenschaft? Die einzelnen Bestandteile dieses Prozesses sind tabellarisch hier aufgelistet. Die Relevanz dieser grundlegenden Datenkompetenz gilt für den gesamten Forschungsprozess von der Erhebung, der Organisation und Nutzung, der Veröffentlichung und der Nachnutzung von Daten.

Folgendes Video veranschaulicht die Bedeutung der Schlüsselkompetenz Data Literacy.

According to forschungsdaten.info, a data management plan (DMP) structures the handling of research data, or its “collection, saving, documentation, maintenance, processing, transfer, publication and storage, as well as the necessary resources, legal framework and responsible persons.” A data management plan (DMP) documents the entire data lifecycle.

Many third-party funding organizations (DFG, FWF, SNSF, Horizon Europe, Volkswagen Foundation) expect information on the handling of research data as part of a funding application for the allocation of funds from certain funding lines.

The DMP describes how to handle research data from the planning stage, to collection, to long-term archiving or, if applicable, planned deletion. At the very least, the data management plan answers the following questions:

  • What is collected?
  • Which bodies must be consulted before collecting data?
  • In what form and where will research data be stored in the various project phases?
  • Who can access the data and when will it be available?
  • Who is responsible for the individual steps?
  • Which legal requirements must be observed? The DMP is a useful and necessary part of the project application.
  • What exactly does this mean for research?

Why this approach is meaningful and sustainable is explained in this video.

For many scientists, dealing with research data is the basis of their daily work. It therefore saves time and effort if this data is efficiently structured, documented and backed up from the outset.

Most of the data is initially stored in files. Files have different types or file formats that are sometimes identified by the file name extension, for example in the Windows operating system. Furthermore, files are stored in directories (folders). Naming files and directories systematically is very important. For example, the Stanford File Naming Handout.

Alternatively, data can also be stored in databases. Here, the effort is greater, because a database management system such as MySQL must first be set up. A database schema needs to be defined which provides a structure for storing data. Here, too, naming is of great importance. Databases support managed shared access to data much better than data stored in files. There are different types of databases: relational, hierarchical, graph-based, RDF triple stores and a few more.

The following animated video clearly summarizes the topic of data organization.

In order to ensure transparent research and traceability of results, research data should be published wherever possible. In order to comply with FAIR principles, the corresponding metadata must be recorded. A repository is required for the publication of the research data.

Ein Data Steward ist verantwortlich dafür, die Qualität und Zweckgerechtigkeit (Fit for Purpose) von Forschungsdaten inklusive ihrer Metadaten aus fachlichen Aspekten sicherzustellen. Er oder sie wird tätig, wenn die Forschungsdaten vollständig und abgeschlossen sind. Es ist darauf zu achten, dass die Metadaten vollständig und dem aktuellen Standard entsprechend erstellt wurden. Eine persistente Id sollte vorhanden sein. Weiterhin ist ein geeignetes Repository für die langfristige Bereitstellung auszuwählen. Beratung sollte im Vordergrund stehen; Kontrolle ist mit Fingerspitzengefühl und möglichst konstruktiv vorzunehmen.

Das Dateiformat definiert die Struktur der in der Datei enthaltenen Daten. Dadurch wird Anwendungen erlaubt den Inhalt einer Datei zu interpretieren.

Viele Dateinamen enthalten eine, durch einen Punkt getrennte, Endung. Diese deklariert das Dateiformat.

Unter dem folgenden Link finden Sie Details und eine Auflistung welche Formate für eine langfristige Speicherung geeignet sind.

Laut forschungsdaten.info strukturiert ein Datenmanagementplan (DMP) den Umgang mit Forschungsdaten, bzw. deren “Erhebung, Speicherung, Dokumentation, Pflege, Verarbeitung, Weitergabe, Veröffentlichung und Aufbewahrung, ebenso wie die erforderlichen Ressourcen, rechtlichen Randbedingungen und verantwortlichen Personen.” Ein DMP dokumentiert somit den gesamten, für die Daten vorgesehenen, Lebenszyklus.

Viele Drittmittelgeber (DFG, FWF, SNF, Horizon Europe, Volkswagenstiftung) erwarten für die Vergabe von Mitteln aus bestimmten Förderlinien Angaben zum Umgang mit Forschungsdaten als Teil eines Förderantrags.

Der DMP beschreibt, wie mit den Forschungsdaten von der Planung der Erhebung bis zur langfristigen Archivierung oder gegebenenfalls planmäßigen Löschung umgegangen wird. Er beantwortet dabei mindestens die Fragen:

  • Was wird erhoben?
  • Welche Stellen müssen vor der Erhebung hinzugezogen werden?
  • In welcher Form und wo werden die Forschungsdaten in den unterschiedlichen Projektphasen gesichert?
  • Wer hat ab welchem Zeitpunkt darauf Zugriff?
  • Wer ist für die einzelnen Schritte zuständig / verantwortlich?
  • Welche rechtlichen Vorgaben sind zu beachten? Bereits im Rahmen der Projektbeantragung ist ein DMP sinnvoll und erforderlich.
  • Was genau bedeutet das für die Forschung?

Warum dieses Vorgehen sinnvoll und nachhaltig ist, erklärt dieses Video.

Der Umgang mit Forschungsdaten ist für viele Wissenschaftlerinnen und Wissenschaftler die Grundlage ihrer täglichen Arbeit. Es spart daher Zeit und Aufwand, wenn diese Daten von vorneherein effizient strukturiert, dokumentiert und gesichert werden.

Die meisten Daten werden zunächst in Dateien abgelegt. Dateien haben unterschiedliche Typen oder Dateiformate, die manchmal als Suffix des Dateinamens kenntlich gemacht werden, z.B. im Betriebssystem Windows. Weiterhin werden Dateien in Verzeichnissen (Ordnern) abgelegt. Ganz wichtig ist eine systematische Benennung von Dateien wie auch Verzeichnissen. Hinweise dazu gibt z.B. das Stanford File Naming Handout.

Alternativ können Daten auch in Datenbanken abgelegt werden. Hier ist der Aufwand höher, weil erst ein Datenbank-Management-System wie z.B. MySQL eingerichtet werden muss. Zentral ist die Definition eines Datenbank-Schemas, mit dem die Strukturen für die zu speichernden Daten angelegt werden. Auch hier ist die Namensgebung von großer Bedeutung. Datenbanken unterstützen den geregelten gemeinsamen Zugriff auf Daten sehr viel besser als Dateien. Es gibt verschiedene Arten von Datenbanken: relationale, hierarchische, Graph-basierte, RDF Triple Stores und noch einige weitere mehr.

Folgendes Animationsvideo fasst die Thematik der Datenorganisation anschaulich zusammen.

Für transparente Forschung und Nachvollziehbarkeit der Ergebnisse sollten Forschungsdaten – soweit möglich – veröffentlicht werden. Um die FAIR-Prinzipien zu erfüllen, müssen die entsprechenden Metadaten erfasst werden. Für die Publikation der Forschungsdaten wird ein Repositorium benötigt.

E

eLabFTW ist eine Open Source Software für den Gebrauch als elektronisches Laborbuch (ELN), Datenmanagementplattform und Labor-Bestandsmanagementsystem.

Die Daten können in verschiedene Formate exportiert werden, die mit JSON und CSV Dateien einen Import in ein anderes System erleichtern.

eLabFTW is open source software used as an electronic lab notebook (ELN), data management platform and laboratory inventory management system.

The data can be exported to various formats that make it easier to import to another system with JSON and CSV files.

Electronic Lab Notebooks (ELNs) are software applications that are used to document research data and replace paper laboratory books.

ELNs offer several advantages to the paper equivalent:

  • Data findability through search and filter functions
  • Accessibility: Network access regardless of location and time
  • Backup copies of lab notebooks (previous versions can be restored)
  • Reusability of templates, protocols and processes
  • Time savings through templates, standardization and existing digital data
  • Automatic recording of measurement results

The decision to use ELN software should be made carefully, as it is generally used over a long period of time. Important points that should be taken into account in the decision can be found here.

Elektronische Laborbücher (engl. Electronic Laboratory Notebooks, kurz: ELNs) sind Softwareanwendungen, die zur Dokumentation von Forschungsdaten eingesetzt werden und somit die analogen Papierlaborbücher ersetzen.

ELNs bieten mehrere Vorteile gegenüber ihrer analogen Variante:

  • Daten-Auffindbarkeit durch Such- und Filterfunktionen
  • Erreichbarkeit: Netzzugriff unabhängig von Ort & Zeit
  • Sicherheitsbackup der Laborbücher (und damit eine Wiederherstellung einer vorherigen Version)
  • Wiederverwendbarkeit von Vorlagen, Protokollen & Prozessen
  • Zeitersparnis durch Templates, Standardisierung & bereits vorliegende digitale Daten
  • automatische Erfassung von Messergebnissen

Die Entscheidung für eine ELN-Software sollte gut bedacht sein, da damit i.A. über einen langen Zeitraum hinweg gearbeitet wird. Wichtige Punkte, die bei der Entscheidung berücksichtigt werden sollten, finden sich z.B. hier.

The European Open Science Cloud (EOSC) is a multi-disciplinary information service where you can publish, search for data and find tools and services. This service is one of the flagship projects of the EU Framework Programme for Research and Innovation. The portal can be reached here.

Die “European Open Science Cloud” (EOSC) ist ein multi-disziplinärer Informationsdienst, in dem veröffentlicht, nach Daten gesucht und Werkzeuge und Dienstleistungen gefunden werden können. Dieser Dienst ist einer der Leuchtturmprojekte der Europäischen Forschungsförderung. Das Portal ist hier erreichbar.

F

FAIR principles are requirements that ensure sustainable and re-usable research data. The acronym FAIR stands for Findable, Accessible, Interoperable and Re-Usable. A number of research funding providers (including the EU, the DFG and the SNF) believe the FAIR principles are an important requirement for sustainable research and therefore expect them to be complied with. Using persistent identifiers and detailed metadata is considered particularly important for the findability of data. Using standards for interfaces, metadata and data supports accessibility and interoperability of data. Extensive content-related metadata and documentation and clear rights of reuse make it easier to reuse data. Data do not have to be classed as open in order to meet FAIR principles, but their metadata ought to be freely accessible. By complying with these guidelines, “machine-actionability” is to be ensured. This means that a computer-aided system can find, access and reuse the digital objects with minimal human input.

Further information

Die FAIR‐Prinzipien sind Anforderungen, die nachhaltige und wiederverwendbare Forschungsdaten erfüllen sollten. Das Akronym FAIR steht für Findable, Accessable, Interoperabel und Re‐Usable. Die FAIR‐Prinzipien werden von vielen Forschungsförderern (etwa EU, DFG oder SNF) als wichtige Voraussetzung für nachhaltige Forschung gesehen und auch entsprechend eingefordert. Als besonders wichtig für die Auffindbarkeit von Daten wird die Verwendung von persistenten Identifikatoren und detailreichen Metadaten gesehen. Der Einsatz von Standards – sowohl bei Schnittstellen als auch für Metadaten und Daten selbst – unterstützt neben der Zugänglichkeit auch die Interoperabilität der Daten. Die Wiederverwendbarkeit wird durch umfangreiche inhaltliche Metadaten und Dokumentationen sowie klare Nachnutzungsrechte erleichtert. FAIRe Daten müssen nicht notwendigerweise offen („open data“) sein. Lediglich die zugehörigen Metadaten sollten frei zugänglich sein. Durch die Einhaltung dieser Richtlinien soll die “machine-actionability” gewährleistet / sichergestellt werden. “machine-actionabilty” bedeutet, dass ein computergestütztes System mit minimalem menschlichen Input die digitalen Objekte auffinden, darauf zugreifen und diese wiederverwenden kann.

Mehr Details hier

FAUWissKICloud
The purpose of FAUWissKICloud is to host and maintain the FAU WissKI instances. The CDI manages the software and RRZE is responsible for maintaining the hardware. WissKIs are maintained and updated using the WissKI Distillery.

Die FAUWissKICloud hat eigens den Zweck die WissKI-Systeme der FAU zu hosten und zu warten. Unter der Obhut des RRZE auf Hardware-Ebene managt das CDI die Software-Ebene des Servers. Mithilfe der WissKI-Distillery werden die WissKIs systemübergreifend gewartet und mit Updates versorgt.

The file format defines the structure of the data contained in the file. This allows applications to interpret the contents of a file.

Many filenames contain an extension separated from the filename by a period. This declares the file format.

Under the following link you will find details and a list of which file formats are suitable for long-term storage.

Gemäß Definition von Forschungsdaten.info sind Forschungsdaten Daten, die während wissenschaftlicher Tätigkeit (z. B. durch Messungen, Befragungen, Quellenarbeit) entstehen.

Diese Definition gilt sowohl für neu erzeugte als auch für aufbereitete Daten unabhängig davon, ob diese Daten in eine Publikation einfließen oder nicht und ob sie in analoger oder digitaler Form vorliegen. Forschungsdaten bilden die Grundlage wissenschaftlicher Arbeit.

Daraus ergibt sich die Notwendigkeit eines disziplin- und projektspezifischen Verständnisses von Forschungsdaten mit unterschiedlichen Anforderungen an die Aufbereitung, Verarbeitung und Verwaltung der Daten: dem sogenannten Forschungsdatenmanagement.

Forschungsdaten und ihre Metadaten am Beispiel der Eichhörnchenforschung gut und einfach erklärt in diesem Video.

Die FAU betrachtet die Sicherung und das Management von Forschungsdaten (FD) als essentiell für erfolgreiche und nachhaltige Forschung und wissenschaftliche Integrität. Der geplante und verantwortungsvolle Umgang mit Forschungsdaten ist unerlässlich und muss deshalb gefördert und gefordert werden, damit die Universität, ihre Angehörigen und die Öffentlichkeit davon profitieren können. Hierfür ist es entscheidend, das Bewusstsein für Forschungsdaten und für die FAIR-­Prinzipien langfristig zu stärken. Siehe FAU Forschungsdaten Policy.

Gemäß Definition von Forschungsdaten.info versteht man unter Forschungsdatenmanagement den Prozess der Transformation, Selektion und Speicherung von Forschungsdaten mit dem Ziel, diese langfristig und unabhängig vom Datenerzeuger zugänglich, nachnutzbar und nachprüfbar zu halten. Es können dazu an allen Punkten des Datenlebenszyklus strukturierte Maßnahmen ergriffen werden, um die wissenschaftliche Aussagekraft von Forschungsdaten zu erhalten, deren Zugänglichkeit durch Dritte für Auswertung und Analyse zu bewahren und die Nachweiskette zu sichern.

Die praktische Anwendung und den Nutzen für die Forschenden veranschaulicht das folgende  Video

“Forschungsdaten leben länger”

Die FAU betrachtet die Sicherung und das Management von Forschungsdaten (FD) als essentiell für erfolgreiche und nachhaltige Forschung und wissenschaftliche Integrität. Der geplante und verantwortungsvolle Umgang mit Forschungsdaten ist unerlässlich und muss deshalb gefördert und gefordert werden, damit die Universität, ihre Angehörigen und die Öffentlichkeit davon profitieren können. Hierfür ist es entscheidend, das Bewusstsein für Forschungsdaten und für die FAIR-­Prinzipien langfristig zu stärken. Siehe FAU Forschungsdaten Policy.

 

Eine Richtlinie zum Umgang mit Forschungsdaten enthält grundsätzliche Leitlinien für eine größere Organisationseinheit, z.B. eine Universität. Neben allgemeinen Handlungsempfehlungen werden darin meist die Verantwortlichkeiten und Unterstützungsstrukturen vor Ort geregelt. Teilweise umfassen die Richtlinien auch Details zu Lizenzierung von und Repositorien für Forschungsdaten.

Die Richtlinie der FAU für digitale Forschungsdaten ist in der jeweils aktuellen Version unter der Adresse https://www.fau.info/fdm-policy zu finden.

H

Auf heiße Daten wird mit einer hohen Frequenz zugegriffen, die Daten müssen praktisch sofort für eine Bearbeitung zur Verfügung stehen.
Das bedeutet konkret, dass die Daten häufig verarbeitet werden und dabei auch Änderungen auftreten. Heiße Daten sind idealerweise nah an der Maschine, die sie verarbeitet, damit z.B. Verzögerungen über ein Netzwerk nicht auftreten.
Heiße Forschungsdaten werden nicht veröffentlicht und nur selten mit anderen Personen geteilt. Sind die Daten nicht einfach wiederzubeschaffen, muss die Backup-Strategie auch die heißen Daten umfassen.

Hot data are accessed frequently and data must be available almost immediately for processing.
In specific terms, this means that the data is processed frequently and changes occur as a result. Hot data are ideally located close to the machine that processes them, so that delays do not occur over a network, for example.
Hot research data are not published and are rarely shared with other people. If the data are not easy to recover, the backup strategy must also include hot data.

K

Kalte Daten sind abgeschlossene Datensätze, d.h. sie ändern sich nicht mehr. Üblicherweise sind das Daten, die zusammen mit den beschreibenden Metadaten in Repositorien abgelegt werden (z.B. für eine Veröffentlichung oder Archivierung). Nur kalte Forschungsdaten können eine DOI erhalten.

L

LabFolder is an electronic lab notebook, inventory management tool and the name of the company that offers the software which was founded in 2013.

As proprietary software, usage incurs monthly costs per user. A free version is also available, but with limited features and limited number of users per group.

Data can only be exported as XHTML and PDF. Labfolder licences can be purchased via the University’s clinic, for further details please visit the Labfolder website at the Medical Faculty.

LabFolder ist ein elektronisches Laborbuch, ein Inventarmanagementwerkzeug und der Name des 2013 gegründeten Unternehmens, welches die gleichnamige Software anbietet.

Als proprietäre Software ist die Nutzung mit monatlichen Kosten pro User verbunden. Eine kostenlose Version ist ebenfalls erhältlich, allerdings mit limitiertem Funktionsumfang und beschränkter Anzahl an Nutzern pro Gruppe.

Eingetragene Daten sind nur als XHTML und PDF exportierbar. Labfolder ist über das Universitätsklinikum beziehbar, weitere Informationen erhalten Sie auf der Informationsseite der Medizinischen Fakultät.

Der Standard für die Aufbewahrungsfrist von Forschungsdaten ist mindestens zehn Jahre [1]. Das stellt sowohl organisatorische, als auch technische Herausforderungen.
Aus der organisatorischen Sicht muss geregelt sein, wer die Verantwortung und Kontrolle über Daten hat, wenn der/die ursprüngliche Besitzer*in die FAU verlässt.
Aus technischer Sicht bedarf es spezialisierter Archivierungssysteme und Plänen, die Datenverlust verhindern. Zudem ist das Dateiformat relevant, da manche Formate sich eventuell nicht mehr öffnen lassen.

[1]: https://forschungsdaten.info/praxis-kompakt/glossar/#c269839

Linked Open Data (LOD) is an approach to representing and publishing research data. It consists of two aspects:

  • “Linked”: related, machine-readable data on the Internet
  • “Open”: the data is freely accessible and distributable

This results in a network of data in which individual elements refer to others. Individual data can be retrieved via a URI.

A visual representation can be found here.

“Linked Open Data” (LOD) ist ein Ansatz zur Repräsentation und Publikation von Forschungsdaten. Er setzt sich aus zwei Aspekten zusammen:

  • “Linked”: im Zusammenhang stehende, maschinen-lesbare Daten im Internet
  • “Open”: die Daten sind frei zugänglich und verteilbar

Es ergibt sich also ein Netz aus Daten, in welchem einzelne Elemente auf Andere verweisen. Einzelne Daten sind über eine URIs abrufbar.

Eine visuelle Repräsentationen findet sich hier.

Die Urheberin oder der Urheber bestimmen, was mit ihren Daten, wenn sie dem Urheberrecht unterliegen, passieren darf. Eine Lizenz beschreibt welches Nutzungsrecht Dritte haben.

Ein Beispiel für eine Lizenz, um die eigene Arbeit frei zugänglich zu machen, ist die Creative Commons Attribution 4.0 International.

Mehr Details finden sich hier.

The standard retention period for research data is at least ten years [1]. This poses both organizational and technical challenges.
From an organizational point of view, it must be regulated who has responsibility and control over data when the original owner leaves FAU.
From a technical point of view, there is a need for specialized archiving systems and plans that prevent data loss. In addition, the file format is relevant, as it may no longer be supported at a later time.

[1]: https://forschungsdaten.info/praxis-kompakt/glossar/#c269839

M

Metadata describe other data using information that is useful for interpreting and (automatically) processing the actual data, for example digital research data; they represent “data about data”.

Metadata can be elementary descriptions such as length, coding and type (number, string, date and time, currency amount, etc.). Much more important are metadata which help to categorize and characterize the properties of digital objects and provide further information that says something about their meaning. For measured values in research data, these are, for example: measuring device used or sensor used, accuracy or location of the measurement. Even the name of a data object says something about its meaning, but usually this is not enough. Often these terms are too short and too general (such as “measurement”). It’s only usually clear what this means in the context the data are used. In this way, research projects develop terms that can be misunderstood outside the project.

Ontologies are intended to relate such specific terms to a general system of terms.

There are different categories of metadata:

  • Technical metadata give information about the data volume and data format and are essential for saving data in the long term.
  • Descriptive metadata (also known as content metadata) give information about the information contained in the digital objects and therefore are decisive for the findability, referencing and reusability of data. Descriptions of the measuring method used, an abstract or keywords all fall into this category. Structural metadata describe relationships between individual elements of a data set or the internal structure of the data themselves.
  • Administrative metadata include information required for assuring the quality of data (for example checksum), and information on access rights and licenses or the provenance of the data.

Metadaten beschreiben andere Daten mithilfe von Informationen, die zur Interpretation und (automatischen) Verarbeitung der eigentlichen Daten, etwa der digitalen Forschungsdaten, notwendig oder sinnvoll sind; also ‘Daten über Daten’.

Dies können elementare Beschreibungen sein wie Länge, Codierung und Typ (Zahl, Zeichenkette, Datum und Uhrzeit, Währungsbetrag usw.). Viel wichtiger sind Metadaten, die dazu beitragen, die Eigenschaften digitaler Objekte zu kategorisieren und zu charakterisieren sowie weiterführende Informationen zur Verfügung zu stellen und somit etwas über deren Bedeutung sagen. Für Messwerte, die in Forschungsdaten vorkommen, sind das beispielsweise: verwendetes Messgerät bzw. verwendeter Sensor, Genauigkeit oder Ort der Messung. Schon die Bezeichnung (der Name) eines Datenobjekts sagt etwas über die Bedeutung, meist genügt das aber noch nicht. Oft sind diese Bezeichnungen zu kurz und zu allgemein (eben nur “Messung” oder so etwas). Was damit gemeint ist, erschließt sich oft auch erst aus dem Kontext der Verwendung. So entwickeln Forschungsprojekte ihre gebräuchlichen Bezeichnungen, die aber außerhalb des Projekts missverstanden werden können.

Ontologien sind dafür gedacht, solche spezifischen Bezeichnungen in Bezug zu setzen zu einer allgemeinen Begriffssystematik.

Man unterscheidet verschiedene Kategorien von Metadaten:

  • Technische Metadaten beinhalten beispielsweise Angaben zu Datenvolumen und Datenformat und sind für eine nachhaltige Datenspeicherung von zentraler Bedeutung.
  • Deskriptive Metadaten (auch beschreibende oder Content-­‐Metadaten genannt) geben Auskunft über die in digitalen Objekten enthaltenen Informationen und entscheiden damit über deren Auffindbarkeit, Referenzierung und Nachnutzbarkeit. Hierzu gehören auch Erläuterungen der zugrundeliegenden Messmethode, ein Abstract oder Schlagwörter. Strukturelle Metadaten beschreiben Beziehungen zwischen einzelnen Elementen eines Datensatzes oder die interne Struktur der Daten selbst.
  • Administrative Metadaten beinhalten Informationen für die Qualitätssicherung der Daten (etwa Prüfsummen), Informationen zu Zugriffsrechten und Lizenzen oder Provenienz-­‐Informationen.

N

Ein Nutzungsrecht beschreibt auf welche Art ein Objekt genutzt werden darf. Beispiele für “Nutzungen” von digitalen Objekten sind das Kopieren, Speichern oder Veröffentlichen. Die Nutzung kann an Bedingungen geknüpft werden, wie z.B. eine monetäre Gebühr.

Ein Nutzungsrecht zwischen Rechteinhaber und Vertragspartner kann durch eine Lizenz geregelt werden.

O

Eine Ontologie ist eine Begriffssystematik, die versucht, möglichst alle Begriffe eines Fachgebiets miteinander in Beziehung zu setzen und damit auch zu definieren. Beziehungen sind dabei: “Oberbegriff – Unterbegriff”, “Ganzes – Bestandteil” oder auch “meint das gleiche wie” (Synonym). Die Begriffe werden dabei nicht einfach nur durch Worte benannt, sondern genauer und eindeutiger durch URIs.

An ontology is a system of terms that attempts to relate and thus define all concepts of a subject area as far as possible. Relationships include: “superordinate term – subordinate term”, “whole – component” or also “means the same as” (synonym). The terms are not simply named by words, but more precisely and unambiguously by URIs.

“Open Access” means that digital scientific content is available free of charge and in an accessible form. The copyright remains in place.

Further information is available at forschungsdaten.info

“Open Access” bedeutet, dass digitale wissenschaftliche Inhalte kostenlos und barrierefrei verfügbar sind. Das Urheberrecht bleibt dabei bestehen.

Mehr Details unter forschungsdaten.info

“Open Source” bedeutet dass der Quellcode öffentlich zugänglich ist und unter einer Lizenz steht, die Veränderung und Vervielfältigung erlaubt.
Zudem gibt es keine Limitationen was die Nutzung des Quellcodes als Teil eigener Produkte/Dienstleistungen angeht.

Mehr Details sind bei der Open Source Initiative verfügbar.

“Open source” means that the source code is publicly available and the license permits modification and reproduction.
In addition, there are no restrictions on using the source code in other products or services.

Further details are available from the Open Source Initiative.

openBis is an open source combination of electronic lab notebook (ELN), data management platform and laboratory inventory management system that has been actively developed since 2007. Depending on requirements, all or only selected features can be used. The modular design of openBIS enables flexible adaptation to the requirements of a wide variety of working groups. In addition, it has an interface that allows the use of Jupyter notebooks for data analysis in openBIS. There is also an interface for exporting data to the Zenodo repository.

openBis ist eine Open Source Kombination von elektronischem Laborbuch (ELN), Datenmanagementplattform und Labor-Bestandsmanagementsystem, die seit 2007 aktiv entwickelt wird. Je nach Bedarf können alle oder nur ausgewählte Funktionalitäten genutzt werden. Der modulare Aufbau von openBIS ermöglicht eine flexible Anpassung an die Anforderungen unterschiedlichster Arbeitsgruppen. Zudem besitzt es eine Schnittstelle, die eine Benutzung von Jupyter Notebooks zur Datenanalyse in openBIS ermöglicht. Des Weiteren existiert eine Schnittstelle für den Datenexport in das Repositorium Zenodo.

P

Persistent identifiers (PI) are long-lasting references to digital resources. A PI is a unique name for digital objects of any kind (essays, data, software, etc., especially data records in research data management). This name, usually a longer sequence of digits and / or alphanumeric characters, is linked to the web URL of the digital resource. If the URL for the resource changes, only the address to which the PI refers has to be changed, whilst the PI itself can stay the same. This guarantees, for example, that a resource cited using the PI can still be found even if its physical storage place has changed. Examples of persistent identifiers are digital object identifiers (DOI), uniform resource names (URN) and handles.

Using a specific example, this video clearly explains what persistent identifiers are.

 

Ein Persistenter Identifikator (PI) erlaubt eine dauerhafte Adressierung von digitalen Ressourcen. Ein PI stellt einen eindeutigen Namen für digitale Objekte jeglicher Art (Aufsätze, Daten, Software, etc. im Rahnen des Forschungsdatenmanagements vor allem Datensätze) dar. Dieser Name, meist eine längere Abfolge von Ziffern und / oder alphanumerischen Zeichen, wird mit der Web-­URL der digitalen Ressource verknüpft. Wenn sich die URL zu der Ressource ändert, muss nur die Adresse geändert werden, auf die der PI verweist, während der PI selbst gleich bleiben kann. Dies garantiert beispielsweise, dass eine einmal über einen PI zitierte Ressource auch dann noch gefunden werden kann, wenn sich ihr physikalischer Speicherort verändert hat. Beispiele für persistente Identifikatoren sind Digital Object Identifier (DOI), Uniform Resource Name (URN) und Handle.

An einem konkreten Beispiel erklärt das verlinkte Video anschaulich, was Persistente Identifikatoren sind.

 

Personal data is any information relating to an identified or identifiable natural person. It should be noted that this also applies if a person can be identified indirectly. Since May 25, 2018, the Federal Data Protection Act (Germany) and the GDPR (EU) apply. Both laws deal with data protection and privacy.

Further information on this topic can be found on the FAU Data Protection page and here.

Personenbezogene Daten sind alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person beziehen. Zu beachten ist, dass dies auch gilt, wenn eine Identifikation indirekt möglich ist. Seit dem 25.05.2018 gelten das BDSG-neu (DE) und die DSGVO (EU). Beide Gesetzestexte behandeln Datenschutz und Privatsphäre.

Weitere Informationen zu diesem Thema sind u.a. auf der FAU Seite des Datenschutzes und hier zu finden.

R

Ein Repositorium ist ein verwalteter Speicherort für digitale Objekte. Die Sichtbarkeit der digitalen Objekte kann eingeschränkt werden.

Beispiele sind:

  • Das institutionelle Repositorium der Universitätsbibliothek, welches Forscher*innen der FAU die kostenfreie Veröffentlichung von Dissertationen und Forschungsarbeiten ermöglicht.
  • Das Versionsverwaltungssystem GitLab, welches vom RRZE zur Verfügung gestellt wird.
  • CERN bietet mit Zenodo ein weltweit sichtbares Repositorium für Datensätze < 50GB an.

Details unter forschungsdaten.info

A repository is a managed location for storing digital objects. The visibility of the digital objects can be restricted.

For example:

  • the institutional repository of University Library, which enables FAU researchers to publish their dissertations and research papers free of charge.
  • The version management system GitLab, which is provided by the RRZE.
  • CERN offers a globally visible repository in Zenodo, for data sets < 50GB.

Details at forschungsdaten.info

According to the definition on the website Forschungsdaten.info, research data are data generated during scientific activity (e.g. through measurements, surveys, source work).

This definition applies to both newly generated and processed data, regardless of whether these data are incorporated into a publication and whether they are available in analog or digital form. Research data form the basis of scientific work.

This results in the need for a discipline and project-specific understanding of research data with different requirements for the preparation, processing and management of the data: this is known as research data management.

Research data and their metadata are explained simply in this video using the example of squirrel research.

FAU believes that storing and managing research data is crucial for successful, sustainable research and scientific integrity. It is essential that research data are handled responsibly and methodically. If the University, its members and the general public are to benefit, this must not only be encouraged but also made a requirement, and it is important to raise awareness of research data and FAIR principles in the long term. See FAU Research Data Policy.

According to the definition on the website Forschungsdaten.info, research data management is the process of transforming, selecting and storing research data with the aim of keeping them accessible, usable and verifiable in the long term and independent of the data generator. To this end, structured measures can be taken at all points of the data life cycle to maintain the scientific validity of research data, to preserve accessibility by third parties for evaluation and analysis and to secure the chain of custody.

The practical application and benefits for the researchers are illustrated in the following  video

“Forschungsdaten leben länger” (German)

FAU considers safeguarding and managing research data (RD) as essential for successful and sustainable research and scientific integrity. It is essential that research data are handled responsibly and methodically. If the University, its members and the general public are to benefit, this must not only be encouraged but also made a requirement, and it is important to raise awareness of research data and FAIR principles in the long term. See FAU Research Data Policy.

 

A research data policy contains basic guidelines for handling data in a larger organization, e.g. a university. In addition to general recommendations for action, a research data policy usually regulates the responsibilities and support structures on site. In some cases, the guidelines also include details on licensing and repositories for research data.

The current version of the FAU research data policy can be found at https://www.fau.info/fdm-policy.

U

Literarische, künstlerische und wissenschaftliche Werke sind in Deutschland vom Urheberrechtsgesetz geschützt.
Das bedeutet konkret, dass ohne eine entsprechende Lizenz eine Nachnutzung nur restriktiv möglich ist.

Wir empfehlen eine möglichst offene Lizensierung, denn dadurch steigt die Nachnutzung der Daten, was ein Reputationsgewinn für die Forschenden ist. Bei Fragen berät das CDI Sie gerne.

Mehr Details in diesem Artikel.

A right of use describes the manner in which an object may be used. Examples of “uses” of digital objects are copying, saving or publishing. The use can be subject to conditions, such as a monetary fee.

A right of use between the rights holder and the contractual partner can be established through a license.

W

Warm data are rarely changed. It is also acceptable if access to warm data takes longer, for instance when copying files (“copy’n’tea”). Warm data are usually already suitable for sharing in the research group or with external researchers.

Warme Daten werden nur noch selten geändert. Zudem ist es in Ordnung, wenn ein Zugriff (wie z.B. ein ein Kopiervorgang) Zeit in Anspruch nimmt (“copy’n’tea”). Warme Daten sind üblicherweise bereits dazu geeignet, in der Arbeitsgruppe oder mit extern Forschenden geteilt zu werden.

WissKI
WissKI is a virtual research environment that enables scientific, location-independent and collaborative work with linked data. On the basis of an ontology, the research data are semantically enriched and stored in the form of triples in a coherent data network (graph database).

WissKI ist eine virtuelle Forschungsumgebung, die wissenschaftliches, ortsunabhängiges und kollaboratives Arbeiten mit linked data ermöglicht. Auf Basis einer Ontologie werden die Forschungsdaten semantisch angereichert und in Form von Triples in einem zusammenhängenden Datennetzwerk gespeichert (Graphdatenbank).

Analog materials
Analog research materials include photographs, handwritten notes, books, audio cassettes, paintings or 3D objects, such as fossils or architectural models. In order to make them usable in a repository, the materials must first be digitized or at least the associated metadata must be provided in a digital form. Analog materials differ from “born digital” data, which exist in digital form from the beginning, for example digital photos, CAD drawings, measurement data or blogs.
Analoge Materialien
Analoge Forschungsmaterialien sind zum Beispiel Fotos, handschriftliche Notizen, Bücher, Audio-Kassetten, Gemälde oder 3D-Objekte, wie etwa Fossilien oder Architekturmodelle. Um sie in einem Repositorium nutzbar zu machen, müssen die Materialien zunächst digitalisiert (Digitalisat) oder zumindest die zugehörigen Metadaten digital zur Verfügung gestellt werden. Analoge Materialien unterscheiden sich von “born digital”-Daten, die von Beginn an in digitaler Form existieren, zum Beispiel digitale Fotos, CAD-Zeichnungen, Messdaten oder Blogs.
Archivierung
Unter einem Archiv versteht man allgemein eine Sammlung an Dokumenten. Diese sollen im Archiv zeitlich unbegrenzt aufbewahrt werden. Bezogen auf den Forschungsdatenmanagementkontext ist ein Archiv eine Sammlung von Daten.
Archiving
An archive is generally understood to be a collection of documents with the intention of preserving documents indefinitely. In the research data management context, an archive is a collection of data.
Backup
Say no to data loss and back up your data
Backup
Datenverlust –  Nein Danke  
Cold research data
Cold data are data records that have been finalized and will not be modified. These are usually data that are stored in repositories together with the descriptive metadata (e.g. for publication or archiving). Only cold research data can get a DOI.
Copyright
Literary, artistic and scientific works are protected by German copyright law. In specific terms, this means that without a corresponding license, reuse is only possible in a restrictive manner. We recommend licensing that is as open as possible, because this increases data reusability and boosts the reputation of researchers. If you have any questions, the CDI will be happy to advise you. Read this article for further details.
CRIS
CRIS stands for Current Research Information System, the research information system at FAU. It stores information about research achievements, for example information about a publication, a research project, research data or inventions. Only metadata is stored, for example, the full text of a publication is not stored directly in CRIS, but it does indicate where this full text can be found (for example, by specifying the DOI). In research information systems, the various data areas are linked: publications are not only assigned to persons, but also projects, projects in turn are assigned to specific research areas. For this purpose, internal data sources of the university are also used, which offers added value compared to classic list formats and data providers such as Scopus or Web of Science.
CRIS
CRIS steht für “Current Research Information System”, also für ein Forschungsinformationssystem. In diesem werden Informationen über die Existenz von Forschungsleistungen gespeichert, beispielsweise Angaben zu einer Publikation, einem Forschungsprojekt, Forschungsdaten oder Erfindungen. Dabei werden nur Metadaten hinterlegt, so wird z.B. der Volltext zu einer Publikation nicht direkt im CRIS aufbewahrt, sehr wohl aber die Angabe, wo dieser Volltext zu finden ist (bspw. über Angabe der DOI). In Forschungsinformationssystemen werden die verschiedenen Datenbereiche verknüpft: Publikationen werden nicht nur Personen, sondern auch Projekten zugeordnet, Projekte wiederum bestimmten Forschungsbereichen. Hierzu werden auch interne Datenquellen der Universität genutzt, was einen Mehrwert gegenüber klassischen Listenformaten und Datenanbietern wie Scopus oder Web of Science bietet.
Data custodian
Ein Data Custodian ist verantwortlich für die sichere Verwahrung und Zugangsverwaltung für Forschungsdaten der jeweiligen Organisationseinheit (OE) nach den jeweiligen Bestimmungen. Er oder sie begleitet und berät schon während laufender Projekte, um frühzeitig die spätere Veröffentlichung der Daten vorzubereiten. Es soll vermieden werden, dass erst am Schluss ein großer punktueller Aufwand entsteht, bevor die Übergabe der Daten an den Data Steward erfolgen kann. Wenn man gleich die richtigen Annotationen (Metadaten) hinzufügt, muss man sie später nicht mühsam rekonstruieren.
Data literacy
Data literacy is a key skill in the 21st century and, in short, describes the ability of an individual to handle data. What knowledge, skills and attitudes are needed in society, the world of work and science today? Aspects of data literacy are described in detail in this document. Data literacy is fundamental to the entire research process in collecting, organizing, using, publishing and re-using data. The following video illustrates the importance of data literacy as a key skill.
Data Literacy
“Data Literacy” (de: “Datenkompetenz”) gilt als Schlüsselkompetenz des 21. Jahrhunderts und beschreibt kurz gesagt die Fähigkeit eines Individuums mit Daten umzugehen. Welches Wissen, welche Fähigkeiten und welche Haltung benötigt man in Gesellschaft, Arbeitswelt und Wissenschaft? Die einzelnen Bestandteile dieses Prozesses sind tabellarisch hier aufgelistet. Die Relevanz dieser grundlegenden Datenkompetenz gilt für den gesamten Forschungsprozess von der Erhebung, der Organisation und Nutzung, der Veröffentlichung und der Nachnutzung von Daten. Folgendes Video veranschaulicht die Bedeutung der Schlüsselkompetenz Data Literacy.
Data management plan
According to forschungsdaten.info, a data management plan (DMP) structures the handling of research data, or its “collection, saving, documentation, maintenance, processing, transfer, publication and storage, as well as the necessary resources, legal framework and responsible persons.” A data management plan (DMP) documents the entire data lifecycle. Many third-party funding organizations (DFG, FWF, SNSF, Horizon Europe, Volkswagen Foundation) expect information on the handling of research data as part of a funding application for the allocation of funds from certain funding lines. The DMP describes how to handle research data from the planning stage, to collection, to long-term archiving or, if applicable, planned deletion. At the very least, the data management plan answers the following questions: What is collected? Which bodies must be consulted before collecting data? In what form and where will research data be stored in the various project phases? Who can access the data and when will it be available? Who is responsible for the individual steps? Which legal requirements must be observed? The DMP is a useful and necessary part of the project application. What exactly does this mean for research? Why this approach is meaningful and sustainable is explained in this video.
Data organization
For many scientists, dealing with research data is the basis of their daily work. It therefore saves time and effort if this data is efficiently structured, documented and backed up from the outset. Most of the data is initially stored in files. Files have different types or file formats that are sometimes identified by the file name extension, for example in the Windows operating system. Furthermore, files are stored in directories (folders). Naming files and directories systematically is very important. For example, the Stanford File Naming Handout. Alternatively, data can also be stored in databases. Here, the effort is greater, because a database management system such as MySQL must first be set up. A database schema needs to be defined which provides a structure for storing data. Here, too, naming is of great importance. Databases support managed shared access to data much better than data stored in files. There are different types of databases: relational, hierarchical, graph-based, RDF triple stores and a few more. The following animated video clearly summarizes the topic of data organization.
Data publication
In order to ensure transparent research and traceability of results, research data should be published wherever possible. In order to comply with FAIR principles, the corresponding metadata must be recorded. A repository is required for the publication of the research data.
Data steward
Ein Data Steward ist verantwortlich dafür, die Qualität und Zweckgerechtigkeit (Fit for Purpose) von Forschungsdaten inklusive ihrer Metadaten aus fachlichen Aspekten sicherzustellen. Er oder sie wird tätig, wenn die Forschungsdaten vollständig und abgeschlossen sind. Es ist darauf zu achten, dass die Metadaten vollständig und dem aktuellen Standard entsprechend erstellt wurden. Eine persistente Id sollte vorhanden sein. Weiterhin ist ein geeignetes Repository für die langfristige Bereitstellung auszuwählen. Beratung sollte im Vordergrund stehen; Kontrolle ist mit Fingerspitzengefühl und möglichst konstruktiv vorzunehmen.
Dateiformat
Das Dateiformat definiert die Struktur der in der Datei enthaltenen Daten. Dadurch wird Anwendungen erlaubt den Inhalt einer Datei zu interpretieren. Viele Dateinamen enthalten eine, durch einen Punkt getrennte, Endung. Diese deklariert das Dateiformat. Unter dem folgenden Link finden Sie Details und eine Auflistung welche Formate für eine langfristige Speicherung geeignet sind.
Datenmanagementplan
Laut forschungsdaten.info strukturiert ein Datenmanagementplan (DMP) den Umgang mit Forschungsdaten, bzw. deren “Erhebung, Speicherung, Dokumentation, Pflege, Verarbeitung, Weitergabe, Veröffentlichung und Aufbewahrung, ebenso wie die erforderlichen Ressourcen, rechtlichen Randbedingungen und verantwortlichen Personen.” Ein DMP dokumentiert somit den gesamten, für die Daten vorgesehenen, Lebenszyklus. Viele Drittmittelgeber (DFG, FWF, SNF, Horizon Europe, Volkswagenstiftung) erwarten für die Vergabe von Mitteln aus bestimmten Förderlinien Angaben zum Umgang mit Forschungsdaten als Teil eines Förderantrags. Der DMP beschreibt, wie mit den Forschungsdaten von der Planung der Erhebung bis zur langfristigen Archivierung oder gegebenenfalls planmäßigen Löschung umgegangen wird. Er beantwortet dabei mindestens die Fragen: Was wird erhoben? Welche Stellen müssen vor der Erhebung hinzugezogen werden? In welcher Form und wo werden die Forschungsdaten in den unterschiedlichen Projektphasen gesichert? Wer hat ab welchem Zeitpunkt darauf Zugriff? Wer ist für die einzelnen Schritte zuständig / verantwortlich? Welche rechtlichen Vorgaben sind zu beachten? Bereits im Rahmen der Projektbeantragung ist ein DMP sinnvoll und erforderlich. Was genau bedeutet das für die Forschung? Warum dieses Vorgehen sinnvoll und nachhaltig ist, erklärt dieses Video.
Datenorganisation
Der Umgang mit Forschungsdaten ist für viele Wissenschaftlerinnen und Wissenschaftler die Grundlage ihrer täglichen Arbeit. Es spart daher Zeit und Aufwand, wenn diese Daten von vorneherein effizient strukturiert, dokumentiert und gesichert werden. Die meisten Daten werden zunächst in Dateien abgelegt. Dateien haben unterschiedliche Typen oder Dateiformate, die manchmal als Suffix des Dateinamens kenntlich gemacht werden, z.B. im Betriebssystem Windows. Weiterhin werden Dateien in Verzeichnissen (Ordnern) abgelegt. Ganz wichtig ist eine systematische Benennung von Dateien wie auch Verzeichnissen. Hinweise dazu gibt z.B. das Stanford File Naming Handout. Alternativ können Daten auch in Datenbanken abgelegt werden. Hier ist der Aufwand höher, weil erst ein Datenbank-Management-System wie z.B. MySQL eingerichtet werden muss. Zentral ist die Definition eines Datenbank-Schemas, mit dem die Strukturen für die zu speichernden Daten angelegt werden. Auch hier ist die Namensgebung von großer Bedeutung. Datenbanken unterstützen den geregelten gemeinsamen Zugriff auf Daten sehr viel besser als Dateien. Es gibt verschiedene Arten von Datenbanken: relationale, hierarchische, Graph-basierte, RDF Triple Stores und noch einige weitere mehr. Folgendes Animationsvideo fasst die Thematik der Datenorganisation anschaulich zusammen.
Datenpublikation
Für transparente Forschung und Nachvollziehbarkeit der Ergebnisse sollten Forschungsdaten – soweit möglich – veröffentlicht werden. Um die FAIR-Prinzipien zu erfüllen, müssen die entsprechenden Metadaten erfasst werden. Für die Publikation der Forschungsdaten wird ein Repositorium benötigt.
eLabFTW
eLabFTW ist eine Open Source Software für den Gebrauch als elektronisches Laborbuch (ELN), Datenmanagementplattform und Labor-Bestandsmanagementsystem. Die Daten können in verschiedene Formate exportiert werden, die mit JSON und CSV Dateien einen Import in ein anderes System erleichtern.
eLabFTW
eLabFTW is open source software used as an electronic lab notebook (ELN), data management platform and laboratory inventory management system. The data can be exported to various formats that make it easier to import to another system with JSON and CSV files.
Electronic Lab Notebooks (ELN)
Electronic Lab Notebooks (ELNs) are software applications that are used to document research data and replace paper laboratory books. ELNs offer several advantages to the paper equivalent: Data findability through search and filter functions Accessibility: Network access regardless of location and time Backup copies of lab notebooks (previous versions can be restored) Reusability of templates, protocols and processes Time savings through templates, standardization and existing digital data Automatic recording of measurement results The decision to use ELN software should be made carefully, as it is generally used over a long period of time. Important points that should be taken into account in the decision can be found here.
Elektronisches Laborbuch (ELN)
Elektronische Laborbücher (engl. Electronic Laboratory Notebooks, kurz: ELNs) sind Softwareanwendungen, die zur Dokumentation von Forschungsdaten eingesetzt werden und somit die analogen Papierlaborbücher ersetzen. ELNs bieten mehrere Vorteile gegenüber ihrer analogen Variante: Daten-Auffindbarkeit durch Such- und Filterfunktionen Erreichbarkeit: Netzzugriff unabhängig von Ort & Zeit Sicherheitsbackup der Laborbücher (und damit eine Wiederherstellung einer vorherigen Version) Wiederverwendbarkeit von Vorlagen, Protokollen & Prozessen Zeitersparnis durch Templates, Standardisierung & bereits vorliegende digitale Daten automatische Erfassung von Messergebnissen Die Entscheidung für eine ELN-Software sollte gut bedacht sein, da damit i.A. über einen langen Zeitraum hinweg gearbeitet wird. Wichtige Punkte, die bei der Entscheidung berücksichtigt werden sollten, finden sich z.B. hier.
European Science Cloud
The European Open Science Cloud (EOSC) is a multi-disciplinary information service where you can publish, search for data and find tools and services. This service is one of the flagship projects of the EU Framework Programme for Research and Innovation. The portal can be reached here.
European Science Cloud
Die “European Open Science Cloud” (EOSC) ist ein multi-disziplinärer Informationsdienst, in dem veröffentlicht, nach Daten gesucht und Werkzeuge und Dienstleistungen gefunden werden können. Dieser Dienst ist einer der Leuchtturmprojekte der Europäischen Forschungsförderung. Das Portal ist hier erreichbar.
FAIR principles
FAIR principles are requirements that ensure sustainable and re-usable research data. The acronym FAIR stands for Findable, Accessible, Interoperable and Re-Usable. A number of research funding providers (including the EU, the DFG and the SNF) believe the FAIR principles are an important requirement for sustainable research and therefore expect them to be complied with. Using persistent identifiers and detailed metadata is considered particularly important for the findability of data. Using standards for interfaces, metadata and data supports accessibility and interoperability of data. Extensive content-related metadata and documentation and clear rights of reuse make it easier to reuse data. Data do not have to be classed as open in order to meet FAIR principles, but their metadata ought to be freely accessible. By complying with these guidelines, “machine-actionability” is to be ensured. This means that a computer-aided system can find, access and reuse the digital objects with minimal human input. Further information
FAIR Prinzipien
Die FAIR‐Prinzipien sind Anforderungen, die nachhaltige und wiederverwendbare Forschungsdaten erfüllen sollten. Das Akronym FAIR steht für Findable, Accessable, Interoperabel und Re‐Usable. Die FAIR‐Prinzipien werden von vielen Forschungsförderern (etwa EU, DFG oder SNF) als wichtige Voraussetzung für nachhaltige Forschung gesehen und auch entsprechend eingefordert. Als besonders wichtig für die Auffindbarkeit von Daten wird die Verwendung von persistenten Identifikatoren und detailreichen Metadaten gesehen. Der Einsatz von Standards – sowohl bei Schnittstellen als auch für Metadaten und Daten selbst – unterstützt neben der Zugänglichkeit auch die Interoperabilität der Daten. Die Wiederverwendbarkeit wird durch umfangreiche inhaltliche Metadaten und Dokumentationen sowie klare Nachnutzungsrechte erleichtert. FAIRe Daten müssen nicht notwendigerweise offen („open data“) sein. Lediglich die zugehörigen Metadaten sollten frei zugänglich sein. Durch die Einhaltung dieser Richtlinien soll die “machine-actionability” gewährleistet / sichergestellt werden. “machine-actionabilty” bedeutet, dass ein computergestütztes System mit minimalem menschlichen Input die digitalen Objekte auffinden, darauf zugreifen und diese wiederverwenden kann. Mehr Details hier
FAUWissKICloud
FAUWissKICloud The purpose of FAUWissKICloud is to host and maintain the FAU WissKI instances. The CDI manages the software and RRZE is responsible for maintaining the hardware. WissKIs are maintained and updated using the WissKI Distillery.
FAUWissKICloud
Die FAUWissKICloud hat eigens den Zweck die WissKI-Systeme der FAU zu hosten und zu warten. Unter der Obhut des RRZE auf Hardware-Ebene managt das CDI die Software-Ebene des Servers. Mithilfe der WissKI-Distillery werden die WissKIs systemübergreifend gewartet und mit Updates versorgt.
File format
The file format defines the structure of the data contained in the file. This allows applications to interpret the contents of a file. Many filenames contain an extension separated from the filename by a period. This declares the file format. Under the following link you will find details and a list of which file formats are suitable for long-term storage.
Forschungsdaten
Gemäß Definition von Forschungsdaten.info sind Forschungsdaten Daten, die während wissenschaftlicher Tätigkeit (z. B. durch Messungen, Befragungen, Quellenarbeit) entstehen. Diese Definition gilt sowohl für neu erzeugte als auch für aufbereitete Daten unabhängig davon, ob diese Daten in eine Publikation einfließen oder nicht und ob sie in analoger oder digitaler Form vorliegen. Forschungsdaten bilden die Grundlage wissenschaftlicher Arbeit. Daraus ergibt sich die Notwendigkeit eines disziplin- und projektspezifischen Verständnisses von Forschungsdaten mit unterschiedlichen Anforderungen an die Aufbereitung, Verarbeitung und Verwaltung der Daten: dem sogenannten Forschungsdatenmanagement. Forschungsdaten und ihre Metadaten am Beispiel der Eichhörnchenforschung gut und einfach erklärt in diesem Video. Die FAU betrachtet die Sicherung und das Management von Forschungsdaten (FD) als essentiell für erfolgreiche und nachhaltige Forschung und wissenschaftliche Integrität. Der geplante und verantwortungsvolle Umgang mit Forschungsdaten ist unerlässlich und muss deshalb gefördert und gefordert werden, damit die Universität, ihre Angehörigen und die Öffentlichkeit davon profitieren können. Hierfür ist es entscheidend, das Bewusstsein für Forschungsdaten und für die FAIR-­Prinzipien langfristig zu stärken. Siehe FAU Forschungsdaten Policy.
Forschungsdatenmanagement
Gemäß Definition von Forschungsdaten.info versteht man unter Forschungsdatenmanagement den Prozess der Transformation, Selektion und Speicherung von Forschungsdaten mit dem Ziel, diese langfristig und unabhängig vom Datenerzeuger zugänglich, nachnutzbar und nachprüfbar zu halten. Es können dazu an allen Punkten des Datenlebenszyklus strukturierte Maßnahmen ergriffen werden, um die wissenschaftliche Aussagekraft von Forschungsdaten zu erhalten, deren Zugänglichkeit durch Dritte für Auswertung und Analyse zu bewahren und die Nachweiskette zu sichern. Die praktische Anwendung und den Nutzen für die Forschenden veranschaulicht das folgende  Video “Forschungsdaten leben länger” Die FAU betrachtet die Sicherung und das Management von Forschungsdaten (FD) als essentiell für erfolgreiche und nachhaltige Forschung und wissenschaftliche Integrität. Der geplante und verantwortungsvolle Umgang mit Forschungsdaten ist unerlässlich und muss deshalb gefördert und gefordert werden, damit die Universität, ihre Angehörigen und die Öffentlichkeit davon profitieren können. Hierfür ist es entscheidend, das Bewusstsein für Forschungsdaten und für die FAIR-­Prinzipien langfristig zu stärken. Siehe FAU Forschungsdaten Policy.  
Forschungsdatenrichtlinie (research data policy)
Eine Richtlinie zum Umgang mit Forschungsdaten enthält grundsätzliche Leitlinien für eine größere Organisationseinheit, z.B. eine Universität. Neben allgemeinen Handlungsempfehlungen werden darin meist die Verantwortlichkeiten und Unterstützungsstrukturen vor Ort geregelt. Teilweise umfassen die Richtlinien auch Details zu Lizenzierung von und Repositorien für Forschungsdaten. Die Richtlinie der FAU für digitale Forschungsdaten ist in der jeweils aktuellen Version unter der Adresse https://www.fau.info/fdm-policy zu finden.
Heiße Forschungsdaten
Auf heiße Daten wird mit einer hohen Frequenz zugegriffen, die Daten müssen praktisch sofort für eine Bearbeitung zur Verfügung stehen. Das bedeutet konkret, dass die Daten häufig verarbeitet werden und dabei auch Änderungen auftreten. Heiße Daten sind idealerweise nah an der Maschine, die sie verarbeitet, damit z.B. Verzögerungen über ein Netzwerk nicht auftreten. Heiße Forschungsdaten werden nicht veröffentlicht und nur selten mit anderen Personen geteilt. Sind die Daten nicht einfach wiederzubeschaffen, muss die Backup-Strategie auch die heißen Daten umfassen.
Hot research data
Hot data are accessed frequently and data must be available almost immediately for processing. In specific terms, this means that the data is processed frequently and changes occur as a result. Hot data are ideally located close to the machine that processes them, so that delays do not occur over a network, for example. Hot research data are not published and are rarely shared with other people. If the data are not easy to recover, the backup strategy must also include hot data.
Kalte Forschungsdaten
Kalte Daten sind abgeschlossene Datensätze, d.h. sie ändern sich nicht mehr. Üblicherweise sind das Daten, die zusammen mit den beschreibenden Metadaten in Repositorien abgelegt werden (z.B. für eine Veröffentlichung oder Archivierung). Nur kalte Forschungsdaten können eine DOI erhalten.
Labfolder
LabFolder is an electronic lab notebook, inventory management tool and the name of the company that offers the software which was founded in 2013. As proprietary software, usage incurs monthly costs per user. A free version is also available, but with limited features and limited number of users per group. Data can only be exported as XHTML and PDF. Labfolder licences can be purchased via the University’s clinic, for further details please visit the Labfolder website at the Medical Faculty.
Labfolder
LabFolder ist ein elektronisches Laborbuch, ein Inventarmanagementwerkzeug und der Name des 2013 gegründeten Unternehmens, welches die gleichnamige Software anbietet. Als proprietäre Software ist die Nutzung mit monatlichen Kosten pro User verbunden. Eine kostenlose Version ist ebenfalls erhältlich, allerdings mit limitiertem Funktionsumfang und beschränkter Anzahl an Nutzern pro Gruppe. Eingetragene Daten sind nur als XHTML und PDF exportierbar. Labfolder ist über das Universitätsklinikum beziehbar, weitere Informationen erhalten Sie auf der Informationsseite der Medizinischen Fakultät.
Langzeitarchivierung
Der Standard für die Aufbewahrungsfrist von Forschungsdaten ist mindestens zehn Jahre [1]. Das stellt sowohl organisatorische, als auch technische Herausforderungen. Aus der organisatorischen Sicht muss geregelt sein, wer die Verantwortung und Kontrolle über Daten hat, wenn der/die ursprüngliche Besitzer*in die FAU verlässt. Aus technischer Sicht bedarf es spezialisierter Archivierungssysteme und Plänen, die Datenverlust verhindern. Zudem ist das Dateiformat relevant, da manche Formate sich eventuell nicht mehr öffnen lassen. [1]: https://forschungsdaten.info/praxis-kompakt/glossar/#c269839
Linked Open Data
Linked Open Data (LOD) is an approach to representing and publishing research data. It consists of two aspects: “Linked”: related, machine-readable data on the Internet “Open”: the data is freely accessible and distributable This results in a network of data in which individual elements refer to others. Individual data can be retrieved via a URI. A visual representation can be found here.
Linked Open Data
“Linked Open Data” (LOD) ist ein Ansatz zur Repräsentation und Publikation von Forschungsdaten. Er setzt sich aus zwei Aspekten zusammen: “Linked”: im Zusammenhang stehende, maschinen-lesbare Daten im Internet “Open”: die Daten sind frei zugänglich und verteilbar Es ergibt sich also ein Netz aus Daten, in welchem einzelne Elemente auf Andere verweisen. Einzelne Daten sind über eine URIs abrufbar. Eine visuelle Repräsentationen findet sich hier.
Lizensierung
Die Urheberin oder der Urheber bestimmen, was mit ihren Daten, wenn sie dem Urheberrecht unterliegen, passieren darf. Eine Lizenz beschreibt welches Nutzungsrecht Dritte haben. Ein Beispiel für eine Lizenz, um die eigene Arbeit frei zugänglich zu machen, ist die Creative Commons Attribution 4.0 International. Mehr Details finden sich hier.
Long-term archiving
The standard retention period for research data is at least ten years [1]. This poses both organizational and technical challenges. From an organizational point of view, it must be regulated who has responsibility and control over data when the original owner leaves FAU. From a technical point of view, there is a need for specialized archiving systems and plans that prevent data loss. In addition, the file format is relevant, as it may no longer be supported at a later time. [1]: https://forschungsdaten.info/praxis-kompakt/glossar/#c269839
Metadata
Metadata describe other data using information that is useful for interpreting and (automatically) processing the actual data, for example digital research data; they represent “data about data”. Metadata can be elementary descriptions such as length, coding and type (number, string, date and time, currency amount, etc.). Much more important are metadata which help to categorize and characterize the properties of digital objects and provide further information that says something about their meaning. For measured values in research data, these are, for example: measuring device used or sensor used, accuracy or location of the measurement. Even the name of a data object says something about its meaning, but usually this is not enough. Often these terms are too short and too general (such as “measurement”). It’s only usually clear what this means in the context the data are used. In this way, research projects develop terms that can be misunderstood outside the project. Ontologies are intended to relate such specific terms to a general system of terms. There are different categories of metadata: Technical metadata give information about the data volume and data format and are essential for saving data in the long term. Descriptive metadata (also known as content metadata) give information about the information contained in the digital objects and therefore are decisive for the findability, referencing and reusability of data. Descriptions of the measuring method used, an abstract or keywords all fall into this category. Structural metadata describe relationships between individual elements of a data set or the internal structure of the data themselves. Administrative metadata include information required for assuring the quality of data (for example checksum), and information on access rights and licenses or the provenance of the data.
Metadaten
Metadaten beschreiben andere Daten mithilfe von Informationen, die zur Interpretation und (automatischen) Verarbeitung der eigentlichen Daten, etwa der digitalen Forschungsdaten, notwendig oder sinnvoll sind; also ‘Daten über Daten’. Dies können elementare Beschreibungen sein wie Länge, Codierung und Typ (Zahl, Zeichenkette, Datum und Uhrzeit, Währungsbetrag usw.). Viel wichtiger sind Metadaten, die dazu beitragen, die Eigenschaften digitaler Objekte zu kategorisieren und zu charakterisieren sowie weiterführende Informationen zur Verfügung zu stellen und somit etwas über deren Bedeutung sagen. Für Messwerte, die in Forschungsdaten vorkommen, sind das beispielsweise: verwendetes Messgerät bzw. verwendeter Sensor, Genauigkeit oder Ort der Messung. Schon die Bezeichnung (der Name) eines Datenobjekts sagt etwas über die Bedeutung, meist genügt das aber noch nicht. Oft sind diese Bezeichnungen zu kurz und zu allgemein (eben nur “Messung” oder so etwas). Was damit gemeint ist, erschließt sich oft auch erst aus dem Kontext der Verwendung. So entwickeln Forschungsprojekte ihre gebräuchlichen Bezeichnungen, die aber außerhalb des Projekts missverstanden werden können. Ontologien sind dafür gedacht, solche spezifischen Bezeichnungen in Bezug zu setzen zu einer allgemeinen Begriffssystematik. Man unterscheidet verschiedene Kategorien von Metadaten: Technische Metadaten beinhalten beispielsweise Angaben zu Datenvolumen und Datenformat und sind für eine nachhaltige Datenspeicherung von zentraler Bedeutung. Deskriptive Metadaten (auch beschreibende oder Content-­‐Metadaten genannt) geben Auskunft über die in digitalen Objekten enthaltenen Informationen und entscheiden damit über deren Auffindbarkeit, Referenzierung und Nachnutzbarkeit. Hierzu gehören auch Erläuterungen der zugrundeliegenden Messmethode, ein Abstract oder Schlagwörter. Strukturelle Metadaten beschreiben Beziehungen zwischen einzelnen Elementen eines Datensatzes oder die interne Struktur der Daten selbst. Administrative Metadaten beinhalten Informationen für die Qualitätssicherung der Daten (etwa Prüfsummen), Informationen zu Zugriffsrechten und Lizenzen oder Provenienz-­‐Informationen.
Nutzungsrecht
Ein Nutzungsrecht beschreibt auf welche Art ein Objekt genutzt werden darf. Beispiele für “Nutzungen” von digitalen Objekten sind das Kopieren, Speichern oder Veröffentlichen. Die Nutzung kann an Bedingungen geknüpft werden, wie z.B. eine monetäre Gebühr. Ein Nutzungsrecht zwischen Rechteinhaber und Vertragspartner kann durch eine Lizenz geregelt werden.
Ontologie
Eine Ontologie ist eine Begriffssystematik, die versucht, möglichst alle Begriffe eines Fachgebiets miteinander in Beziehung zu setzen und damit auch zu definieren. Beziehungen sind dabei: “Oberbegriff – Unterbegriff”, “Ganzes – Bestandteil” oder auch “meint das gleiche wie” (Synonym). Die Begriffe werden dabei nicht einfach nur durch Worte benannt, sondern genauer und eindeutiger durch URIs.
Ontology
An ontology is a system of terms that attempts to relate and thus define all concepts of a subject area as far as possible. Relationships include: “superordinate term – subordinate term”, “whole – component” or also “means the same as” (synonym). The terms are not simply named by words, but more precisely and unambiguously by URIs.
Open access
“Open Access” means that digital scientific content is available free of charge and in an accessible form. The copyright remains in place. Further information is available at forschungsdaten.info
Open Access
“Open Access” bedeutet, dass digitale wissenschaftliche Inhalte kostenlos und barrierefrei verfügbar sind. Das Urheberrecht bleibt dabei bestehen. Mehr Details unter forschungsdaten.info
Open Source
“Open Source” bedeutet dass der Quellcode öffentlich zugänglich ist und unter einer Lizenz steht, die Veränderung und Vervielfältigung erlaubt. Zudem gibt es keine Limitationen was die Nutzung des Quellcodes als Teil eigener Produkte/Dienstleistungen angeht. Mehr Details sind bei der Open Source Initiative verfügbar.
Open source
“Open source” means that the source code is publicly available and the license permits modification and reproduction. In addition, there are no restrictions on using the source code in other products or services. Further details are available from the Open Source Initiative.
openBis
openBis is an open source combination of electronic lab notebook (ELN), data management platform and laboratory inventory management system that has been actively developed since 2007. Depending on requirements, all or only selected features can be used. The modular design of openBIS enables flexible adaptation to the requirements of a wide variety of working groups. In addition, it has an interface that allows the use of Jupyter notebooks for data analysis in openBIS. There is also an interface for exporting data to the Zenodo repository.
openBis
openBis ist eine Open Source Kombination von elektronischem Laborbuch (ELN), Datenmanagementplattform und Labor-Bestandsmanagementsystem, die seit 2007 aktiv entwickelt wird. Je nach Bedarf können alle oder nur ausgewählte Funktionalitäten genutzt werden. Der modulare Aufbau von openBIS ermöglicht eine flexible Anpassung an die Anforderungen unterschiedlichster Arbeitsgruppen. Zudem besitzt es eine Schnittstelle, die eine Benutzung von Jupyter Notebooks zur Datenanalyse in openBIS ermöglicht. Des Weiteren existiert eine Schnittstelle für den Datenexport in das Repositorium Zenodo.
Persistent Identifiers (PI)
Persistent identifiers (PI) are long-lasting references to digital resources. A PI is a unique name for digital objects of any kind (essays, data, software, etc., especially data records in research data management). This name, usually a longer sequence of digits and / or alphanumeric characters, is linked to the web URL of the digital resource. If the URL for the resource changes, only the address to which the PI refers has to be changed, whilst the PI itself can stay the same. This guarantees, for example, that a resource cited using the PI can still be found even if its physical storage place has changed. Examples of persistent identifiers are digital object identifiers (DOI), uniform resource names (URN) and handles. Using a specific example, this video clearly explains what persistent identifiers are.  
Persistente Identifikatoren (PI)
Ein Persistenter Identifikator (PI) erlaubt eine dauerhafte Adressierung von digitalen Ressourcen. Ein PI stellt einen eindeutigen Namen für digitale Objekte jeglicher Art (Aufsätze, Daten, Software, etc. im Rahnen des Forschungsdatenmanagements vor allem Datensätze) dar. Dieser Name, meist eine längere Abfolge von Ziffern und / oder alphanumerischen Zeichen, wird mit der Web-­URL der digitalen Ressource verknüpft. Wenn sich die URL zu der Ressource ändert, muss nur die Adresse geändert werden, auf die der PI verweist, während der PI selbst gleich bleiben kann. Dies garantiert beispielsweise, dass eine einmal über einen PI zitierte Ressource auch dann noch gefunden werden kann, wenn sich ihr physikalischer Speicherort verändert hat. Beispiele für persistente Identifikatoren sind Digital Object Identifier (DOI), Uniform Resource Name (URN) und Handle. An einem konkreten Beispiel erklärt das verlinkte Video anschaulich, was Persistente Identifikatoren sind.  
Personal data
Personal data is any information relating to an identified or identifiable natural person. It should be noted that this also applies if a person can be identified indirectly. Since May 25, 2018, the Federal Data Protection Act (Germany) and the GDPR (EU) apply. Both laws deal with data protection and privacy. Further information on this topic can be found on the FAU Data Protection page and here.
Personenbezogene Daten
Personenbezogene Daten sind alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person beziehen. Zu beachten ist, dass dies auch gilt, wenn eine Identifikation indirekt möglich ist. Seit dem 25.05.2018 gelten das BDSG-neu (DE) und die DSGVO (EU). Beide Gesetzestexte behandeln Datenschutz und Privatsphäre. Weitere Informationen zu diesem Thema sind u.a. auf der FAU Seite des Datenschutzes und hier zu finden.
Repositorium
Ein Repositorium ist ein verwalteter Speicherort für digitale Objekte. Die Sichtbarkeit der digitalen Objekte kann eingeschränkt werden. Beispiele sind: Das institutionelle Repositorium der Universitätsbibliothek, welches Forscher*innen der FAU die kostenfreie Veröffentlichung von Dissertationen und Forschungsarbeiten ermöglicht. Das Versionsverwaltungssystem GitLab, welches vom RRZE zur Verfügung gestellt wird. CERN bietet mit Zenodo ein weltweit sichtbares Repositorium für Datensätze < 50GB an. Details unter forschungsdaten.info
Repository
A repository is a managed location for storing digital objects. The visibility of the digital objects can be restricted. For example: the institutional repository of University Library, which enables FAU researchers to publish their dissertations and research papers free of charge. The version management system GitLab, which is provided by the RRZE. CERN offers a globally visible repository in Zenodo, for data sets < 50GB. Details at forschungsdaten.info
Research data
According to the definition on the website Forschungsdaten.info, research data are data generated during scientific activity (e.g. through measurements, surveys, source work). This definition applies to both newly generated and processed data, regardless of whether these data are incorporated into a publication and whether they are available in analog or digital form. Research data form the basis of scientific work. This results in the need for a discipline and project-specific understanding of research data with different requirements for the preparation, processing and management of the data: this is known as research data management. Research data and their metadata are explained simply in this video using the example of squirrel research. FAU believes that storing and managing research data is crucial for successful, sustainable research and scientific integrity. It is essential that research data are handled responsibly and methodically. If the University, its members and the general public are to benefit, this must not only be encouraged but also made a requirement, and it is important to raise awareness of research data and FAIR principles in the long term. See FAU Research Data Policy.
Research data management
According to the definition on the website Forschungsdaten.info, research data management is the process of transforming, selecting and storing research data with the aim of keeping them accessible, usable and verifiable in the long term and independent of the data generator. To this end, structured measures can be taken at all points of the data life cycle to maintain the scientific validity of research data, to preserve accessibility by third parties for evaluation and analysis and to secure the chain of custody. The practical application and benefits for the researchers are illustrated in the following  video “Forschungsdaten leben länger” (German) FAU considers safeguarding and managing research data (RD) as essential for successful and sustainable research and scientific integrity. It is essential that research data are handled responsibly and methodically. If the University, its members and the general public are to benefit, this must not only be encouraged but also made a requirement, and it is important to raise awareness of research data and FAIR principles in the long term. See FAU Research Data Policy.  
Research data policy
A research data policy contains basic guidelines for handling data in a larger organization, e.g. a university. In addition to general recommendations for action, a research data policy usually regulates the responsibilities and support structures on site. In some cases, the guidelines also include details on licensing and repositories for research data. The current version of the FAU research data policy can be found at https://www.fau.info/fdm-policy.
Urheberrecht
Literarische, künstlerische und wissenschaftliche Werke sind in Deutschland vom Urheberrechtsgesetz geschützt. Das bedeutet konkret, dass ohne eine entsprechende Lizenz eine Nachnutzung nur restriktiv möglich ist. Wir empfehlen eine möglichst offene Lizensierung, denn dadurch steigt die Nachnutzung der Daten, was ein Reputationsgewinn für die Forschenden ist. Bei Fragen berät das CDI Sie gerne. Mehr Details in diesem Artikel.
Usage rights
A right of use describes the manner in which an object may be used. Examples of “uses” of digital objects are copying, saving or publishing. The use can be subject to conditions, such as a monetary fee. A right of use between the rights holder and the contractual partner can be established through a license.
Warm research data
Warm data are rarely changed. It is also acceptable if access to warm data takes longer, for instance when copying files (“copy’n’tea”). Warm data are usually already suitable for sharing in the research group or with external researchers.
Warme Forschungsdaten
Warme Daten werden nur noch selten geändert. Zudem ist es in Ordnung, wenn ein Zugriff (wie z.B. ein ein Kopiervorgang) Zeit in Anspruch nimmt (“copy’n’tea”). Warme Daten sind üblicherweise bereits dazu geeignet, in der Arbeitsgruppe oder mit extern Forschenden geteilt zu werden.
WissKI
WissKI WissKI is a virtual research environment that enables scientific, location-independent and collaborative work with linked data. On the basis of an ontology, the research data are semantically enriched and stored in the form of triples in a coherent data network (graph database).
WissKI
WissKI ist eine virtuelle Forschungsumgebung, die wissenschaftliches, ortsunabhängiges und kollaboratives Arbeiten mit linked data ermöglicht. Auf Basis einer Ontologie werden die Forschungsdaten semantisch angereichert und in Form von Triples in einem zusammenhängenden Datennetzwerk gespeichert (Graphdatenbank).
FAU Competence Center for Research Data and Information
Freyeslebenstrasse 1
91058 Erlangen
  • Impressum
  • Datenschutz
  • Barrierefreiheit
  • LinkedIn
  • RSS Feed
Up