Index

Datenorganisation

Der Umgang mit Forschungsdaten ist für viele Wissenschaftlerinnen und Wissenschaftler die Grundlage ihrer täglichen Arbeit. Es spart daher Zeit und Aufwand, wenn diese Daten von vorneherein effizient strukturiert, dokumentiert und gesichert werden.

Die meisten Daten werden zunächst in Dateien abgelegt. Dateien haben unterschiedliche Typen oder Dateiformate, die manchmal als Suffix des Dateinamens kenntlich gemacht werden, z.B. im Betriebssystem Windows. Weiterhin werden Dateien in Verzeichnissen (Ordnern) abgelegt. Ganz wichtig ist eine systematische Benennung von Dateien wie auch Verzeichnissen. Hinweise dazu gibt z.B. das Stanford File Naming Handout.

Alternativ können Daten auch in Datenbanken abgelegt werden. Hier ist der Aufwand höher, weil erst ein Datenbank-Management-System wie z.B. MySQL eingerichtet werden muss. Zentral ist die Definition eines Datenbank-Schemas, mit dem die Strukturen für die zu speichernden Daten angelegt werden. Auch hier ist die Namensgebung von großer Bedeutung. Datenbanken unterstützen den geregelten gemeinsamen Zugriff auf Daten sehr viel besser als Dateien. Es gibt verschiedene Arten von Datenbanken: relationale, hierarchische, Graph-basierte, RDF Triple Stores und noch einige weitere mehr.

Folgendes Animationsvideo fasst die Thematik der Datenorganisation anschaulich zusammen.