Zum Inhalt springen

Forschungsdatenmanagement Forschungsdaten-Lebenszyklus und FAIR-Prinzipien

Forschungsdaten-Lebenszyklus

Als Forschungsdatenmanagement werden alle mit digitalen Forschungsdaten durchgeführten Aktivitäten bezeichnet (von der eigentlichen Nutzung abgesehen), insbesondere bezüglich der Sicherung und langfristigen Verfügbarkeit. Die einzelnen Schritte von der Erzeugung über die Nutzung und Analyse der Forschungsdaten, Aufbereitung, Archivierung, Veröffentlichung, Wiederverwendung und eventuell bis hin zur terminierten Löschung bilden den sogenannten Lebenszyklus der Forschungsdaten. Dieser Begriff verdeutlicht, dass die Forschungsdaten und deren Pflege während aller Phasen eines Forschungsprojektes und darüber hinaus eine Rolle spielen.

Forschungsdaten-Lebenszyklus, der sieben Phasen abbildet: Planung, Erhebung, Aufbereitung, Beschreibung/Dokumentation, Publikation, Verbreitung und Nachnutzung. Ein zweiter Pfeil beginnend zwischen Publikation und Verbreitung, der auf Nachnutzung zeigt, betrifft die Langzeitarchivierung.
Autor: Jürgen Rohrwild
Planung der Datenerhebung

Zu Beginn wird festgelegt, welche Daten für die Beantwortung einer wissenschaftlichen Fragestellung bereits vorhanden sind und welche neu erzeugt werden sollen. Darüber hinaus werden die Maßnahmen geplant, die den Umgang mit den Daten bestimmen.

Erhebung

In dieser Phase werden neue Daten erhoben (zum Beispiel durch Experimente, Interviews, Bildaufnahmen, Beobachtungen) sowie die bereits vorhandenen gesammelt.

Aufbereitung

Anhand der festgelegten Kriterien wird bestimmt, welche der erhobenen Rohdaten archiviert und welche bewusst gelöscht werden sollen. Alle relevanten Daten werden dabei in eine für die geplante Forschungsarbeit geeignete Form bzw. Datenformat umgewandelt. Diese Daten bilden in der Regel die Grundlage der wissenschaftlichen Arbeit.

Beschreibung / Dokumentation

Im nächsten Schritt werden die Informationen über den Entstehungskontext der Daten dokumentiert, zum Beispiel Ort und Datum der Entstehung oder Informationen zum Gerät beziehungsweise Werkzeug, mit dem die Daten erzeugt wurden.

Publikation

Die für eine langfristige Archivierung vorgesehenen Daten werden nun gemäß den Formaten und Standards (zum Beispiel für Metadaten, Zitierung, Annotationen) bereitgestellt und zu einem Archiv hinzugefügt. Denn damit die Daten zukünftig aufgefunden und nachgenutzt werden können, zum Beispiel im Kontext neuer wissenschaftlichen Fragestellungen oder als Nachweis der wissenschaftlichen Praxis, ist es wichtig, sie in einer geeigneten Form zu erfassen.

Verbreitung

Ausgewählte Daten werden frei verfügbar gestellt oder auf Anfrage geteilt, um eigene Forschungsergebnisse für andere nutzbar zu machen. Wichtig sind dabei persistente Identifikatoren und Nachweise in geeigneten Datenbanken.

Langzeitarchivierung

In dieser Phase wird festgelegt, welche der gewonnenen Daten nur kurzfristig aufbewahrt werden sollen (zum Beispiel nur für die Dauer des Forschungsprojektes), und bei welchen ist es sinnvoll, eine langfristige Archivierung zu sichern, sodass die Daten auch nach Abschluss des Forschungsprojektes auffindbar sind. In diesem Zusammenhang wird bestimmt, welche Medienformate bzw. Datenarchive oder Repositorien für die festgelegte Art der Archivierung geeignet sind. Neben den technischen Rahmenbedingungen werden hierfür anfallende Kosten geklärt sowie Regelungen zu Urheberrecht und Haftung vereinbart.

Nachnutzung

Es wird festgelegt, unter welchen Rahmenbedingungen die archivierten Daten von Dritten nachgenutzt werden sollen.

Einige Förderorganisationen fordern bereits, Forschungsdaten für bestimmte Zeiten aufzubewahren, zu veröffentlichen und nachnutzbar zu machen. Deshalb hat sich bei der Planung von Forschungsvorhaben die Erstellung von Datenmanagementplänen etabliert. In einem Datenmanagementplan dokumentieren Sie schriftlich und nachvollziehbar, wie mit den Daten umgegangen wird, um diese Anforderungen zu erfüllen und die Qualität der Forschungsdaten sicherzustellen. Dabei werden etablierte Standards, die „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“, „Regeln zur Sicherung der guten wissenschaftlichen Praxis“ und die FAIR-Prinzipien beachtet.

FAIR-Prinzipien

Der Umgang mit Forschungsdaten sollte nach den FAIR-Prinzipien erfolgen:

Findable - Auffindbar

Daten und Metadaten sollten auffindbar sein:

  • Sie sind mit einem persistenten Identifikator, zum Beispiel einem DOI, versehen.
  • Daten sind mit Metadaten beschrieben.
  • Metadaten enthalten den Identifikator der Daten, die sie beschreiben.
  • (Meta-)Daten sind in einer durchsuchbaren Ressource registriert oder indexiert.

Accessible - Zugänglich

Forschungsdaten sollen zugänglich sein:

  • (Meta-)Daten sind anhand ihres Identifikators über ein standardisiertes Kommunikationsprotokoll abrufbar.
  • Das Protokoll ist offen, frei und universell implementierbar.
  • Das Protokoll ermöglicht ein Authentifizierungs- und Autorisierungsverfahren, falls erforderlich.
  • Die Metadaten sind zugänglich, auch wenn die Daten nicht mehr verfügbar sind.

Interoperable - Interoperabel

Forschungsdaten sollten interoperabel sein:

  • (Meta-)Daten verwenden eine formale, zugängliche, geteilte und breit anwendbare Sprache zur Wissensdarstellung.
  • (Meta-)Daten verwenden Vokabulare, die den FAIR-Prinzipien folgen.
  • (Meta-)Daten enthalten qualifizierte Referenzen auf andere (Meta-)Daten.

Reusable - Wiederverwendbar

Forschungsdaten sollten wiederverwendbar sein:

  • (Meta-)Daten sind reichhaltig mit einer Vielzahl von genauen und relevanten Attributen beschrieben.
  • (Meta-)Daten werden mit einer klaren und zugänglichen Datennutzungslizenz freigegeben.
  • (Meta-)Daten sind mit einer detaillierten Provenienzangabe verbunden.
  • (Meta-)Daten erfüllen die für den Bereich relevanten Standards.

Weiterführende Informationen zu FAIRen Daten finden Sie auf forschungsdaten.info oder erhalten Sie bei den FDM-Verantwortlichen an den Einrichtungen.