Forschungsdatenmanagement Forschungsdaten-Lebenszyklus, FAIR- und CARE-Prinzipien

Forschungsdaten-management Forschungsdaten-Lebenszyklus, FAIR- und CARE-Prinzipien

Forschungsdaten-Lebenszyklus

Als Forschungsdatenmanagement werden alle mit digitalen Forschungsdaten durchgeführten Aktivitäten bezeichnet (von der eigentlichen Nutzung abgesehen), insbesondere bezüglich der Sicherung und langfristigen Verfügbarkeit. Die einzelnen Schritte von der Erzeugung über die Nutzung und Analyse der Forschungsdaten, Aufbereitung, Archivierung, Veröffentlichung, Wiederverwendung und eventuell bis hin zur terminierten Löschung bilden den sogenannten Lebenszyklus der Forschungsdaten. Dieser Begriff verdeutlicht, dass die Forschungsdaten und deren Pflege während aller Phasen eines Forschungsprojektes und darüber hinaus eine Rolle spielen.

Autor: Jürgen Rohrwild

Planung der Datenerhebung

Zu Beginn wird festgelegt, welche Daten für die Beantwortung einer wissenschaftlichen Fragestellung bereits vorhanden sind und welche neu erzeugt werden sollen. Darüber hinaus werden die Maßnahmen geplant, die den Umgang mit den Daten bestimmen.

Erhebung

In dieser Phase werden neue Daten erhoben (zum Beispiel durch Experimente, Interviews, Bildaufnahmen, Beobachtungen) sowie die bereits vorhandenen gesammelt.

Aufbereitung

Anhand der festgelegten Kriterien wird bestimmt, welche der erhobenen Rohdaten archiviert und welche bewusst gelöscht werden sollen. Alle relevanten Daten werden dabei in eine für die geplante Forschungsarbeit geeignete Form bzw. Datenformat umgewandelt. Diese Daten bilden in der Regel die Grundlage der wissenschaftlichen Arbeit.

Beschreibung / Dokumentation

Im nächsten Schritt werden die Informationen über den Entstehungskontext der Daten dokumentiert, zum Beispiel Ort und Datum der Entstehung oder Informationen zum Gerät beziehungsweise Werkzeug, mit dem die Daten erzeugt wurden.

Publikation

Die für eine langfristige Archivierung vorgesehenen Daten werden nun gemäß den Formaten und Standards (zum Beispiel für Metadaten, Zitierung, Annotationen) bereitgestellt und zu einem Archiv hinzugefügt. Denn damit die Daten zukünftig aufgefunden und nachgenutzt werden können, zum Beispiel im Kontext neuer wissenschaftlichen Fragestellungen oder als Nachweis der wissenschaftlichen Praxis, ist es wichtig, sie in einer geeigneten Form zu erfassen.

Verbreitung

Ausgewählte Daten werden frei verfügbar gestellt oder auf Anfrage geteilt, um eigene Forschungsergebnisse für andere nutzbar zu machen. Wichtig sind dabei persistente Identifikatoren und Nachweise in geeigneten Datenbanken.

Langzeitarchivierung

In dieser Phase wird festgelegt, welche der gewonnenen Daten nur kurzfristig aufbewahrt werden sollen (zum Beispiel nur für die Dauer des Forschungsprojektes), und bei welchen ist es sinnvoll, eine langfristige Archivierung zu sichern, sodass die Daten auch nach Abschluss des Forschungsprojektes auffindbar sind. In diesem Zusammenhang wird bestimmt, welche Medienformate bzw. Datenarchive oder Repositorien für die festgelegte Art der Archivierung geeignet sind. Neben den technischen Rahmenbedingungen werden hierfür anfallende Kosten geklärt sowie Regelungen zu Urheberrecht und Haftung vereinbart.

Nachnutzung

Es wird festgelegt, unter welchen Rahmenbedingungen die archivierten Daten von Dritten nachgenutzt werden sollen.

Einige Förderorganisationen fordern bereits, Forschungsdaten für bestimmte Zeiten aufzubewahren, zu veröffentlichen und nachnutzbar zu machen. Deshalb hat sich bei der Planung von Forschungsvorhaben die Erstellung von Datenmanagementplänen etabliert. In einem Datenmanagementplan dokumentieren Sie schriftlich und nachvollziehbar, wie mit den Daten umgegangen wird, um diese Anforderungen zu erfüllen und die Qualität der Forschungsdaten sicherzustellen. Dabei werden etablierte Standards, die „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“, „Regeln zur Sicherung der guten wissenschaftlichen Praxis“ und die FAIR-Prinzipien beachtet.

FAIR-Prinzipien

Der Umgang mit Forschungsdaten sollte nach den FAIR-Prinzipien erfolgen. Der Begriff FAIR wurde von der FORCE11-Community entwickelt. Die Prinzipien beziehen sich auf drei Entitätstypen: Daten, Metadaten und Infrastruktur. Das Ziel ist, dass Daten und Metadaten für Menschen und Maschinen lesbar aufbereitet sind, um ihre Wiederverwendbarkeit zu ermöglichen.

Findable - Auffindbar

Daten und Metadaten sollten auffindbar sein:

Sie sind mit einem persistenten Identifikator, zum Beispiel einem DOI, versehen.
Daten sind mit Metadaten beschrieben.
Metadaten enthalten den Identifikator der Daten, die sie beschreiben.
(Meta-)Daten sind in einer durchsuchbaren Ressource registriert oder indexiert.

Accessible - Zugänglich

Forschungsdaten sollen zugänglich sein:

(Meta-)Daten sind anhand ihres Identifikators über ein standardisiertes Kommunikationsprotokoll abrufbar.
Das Protokoll ist offen, frei und universell implementierbar.
Das Protokoll ermöglicht ein Authentifizierungs- und Autorisierungsverfahren, falls erforderlich.
Die Metadaten sind zugänglich, auch wenn die Daten nicht mehr verfügbar sind.

Interoperable - Interoperabel

Forschungsdaten sollten interoperabel sein:

(Meta-)Daten verwenden eine formale, zugängliche, geteilte und breit anwendbare Sprache zur Wissensdarstellung.
(Meta-)Daten verwenden Vokabulare, die den FAIR-Prinzipien folgen.
(Meta-)Daten enthalten qualifizierte Referenzen auf andere (Meta-)Daten.

Reusable - Wiederverwendbar

Forschungsdaten sollten wiederverwendbar sein:

(Meta-)Daten sind reichhaltig mit einer Vielzahl von genauen und relevanten Attributen beschrieben.
(Meta-)Daten werden mit einer klaren und zugänglichen Datennutzungslizenz freigegeben.
(Meta-)Daten sind mit einer detaillierten Provenienzangabe verbunden.
(Meta-)Daten erfüllen die für den Bereich relevanten Standards.

Weiterführende Informationen zu FAIRen Daten finden Sie auf forschungsdaten.info oder erhalten Sie bei den FDM-Verantwortlichen an den Einrichtungen.

Auch für Forschungssoftware gibt es FAIR-Prinzipien: FAIR4RS. Die FAIR for Research Software Working Group hat die FAIR-Prinzipien angepasst und weiterentwickelt, um auf spezifische Charakteristika wie Ausführbarkeit, kontinuierliche Entwicklung und Versionierung von Software einzugehen.

CARE-Prinzipien

Komplementär zu den FAIR-Prinzipien hat die Global Indigenous Data Alliance (GIDA) die CARE-Prinzipien als notwendige Erweiterung erarbeitet. Während die FAIR-Prinzipien sich auf die Eigenschaften von Daten und Datenaustausch beziehen, richten die CARE-Prinzipien den Blick auf ethische Fragestellungen, Machtdynamiken und historische Kontexte in Bezug auf Daten indigener Völker. Durch die CARE-Prinzipien sollen die Gefahren und Potenziale für Individuen und Gruppen in den Blick genommen werden. Auch sollen die Beforschten die Möglichkeit zur Mitbestimmung über die Erhebung, das Eigentum und die Verwendung von Daten bekommen.

Collective Benefit - Kollektiver Nutzen

Indigene Völker sollten einen Nutzen aus den Daten ziehen können, d. h. sie nachnutzen können und die Wertschöpfung sollte ihnen zugutekommen.

Für integrative Entwicklung und Innovation
Für bessere Steuerung und Bürgerbeteiligung
Für gerechte Ergebnisse

Authority to Control - Kontrolle über die Daten

Indigene Völker und ihre Leitungsgremien sollten die Kontrolle über ihre Daten haben und bestimmen können, wie sie selbst, indigenes Land, indigene Territorien und Ressourcen, indigenes Wissen und geografische Indikatoren in Daten repräsentiert und identifiziert werden.

Anerkennung von Rechten und Anteilen
Daten zur (Selbst-)Verwaltung
Data Governance

Responsibility - Verantwortungsbewusstsein

Nutzende indigener Daten sollten mitteilen, wie diese Daten verwendet werden, und darlegen, welche Vorteile für indigene Völker entstehen. Auch sollten sie die Communitys durch Förderung beispielsweise von Data Literacy unterstützen.

Für positive Beziehungen
Für die Erweiterung von Fähigkeiten und Kompetenzen
Für indigene Sprachen und Weltanschauungen

Ethics - Ethik

In allen Phasen des Datenlebenszyklus sollten die Rechte und das Wohlergehen indigener Völker im Mittelpunkt stehen.

Für die Minimierung des Schadens und Maximierung des Nutzens
Für Gerechtigkeit
Für künftige Nutzung

Weiterführende Informationen zu den CARE-Prinzipien finden Sie bei der GIDA oder erhalten Sie bei den FDM-Verantwortlichen an den Einrichtungen.

Weiterführende Informationen

Folgend eine Auswahl:

Die Informationsplattform forschungsdaten.info mit einführenden, praxisnahen Artikeln.
Wikibasierte Sammlung an Information zum Forschungsdatenmanagement auf forschungsdaten.org.
Putnings, Markus, Neuroth, Heike & Neumann, Jana (2021). Praxishandbuch Forschungsdatenmanagement. Berlin, Boston: De Gruyter Saur. DOI 10.1515/9783110657807.
FDM-Trainings- und Schulungsmaterialien (initiert von der DINI UAG Schulungen/Fortbildungen).
Handreichungen zu DFG- und Horizon Europe-Anträgen: Krömer, Cora & Rohrwild, Jürgen (2022). FDM-Handreichungen (Version 1.0). eHumanities – interdisziplinär. https://gitlab.rrze.fau.de/cdi/labs/literacy/proposal-self-service. Die Handreichungen sind mit Spezifika der Friedrich-Alexander-Universität Erlangen-Nürnberg versehen, können aber leicht angepasst werden. Viele Informationen sind allgemeingültig.
Website des NFDI-Vereins mit Informationen zur Nationalen Forschungsdateninfrastruktur.