Use Case
In einem musikwissenschaftlichen Projekt werden Schaffende, deren Lebensdaten, Werke, Aufführungen und weitere Informationen in einer SQL-Datenbank erfasst. Die Datenbank besteht aus mehreren Tabellen.
Kontext
- Datenbank
- Faktendatenbank
- Musikwissenschaft
Empfohlenes Vorgehen
Aus Datenbanken können darin enthaltene Informationen und die Datenbankstruktur in Form von sogenannten Datenbankdumps exportiert werden. Dabei wird beispielsweise bei SQL-Datenbanken eine Datei mit einen Liste von SQL-Befehlen, erzeugt, die die Datenbank abbilden. Die Dumps sind reine Text-Dateien und daher seht gut langfristig Digital zu archivieren. Aus dem Dump lässt sich die Datenbank in exakt dem zustanbd, in dem sie sich zum Zeitpunkt des Dumps befand, wiederherstellen.
Zusätzlich zu dem Dump können auch die einzelen Tabellen als CSV-Dateien gespeichert werden. Diese bei einfachen Datenbanken meist geringe extra Arbeit ermöglicht einen etwas direkteren Zugang zu den Informationen.
Grund
Die Datenbank-Datei selbst zu archivieren garantiert nicht notwendig, dass diese langfirstig auch geöffnet und mit vollem Funktionsumfang genutzt werden kann. Datenbankdumps haben den Vorteil, dass – selbst wenn die Datenbanksprache nicht mehr im aktiive Einsatz ist – alle Informationen aus der Textdatei rekonstruiert werden können.
Konsequenzen / Kosten
Der Aufwand für das Erstellen eines Datenbankdumps ist gering. Meist kann dieser durch einen einzigen Datenbankbefehl erzeugt werden – etwa bei PostgreSQL. Das Wiederherstellen geschied ebenfalls durch ein knappes Datenbankkommando, mit dem eine leere Datenbank aus dem Dump befüllt wird. Es wird empfohlen, zu prüfen, ob sich die Datenbank fehlerfrei aus dem Dump rekonsrtuieren lässt oder ob eine Fehlermeldung auftritt.
Bei größen Datenbanken kann der Dump speicherintensiv sein. In diese Fällen ist es von Vorteil den Dump nach der Fehlerkontrolle zu komprimieren, beispielsweise mit gzip oder einem anderen Programm. Das geringere Datenvolumen reduziert die Kosten für die Archvierung und beschleunigt den Datentransfer.
Beim Archivieren der Datenbank an sich ist die langfristige Verwendbarkeit nicht sichergestellt. Wenn die Datenbankstruktur nicht mehr vollständig von in Zukunft gebräuchlichen Programmen interpretiert werden kann, können wichtige Informationen verloren gehen. Dies kann bei entsprechender Kuratierung verhindert werden. Dies erfordert aber Ressourcen, die für Datenbankdumps nicht notwendig sind.