Forschungsdaten sind für Wissenschaftler ein wertvoller Rohstoff. In Forschungsprojekten werden Datenbestände oft über Zeiträume von mehreren Jahren und unter hohem Kostenaufwand gesammelt. Die so entstandenen Datenbestände sind einzigartig und nahezu unersetzlich: Viele Experimente und Langzeitstudien sind nicht mit vertretbarem Aufwand wiederholbar.
Schon bei der Planung eines Forschungsprojekts erhält die Frage nach der langfristigen Sicherung von Forschungsdaten einen zentralen Stellenwert. Compliance-Anforderungen sehen eine Speicherung und Nachnutzbarkeit für einen Zeitraum von 10 Jahren vor.

Welchen Kriterien unterliegt die elektronische Langzeitarchivierung von Forschungsdaten, und welche Herausforderungen sind mit der Konzeption digitaler Archive verbunden?
- Nachnutzbarkeit der Daten:
Auch andere Forschende sollen die gewonnenen Daten nutzen können. Um die Verfügbarkeit und einen nahtlosen Zugriff zu ermöglichen, sollten bei der Speicherung standardisierte Formate und Schnittstellen verwendet werden. - Aufbewahrungsdauer:
Die Lebensdauer gängiger Speichermedien ist kürzer als die vorgesehene Aufbewahrungsdauer von 10 Jahren. Während des Archivierungszeitraums müssen die Speichermedien also ausgetauscht werden. Das heißt, die Daten müssen auf neue Datenträger migriert werden. Alternativ können Datenträger gewählt werden, deren Lebensdauer den Archivierungszeitraum abdeckt. - Kosten:
Im Vergleich zu den Gesamtkosten, die bei Forschungsprojekten anfallen können, sind die Kosten für die Speicherinfrastruktur relativ gering. Dennoch sollte der finanzielle Aspekt nicht vernachlässigt werden: Auch im Bereich Forschung wird aufgrund zunehmender Analysemöglichkeiten die umfassende Datenerfassung und -speicherung immer attraktiver. Die Datenvolumen, die die Infrastruktur aufnehmen muss, wachsen – und damit steigen wiederum die Hardware-Kosten.
Daten- und Speichermanagement für Forschungseinrichtungen
Schon beim Entwurf eines Forschungsprojektes sollte also eine nachhaltige Strategie für die Archivierung der anfallenden Daten mit bedacht werden. So bleiben die Daten im elektronischen Langzeitarchiv verfügbar und nutzbar.
Forschungseinrichtungen, die bereits große Datenmengen gesammelt haben, sehen sich häufig vor dem Problem überfüllter Speichersysteme und kostspieliger Speichererweiterungen. Eine Optimierung der Speicherinfrastruktur kann hier helfen, um performante Primärspeicher zu entlasten und ältere Daten zu archivieren.
Für die Langzeitarchivierung von Forschungsdaten empfiehlt sich eine Kombination von Information Lifecycle Management (ILM) mit dem Konzept des hierarchischen Speichermanagements (HSM).
- Information Lifecycle Management ist eine Speicherstrategie, die Daten über ihren vollständigen Lebenszyklus hinweg begleitet.
Mit Hilfe des ILM-Ansatzes werden Daten auf der Speicherebene abgelegt, die ihrer jeweiligen Lebensphase entspricht. - Die Daten werden innerhalb einer mehrstufigen, hierarchisch angelegten Speicherarchitektur gespeichert.
Dabei sind schnelle Primärspeicher für aktuelle, „heiße“ Daten vorgesehen. Inaktive, „kalte“ Daten, die länger nicht genutzt wurden, werden auf Sekundärspeichern archiviert. - Die Verlagerung der Daten auf die tiefergelegene Speicherebene – das sogenannte Tiering – erfolgt automatisiert nach individuell festgelegten Regeln. In Rücksprache mit den Anwendern können Administratoren die Archivierung beispielsweise so einrichten, dass Daten eines festgelegten Alters für einen festgelegten Zeitraum automatisch archiviert werden.
Um die sichere Langzeitarchivierung der Forschungsdaten zu gewährleisten, sollten schon bei der Projektplanung Überlegungen bzgl. der anfallenden Datenmengen und Datentypen angestellt werden. Wer weiß, was gespeichert werden muss, kann eine Speicher- und Archivierungsstrategie planen, mit der die wertvollen Daten zuverlässig und effizient gesichert werden und verfügbar bleiben.
Software für die effiziente Speicherung und Langzeitarchivierung von Forschungsdaten
Für die Langzeitarchivierung von Forschungsdaten und digitaler Dokumente kommt eine spezialisierte Software-Lösung zum Einsatz, die die anfallenden Daten schnell und zuverlässig auf den ausgewählten Speichersystemen ablegt und langfristig den barrierefreien Zugriff auf die Daten gewährleistet.
Bei der Auswahl dieser Software sollten unterschiedliche Überlegungen eine Rolle spielen:
- Welche Speichertechnologien werden unterstützt?
Je größer die Bandbreite der unterstützten Speichertechnologien und Speichermedien, desto flexibler bleiben Anwender. Bereits vorhandene Hardware kann weiter genutzt werden und bei Speichererweiterungen gelten keine Einschränkungen auf bestimmte Hersteller oder Technologien. Die Auswahl der Hardware kann im Hinblick auf ihre Eignung und die Kosten erfolgen. - Ist ein nahtloser Zugriff auf die Daten möglich?
Um auf archivierte Daten und digitale Dokumente reibungslos zugreifen zu können, empfiehlt sich die Speicherung in standardisierten Formaten. Die Archivierungssoftware sollte dann die entsprechenden Schnittstellen zur Verfügung stellen, um die Daten schnell und zuverlässig wieder lesen zu können. Durch die Einhaltung von Standards bei der Datenspeicherung wird bewerkstelligt, dass die Daten auch von anderen Forschern genutzt werden können. - Ermöglicht die Software Archivmigrationen?
Eine Aufbewahrungszeit von 10 Jahren übersteigt die Lebensdauer vieler gängiger Speichermedien. Während der Aufbewahrungsdauer im Langzeitarchiv müssen die Daten also auf neue Datenträger migriert werden. Stellt die Archivierungssoftware auch eine Migrationsfunktion zur Verfügung, wird keine zusätzliche Software oder Dienstleistung benötigt.
Langzeitarchivierung im Bereich Research mit Lösungen von PoINT
Unsere Software-Lösungen für die Datenarchivierung kommen in namhaften Forschungseinrichtungen zum Einsatz. Mit PoINT Storage Manager und PoINT Archival Gateway können Institute unterschiedliche Anwendungsfälle abdecken, ihre wertvollen Daten sicher archivieren und Compliance-Vorgaben erfüllen. Gleichzeitig stellen beide Lösungen Möglichkeiten bereit, um schnell auf die archivierten Daten zugreifen zu können. So bleiben die Daten auch in Zukunft lesbar und für weitere Analysen nutzbar.
Dateibasierte Langzeitarchivierung mit PoINT Storage Manager

Unsere dateibasierte Archivierungslösung PoINT Storage Manager setzt ein Information Lifecycle Management innerhalb einer mehrstufigen Speicherarchitektur um:
- Anhand individuell definierter Policies verschiebt die Software die Daten automatisiert auf die geeignete Speicherebene und das geeignete Speichermedium innerhalb der Speicherarchitektur.
- PoINT Storage Manager unterstützt Speichersysteme hersteller- und technologieunabhängig, so dass Anwender maßgeschneiderte Hardware-Lösungen wählen können.
- Ältere Daten, die nicht mehr unmittelbar zu Analysezwecken benötigt werden, werden auf die Archivspeicherebene verschoben und dort regelkonform und sicher aufbewahrt.
- Mit PoINT Storage Manager können Anwender über die gewohnte Benutzeroberfläche auf die Archivdaten zugreifen.
- Die Lösung führt automatisierte und unterbrechungsfreie Archivmigrationen durch.
Case Study: Max-Planck-Institut Bad Nauheim
Terabytegroße Messdaten hielt das Max-Planck-Institut für Herz- und Lungenforschung (MPI) durch Online-Speicher permanent bereit. Dazu gehörten auch Daten, auf die nur vereinzelt ein Zugriff erfolgte. Insgesamt liegt das Datenvolumen des MPI im Petabytebereich. Um die damit verbundenen Kosten zu reduzieren, hat sich das Institut für die Software PoINT Storage Manager entschieden. Die bietet Langzeitarchivierung, transparenten Lesezugriff und Medienbrüche.
Weitere Informationen finden Sie in unserer Case Study.
Die Lösung für Big Data Storage: PoINT Archival Gateway
In Forschungsprojekten fallen häufig Datenmengen im Petabyte-Bereich an, die sicher und langfristig aufbewahrt werden müssen. Unsere Software PoINT Archival Gateway bietet zu diesem Zweck einen performanten und skalierbaren Objektspeicher mit standardisierter S3 Schnittstelle.
- PoINT Archival Gateway speichert die Daten auf Tape, einem besonders kosteneffizienten und langlebigen Speichermedium für die Archivierung kalter Daten.
- Die Lebensdauer von bis zu 30 Jahren deckt auch lange Aufbewahrungszeiträume ab und macht damit Archivmigrationen überflüssig.
- Die Lösung empfängt die Daten über die standardisierte S3 Schnittstelle, und auch der Zugriff auf die Daten erfolgt über diese API.
- Mit wachsenden Datenvolumen ist PoINT Archival Gateway flexibel skalierbar.
Case Study: EMBL European Bioinformatics Institute (EMBL-EBI)
Das EMBL European Bioinformatics Institute (EMBL-EBI) speichert Forschungsdaten und komprimierte Daten von unter 1MB bis zu 100GB Größe, bei einem aktuellen Datenbestand von ca. 50PB. Zur Datensicherung für Backup und Langzeitarchivierung werden die Daten auf Tape geschrieben. Eine hauseigene Lösung schrieb die Daten vom Objektspeicher in ein Filesystem auf Festplatte, und dann auf Tape Medien. Dieser Ansatz erwies sich aber für die wachsenden Datenmengen als nicht ausreichend performant. Außerdem wurde der Speicherplatz auf den Tapes nur zu 90% genutzt. Mit der Einführung von PoINT Archival Gateway verfügt das Forschungsinstitut nun über eine performante und kosteneffiziente Lösung, um die Daten über die standardisierte S3 Schnittstelle direkt auf Tape zu schreiben und dem Datenwachstum begegnen zu können.
Weitere Informationen finden Sie in unserer Case Study.