
Daten sind für Wissenschaftler ein wertvoller Rohstoff. Die Datenbestände, mit denen Forscher arbeiten, werden häufig über einen Zeitraum von mehreren Jahren gesammelt. Sehr aufwändige Experimente oder Langzeitstudien sind in der Regel nicht mit vertretbarem Aufwand wiederholbar. So sehen spezifische Compliance-Vorgaben beispielsweise vor, dass die Daten auch anderen Wissenschaftlern langfristig zur Verfügung stehen. Die Forschungsdaten sind einzigartig, ihr unwiederbringlicher Verlust käme einem immensen Schaden gleich.
Hinzu kommt, dass die gesammelten Datensätze oftmals auch noch lange nach ihrer Entstehung von großem Interesse sind: beispielsweise dann, wenn neue Erkenntnisse oder Analysemöglichkeiten eine neue Auswertung ermöglichen. Bei ihrer elektronischen Archivierung muss also gewährleistet sein, dass sie auch nach mehreren Jahren oder Jahrzehnten noch zuverlässig abrufbar sind.
Schließlich sind die Kosten für eine Archivierung nicht außer Acht zu lassen. Vor dem Hintergrund der Kosten für die Forschungen selbst schlägt ein digitales Archiv zwar mit vergleichsweise niedrigen Kosten zu Buche. Trotzdem dürfen sie nicht vernachlässigt werden.
Die Herausforderungen, vor denen die dauerhafte Aufbewahrung von Forschungsdaten in elektronischen Archiven steht, sind also sehr hoch. Ob es sich um medizinische Laborwerte handelt oder um terabytegroße Mess- oder Multimediadaten: Eine sichere Langzeitarchivierung ist ein Muss. Es bedarf digitaler Langzeitarchive, die mit einer durchdachten Archivierungslösung arbeiten, die die genannten Anforderungen erfüllt.
Information Lifecycle Management und Hierarchical Storage Management
Für die Langzeitarchivierung von Forschungsdaten empfiehlt sich die Kombination von Information Lifecycle Management (ILM) mit dem Konzept des hierarchischen Speichermanagements (HSM). Information Lifecycle Management ist eine Speicherstrategie, die Daten über ihren vollständigen Lebenszyklus hinweg begleitet. Mit Hilfe des ILM-Ansatzes werden Daten auf der Speicherebene abgelegt, die ihrer jeweiligen Lebensphase entspricht. Dies geschieht im Rahmen einer mehrstufigen, hierarchisch angelegten Speicherarchitektur. Dabei sind schnelle Primärspeicher für aktuelle, „heiße“ Daten vorgesehen. Inaktive, „kalte“ Daten, die länger nicht genutzt wurden, werden auf Sekundärspeichern archiviert.
Die Regeln für die Speicherung und den Zeitplan für die Verlagerung auf die tiefergelegene Speicherebene legen die Zuständigen dabei individuell fest.
Es empfiehlt sich, für die unterschiedlichen Speicherstufen im Rahmen des HSM unterschiedliche Speichersysteme einzusetzen. Bei einer Kombination aus On- und Off-premises-Lösungen sorgt eine Cloud-Integration zusätzlich für flexible Skalierbarkeit digitaler Archive.

So bietet sich die Möglichkeit, mit der Einführung einer Lösung für die digitale Langzeitarchivierung zugleich die Speicherinfrastruktur zu optimieren. Auch hier liegt großes Einsparungspotential. Wenn die Speichersysteme optimal genutzt werden, lassen sich Performance und Kapazität auf Primärspeichersystemen steigern. Archivdaten werden auf günstigere Sekundärspeicher ausgelagert. Bei einer solchen Optimierung der Speicherinfrastruktur sollte sichergestellt werden, dass eine neue HSM-Architektur sich in die bestehende Infrastruktur des Instituts einfügt und einen schnellen und zuverlässigen Zugriff bietet.
„Namhafte Forschungseinrichtungen nutzen bereits unsere Software zur Langzeitarchivierung. Als Experte für verlässliche Archivierungssoftware optimieren wir die Aufbewahrung von unstrukturierten Daten“, sagt Thomas Thalmann, Geschäftsführer der PoINT Software & Systems GmbH.
Langzeitarchivierung mit Software von PoINT
Der PoINT Storage Manager ist von PoINT für die Langzeitarchivierung entwickelt worden. Die Software verschiebt Daten automatisiert und nach individuell erstellten Regeln innerhalb einer mehrstufigen Speicherarchitektur.
Der Zugriff auf die archivierten Dateien kann mit verschiedenen erprobten Verfahren erfolgen (z.B. Stubbing, Web Links). Auf diese Weise ermöglicht die Software den Wissenschaftlern den Erhalt ihres gewohnten Workflows und transparenten Lesezugriff auf archivierte Daten. Indem Daten im Archiv grundsätzlich nicht geändert werden, ist durch die WORM-Funktion und das Retention Management größte Datensicherheit gegeben.
Der PoINT Storage Manager arbeitet mit den üblichen Standards und allen marktgängigen Speichersystemen und -technologien. So können Forscher die Speichersysteme wählen, die für sie am besten geeignet sind. Auch Archivspeichermigrationen sind mit dem PoINT Storage Manager störungsfrei möglich. Kombiniert mit einem Speichersystem aus Flash, Festplatten, Private/Public Cloud, Tape oder Optical steht mit der Software von PoINT eine optimale Plattform für die Langzeitarchivierung in Forschung und Lehre zur Verfügung.
Die Lösung für Big Data Storage
In Forschungsprojekten fallen häufig Datenmengen im Petabytebereich an, die sicher und langfristig archiviert werden müssen. Unsere Software PoINT Archival Gateway unterstützt Sie dabei. Der software-basierte Objektspeicher bietet enorme Performance und hohe Skalierbarkeit. Indem PoINT Archival Gateway große Datenmengen über eine standardisierte S3 Schnittstelle auf Tape schreibt, bietet die Software eine ebenso ausfallsichere wie kosteneffiziente Storage-Lösung für Mess- und Multimediadaten.