Langzeitarchivierung in Forschung und Lehre

Unabhängiges Daten Management hilft auch den  Forschern in diesem Labor.

Daten sind für Wissenschaftler ein wertvoller Rohstoff. Die Datenbestände, mit denen Forscher arbeiten, werden häufig über einen Zeitraum von mehreren Jahren gesammelt. Sehr aufwändige Experimente oder Langzeitstudien sind in der Regel nicht mit vertretbarem Aufwand wiederholbar. So sehen spezifische Compliance-Vorgaben beispielsweise vor, dass die Daten auch anderen Wissenschaftlern langfristig zur Verfügung stehen. Die Forschungsdaten sind einzigartig, ihr unwiederbringlicher Verlust käme einem immensen Schaden gleich.

Hinzu kommt, dass die gesammelten Datensätze oftmals auch noch lange nach ihrer Entstehung von großem Interesse sind: beispielsweise dann, wenn neue Erkenntnisse oder Analysemöglichkeiten eine neue Auswertung ermöglichen. Bei ihrer elektronischen Archivierung muss also gewährleistet sein, dass sie auch nach mehreren Jahren oder Jahrzehnten noch zuverlässig abrufbar sind.

Schließlich sind die Kosten für eine Archivierung nicht außer Acht zu lassen. Vor dem Hintergrund der Kosten für die Forschungen selbst schlägt ein digitales Archiv zwar mit vergleichsweise niedrigen Kosten zu Buche. Trotzdem dürfen sie nicht vernachlässigt werden.

Die Herausforderungen, vor denen die dauerhafte Aufbewahrung von Forschungsdaten in elektronischen Archiven steht, sind also sehr hoch. Ob es sich um medizinische Laborwerte handelt oder um terabytegroße Mess- oder Multimediadaten: Eine sichere Langzeitarchivierung ist ein Muss. Es bedarf digitaler Langzeitarchive, die mit einer durchdachten Archivierungslösung arbeiten, die die genannten Anforderungen erfüllt.

Information Lifecycle Management und Hierarchical Storage Management

Für die Langzeitarchivierung von Forschungsdaten empfiehlt sich die Kombination von Information Lifecycle Management (ILM) mit dem Konzept des hierarchischen Speichermanagements (HSM). Information Lifecycle Management ist eine Speicherstrategie, die Daten über ihren vollständigen Lebenszyklus hinweg begleitet. Mit Hilfe des ILM-Ansatzes werden Daten auf der Speicherebene abgelegt, die ihrer jeweiligen Lebensphase entspricht. Dies geschieht im Rahmen einer mehrstufigen, hierarchisch angelegten Speicherarchitektur. Dabei sind schnelle Primärspeicher für aktuelle, „heiße“ Daten vorgesehen. Inaktive, „kalte“ Daten, die länger nicht genutzt wurden, werden auf Sekundärspeichern archiviert.

Die Regeln für die Speicherung und den Zeitplan für die Verlagerung auf die tiefergelegene Speicherebene legen die Zuständigen dabei individuell fest.

Es empfiehlt sich, für die unterschiedlichen Speicherstufen im Rahmen des HSM unterschiedliche Speichersysteme einzusetzen. Bei einer Kombination aus On- und Off-premises-Lösungen sorgt eine Cloud-Integration zusätzlich für flexible Skalierbarkeit digitaler Archive.

So bietet sich die Möglichkeit, mit der Einführung einer Lösung für die digitale Langzeitarchivierung zugleich die Speicherinfrastruktur zu optimieren. Auch hier liegt großes Einsparungspotential. Wenn die Speichersysteme optimal genutzt werden, lassen sich Performance und Kapazität auf Primärspeichersystemen steigern. Archivdaten werden auf günstigere Sekundärspeicher ausgelagert. Bei einer solchen Optimierung der Speicherinfrastruktur sollte sichergestellt werden, dass eine neue HSM-Architektur sich in die bestehende Infrastruktur des Instituts einfügt und einen schnellen und zuverlässigen Zugriff bietet.

„Namhafte Forschungseinrichtungen nutzen bereits unsere Software zur Langzeitarchivierung. Als Experte für verlässliche Archivierungssoftware optimieren wir die Aufbewahrung von unstrukturierten Daten“, sagt Thomas Thalmann, Geschäftsführer der PoINT Software & Systems GmbH.

Langzeitarchivierung mit Software von PoINT

Der PoINT Storage Manager ist von PoINT für die Langzeitarchivierung entwickelt worden. Die Software verschiebt Daten automatisiert und nach individuell erstellten Regeln innerhalb einer mehrstufigen Speicherarchitektur.

Der Zugriff auf die archivierten Dateien kann mit verschiedenen erprobten Verfahren erfolgen (z.B. Stubbing, Web Links). Auf diese Weise ermöglicht die Software den Wissenschaftlern den Erhalt ihres gewohnten Workflows und transparenten Lesezugriff auf archivierte Daten. Indem Daten im Archiv grundsätzlich nicht geändert werden, ist durch die WORM-Funktion und das Retention Management größte Datensicherheit gegeben.

Der PoINT Storage Manager arbeitet mit den üblichen Standards und allen marktgängigen Speichersystemen und -technologien. So können Forscher die Speichersysteme wählen, die für sie am besten geeignet sind. Auch Archivspeichermigrationen sind mit dem PoINT Storage Manager störungsfrei möglich. Kombiniert mit einem Speichersystem aus Flash, Festplatten, Private/Public Cloud, Tape oder Optical steht mit der Software von PoINT eine optimale Plattform für die Langzeitarchivierung in Forschung und Lehre zur Verfügung.

Die Lösung für Big Data Storage

Sie müssen Datenmengen im Petabytebereich archivieren? Dann hilft Ihnen unsere Software PoINT Archival Gateway, die mehr als ein Petabyte an Daten pro Tag speichern kann. Sie bietet enorme Performance, ist zusätzlich ausfallsicher und hoch skalierbar.

Zurück zur Übersicht