20040315 \  Artikel \  Elektronische Archivierung und Storage-Technologien
Elektronische Archivierung und Storage-Technologien
Von Dr. Ulrich Kampffmeyer, Geschäftsführer und Chef-Berater der PROJECT CONSULT Unternehmensberatung GmbH
Beim Thema Archivierung war immer einer der Dreh- und Angelpunkte der Einsatz geeigneter Speichertechnologien. Die Anforderung, einerseits immer die neueste Softwarefunktionalität zu unterstützen, stand andererseits dem Anspruch gegenüber, Informationen über Jahrzehnte sicher verfügbar zu halten. Hieraus hat sich in den 80er Jahren ein eigenes Marktsegment in der IT-Landschaft herausgebildet – die elektronische Archivierung. Diese Eigenständigkeit ist inzwischen durch das Vordringen neuer Speichertechnologien und deren betriebssystemnahe Verwaltung unter Druck geraten.
Archivierung ist kein Selbstzweck. Die Aufbewahrung, Erschließung und Bereitstellung von Information ist eine unabdingbare Voraussetzung für die Arbeitsfähigkeit moderner Unternehmen und Verwaltungen. Mit dem exponentiellen Wachstum elektronischer Information wachsen die Probleme der langzeitigen Aufbewahrung obwohl moderne Softwaretechnologien wesentlich besser geeignet sind, Informationen zu verwalten, als dies herkömmlich mit Papier, Aktenordnern und Regalen möglich war. Immer mehr Information entsteht digital und die Ausgabe als Papier ist nur noch eine mögliche Repräsentation des ursprünglichen elektronischen Dokuments. Durch den Einsatz elektronischer Signaturen erhalten elektronische Dokumente den gleichen Rechtscharakter wie ursprünglich manuell unterzeichnete Schriftstücke. Solche digitalen Dokumente existieren rechtskräftig nur noch in elektronischer Form. Diese Entwicklungen zwingen inzwischen jedes Unternehmen sich verstärkt mit dem Thema elektronische Archivierung auseinander zu setzen.
Archivierung ist nicht gleich Archivierung
Der Begriff der elektronischen Archivierung wird sehr unterschiedlich benutzt. Während heute Unternehmen schon unter der Aufbewahrungsfrist von 10 Jahren für handelsrechtlich und steuerlich relevante Daten und Dokumente stöhnen, kann hier der Archivar in einem historischen Archiv nur darüber lachen. Für ihn heißt Archivierung 100, 300 oder gar 500 Jahre sichere, geordnete und jederzeit zugreifbare Aufbewahrung von Dokumenten. Angesichts der sich ständig verändernden Technologien, immer neuer Software, Formate und Standards, eine gigantische Herausforderung für die Informationsgesellschaft.
In Deutschland haben sich für die elektronische Archivierung zwei Definitionen eingebürgert:
   
 ·
Elektronische Langzeitarchivierung 
Man spricht von Langzeitarchivierung, wenn die Informationen mindestens 10 Jahre und länger aufbewahrt und zugreifbar gehalten werden.
 ·
Revisionssichere elektronische Archivierung 
Man spricht von revisionssicherer Archivierung, wenn die Archivsystemlösung den Anforderungen des HGB §§239, 257 sowie der Abgabenordnung und den GoBS an die sichere, ordnungsgemäße Aufbewahrung von kaufmännischen Dokumenten entspricht und die Aufbewahrungsfristen von sechs bis zehn Jahren erfüllt.
Zur Erfüllung dieser Vorgaben wurden Archivsysteme bestehend aus Datenbanken, Archivsoftware und Speichersystemen geschaffen, die in Deutschland von zahlreichen Herstellern und Systemintegratoren angeboten werden. Diese Systeme basieren meistens auf dem Ansatz über eine Referenzdatenbank mit den Verwaltungs- und Indexkriterien auf einen externen Speicher zu verweisen, in dem die Dokumentobjekte gehalten werden. Diese so genannte Referenz-Datenbank-Architektur war notwendig, um große Mengen von Informationen von den zwar schnellen aber teueren Online-Speichern in separate Archivspeicher auszulagern. Die Datenbank erlaubt über den Index dabei jederzeit das Dokument wieder zu finden und mit einem entsprechenden Anzeigeprogramm dem Anwender bereitzustellen. In den Frühzeiten dieser Technologie handelte sich meistens um sehr geschlossene, eigenständige Systeme, die praktisch zu „Inseln“ in der IT-Landschaft führten. Heute gliedern sich Archivsysteme in die IT-Infrastruktur ein, werden direkt von Bürokommunikations- und Fachanwendungen bedient und stellen diesen Anwendungen auch die benötigten Informationen zur Verarbeitung und Anzeige wieder zur Verfügung. In beiden Fällen war es für den Anwender unerheblich, wo seine Information wie gespeichert worden war. Die Archivspeichersysteme und die Speicherorte seiner Dokumente waren für ihn intransparent. Die Diskussion um das „richtige“ Speichermedium führten dann meistens nur die IT-Fachleute, Projektmitarbeiter und Rechtsabteilungen wenn es um die Auswahl und Einführung eines elektronischen Archivsystems ging.
Anforderungen an ein elektronisches Archivsystem
Elektronische Archivsysteme zeichnen sich durch folgende eigenständige Merkmale aus:
   
 ·
programmgestützer, direkter Zugriff auf einzelne Informationsobjekte, landläufig auch Dokumente genannt, oder Informationskollektionen, z.B. Listen, Container mit mehreren Objekten etc.
 ·
Unterstützung verschiedener Indizierungs- und Recherchestrategien, um auf die gesuchte Information direkt zugreifen zu können
 ·
Einheitliche und gemeinsame Speicherung beliebiger Informationsobjekte, vom gescannten Faksimile über Word-Dateien bis hin zu komplexen XML-Strukturen, Listen oder ganzen Datenbankinhalten
 ·
Verwaltung von Speichersystemen mit nur einmal beschreibbaren Medien einschließlich dem Zugriff auf Medien die sich nicht mehr im Speichersystem direkt befinden
 ·
Sicherstellung der Verfügbarkeit der gespeicherten Informationen über einen längeren Zeitraum, der Jahrzehnte betragen kann
 ·
Bereitstellung von Informationsobjekten unabhängig von der sie ursprünglich erzeugenden Anwendung auf verschiedenen Clienten und mit Übergabe an andere Programme
 ·
Unterstützung von „Klassen-Konzepten“ zur Vereinfachung der Erfassung durch Vererbung von Merkmalen und Strukturierung der Informationsbasis
 ·
Konverter zur Erzeugung von langfristig stabilen Archivformaten und Viewer zur Anzeige von Informationsobjekten, für die die ursprünglich erzeugende Anwendung nicht mehr zur Verfügung steht
 ·
Absicherung der gespeicherten Informationsobjekte gegen unberechtigten Zugriff und gegen Veränderbarkeit der gespeicherten Information
 ·
Übergreifende Verwaltung unterschiedlicher Speichersysteme, um z.B. durch Zwischenspeicher (Caches) schnellen Zugriff und zügige Bereitstellung der Informationen zu gewährleisten
 ·
Standardisierte Schnittstellen, um elektronische Archive als Dienste in beliebige Anwendungen integrieren zu können
 ·
Eigenständige Widerherstellungsfunktionalität (Recovery), um inkonsistent gewordene oder gestörte Systeme aus sich heraus verlustfrei wieder aufbauen zu können
 ·
Sichere Protokollierung von allen Veränderungen an Strukturen und Informationsobjekten, die die Konsistenz und Wiederauffindbarkeit gefährden können und dokumentieren, wie die Informationen im Archivsystem verarbeitet wurden
 ·
Unterstützung von Standards für die spezielle Aufzeichnung von Informationen auf Speichern mit WORM-Verfahren, für gespeicherte Dokumente und für die Informationsobjekte beschreibende Meta-Daten um eine langfristige Verfügbarkeit und die Migrationssicherheit zu gewährleisten
All diese Eigenschaften sollten deutlich machen, dass es nicht um hierarchisches Speichermanagement oder herkömmliche Datensicherung geht. Elektronische Archivsysteme sind eine Klasse für sich, die als nachgeordnete Dienste heute in jede IT-Infrastruktur gehören.
Speichertechnologien für die Archivierung
Bei den Speichertechnologien muss man heute eine Trennung zwischen der Verwaltungs- und Ansteuerungssoftware einerseits und den eigentlichen Medien andererseits machen. Herkömmliche magnetische Speichermedien gelten als nicht geeignet für die elektronische Archivierung, da die gespeicherten Informationen jederzeit geändert und überschrieben werden können. Dies betrifft im besonderen Maße Festplatten, die von Betriebssystemen dynamisch verwaltet werden. Magnetische Einflüsse, „Head-Crashs“ und andere Risiken wiesen den Festplatten die Rolle der reinen Onlinespeicher zu. Bei Magnetbändern kam neben der Löschbarkeit hinzu, dass diese hohen Belastungen und Abnutzungen sowie magnetischen Überlagerungen bei zu langer Aufbewahrung unterliegen. In den 80er Jahren wurden daher spezielle digital-optische Speichermedien entwickelt, die in ihrem Laufwerk mit einem Laser berührungsfrei nur einmal beschrieben werden können. Diese Speichertechnologie bezeichnet man als WORM „Write Once, Read Many“. Die Speichermedien selbst waren durch ihre physikalischen Eigenschaften gegen Veränderungen geschützt und boten eine wesentliche höhere Lebensdauer als die bis dahin bekannten magnetischen Medien. In diese Kategorie von Speichermedien fallen heute folgende Typen:
   
 ·
CD-WORM 
Nur einmal beschreibbare Compact Disk Medien mit ca. 650 MegaByte Speicherkapazität. Die Speicheroberfläche im Mediums wird beim Schreiben irreversibel verändert. CD-Medien sind durch die ISO 9660 standardisiert und kostengünstig. Die Qualität mancher billiger Medien ist aber für eine Langzeitarchivierung als nicht ausreichend zu erachten. Für Laufwerke und Medien gibt es zahlreiche Anbieter. Die Ansteuerung der Laufwerke wird von den Betriebssystemen direkt unterstützt.
 ·
DVD-WORM 
Ähnlich wie die CD wird bei der DVD die Speicheroberflächen irreversibel im Medium verändert. DVD sind derzeit noch nicht einheitlich genormt und bieten unterschiedliche Speicherkapazitäten zwischen 4 und 12 GigaByte. Beim Einsatz für die Archivierung ist daher darauf zu achten, das Laufwerk und Medien den Anforderungen der langzeitigen Verfügbarkeit gerecht werden. Es gibt auch hier zahlreiche Anbieter und die meisten Laufwerke werden auch direkt von den gängigen Betriebssystemen unterstützt.
 ·
5¼“ WORM 
Bei diesen Medien und Laufwerken handelt es sich um die traditionelle Technologie, die speziell für die elektronische Archivierung entwickelt wurde. Die Medien befinden sich in einer Schutzhülle und sind daher gegen Umwelteinflüsse besser gesichert, als CD und DVD, die für den Consumer-Markt entwickelt wurden. Die Medien werden mit einem Laser beschreiben und bieten eine äußerst hohe Verfälschungssicherheit. Der derzeitige Stand der Technik sind sogenannte UDO-Medien, die einen blauen Laser verwenden und eine Speicherkapazität von 50 GigaByte bieten. Zukünftig ist mit noch deutlich höheren Kapazitäten je Medium zu rechnen. Solche Laufwerke und Medien werden von Unternehmen wie Plasmon und HP angeboten. Nachteilig ist, dass Medien der vorangegangenen Generationen von 5¼“-Medien in den neuen Laufwerken nicht verwendet werden können. Von diesen sind noch mehrere verschiedene Technologien am Markt verfügbar. Für den Anschluss von 5 ¼“-Laufwerken ist spezielle Treibersoftware notwendig.
Für die Verwaltung und Nutzung der Medien sind sogenannte Jukeboxen, Plattenwechselautomaten, gebräuchlich. Diese stellen softwaregestützt die benötigten Informationen von Medien bereit. Die Software ermöglicht es in der Regel auch, Medien mit zu verwalten, die sich nicht mehr in der Jukebox befinden und auf Anforderung manuell zugeführt werden müssen. Die Software zur Ansteuerung von Jukeboxen wird direkt in die Archivsoftware integriert aber auch als unabhängige Ansteuerungssoftware angeboten. Zum Anschluss von Jukeboxen bedient man sich in der Regel eigener Server, die auch die Verwaltung und das Caching übernehmen. Inzwischen können solche Systeme aber auch als NAS Network attached Storage oder integriert in SAN Storage Area Networks genutzt werden. Die Software ermöglicht dabei respektable Zugriffs- und Bereitstellungszeiten, die im Regelfall ein ausreichendes Antwortzeitverhalten garantieren.
Neben diese klassischen Archivspeicher, die auf rotierenden, digital-optischen Wechselmedien basieren, treten inzwischen zwei weitere Technologien:
   
 ·
CAS Content Adressed Storage 
Hierbei handelt es sich um Festplattensysteme, die durch spezielle Software die gleichen Eigenschaften wie ein herkömmliches WORM-Medien erreichen. Ein Überschreiben oder der Ändern der Information auf dem Speichersystem wird durch die Kodierung bei der Speicherung und die spezielle Adressierung verhindert. Bei diesen Speichern handelt es sich um abgeschlossene Subsysteme, die allerdings nahezu wie herkömmliche Festplattensysteme direkt in die IT-Umgebung integriert werden können. Solche Systeme sind derzeit noch relativ teuer und werden von wenigen Herstellern wie EMC (Centera) oder NetApps angeboten. Sie bieten Speicherkapazitäten mit hoher Performance im TeraByte-Bereich.
 ·
WORM-Tapes 
WORM-Tapes sind Magnetbänder, die durch mehrere kombinierte Eigenschaften ebenfalls die Anforderungen an ein herkömmliches WORM-Medium erfüllen. Hierzu gehören spezielle Bandmedien sowie geschützte Kasetten und besondere Laufwerke, die die Einmalbeschreibbarkeit sicherstellen. Besonders in Rechenzentren, in denen Bandroboter und Librarysysteme bereits vorhanden sind, stellen die WORM-Tapes eine einfach zu integrierende Komponente für die Langzeitarchivierung dar. Die vorhandene Steuersoftware kann mit den Medien umgehen und auch entsprechendes Umkopieren und Sichern automatisieren. Solche Laufwerke und Bandmedien werden z.B. von StorageTek, Sony, IBM und anderen angeboten.
Besonders für größere Unternehmen und Verwaltungen mit Rechenzentren stellen Festplatten- oder WORM-Tape-Archive eine Option dar, da sie sich einfach in den laufenden Betrieb integrieren lassen.
Rechtliche und regulative Vorgaben
Das Thema Archivierung und Langzeitspeicherung hat in den letzten Jahren besonders durch rechtliche und regulative Vorgaben an Bedeutung gewonnen. Die Gleichbehandlung von digitalen Dokumenten mit elektronischer Signatur wie herkömmlichen Papierdokumente, Der Sarbanes-Oxley-Act in den USA, der die Archivierung von E-Mails erforderlich macht, die Diskussion um die Archivierung steuerrelevanter Daten entsprechend den GDPdU in Deutschland. Im Rahmen dieser gesetzlichen Anforderungen stellte sich häufig die Frage nach dem „richtigen“ Speichermedium. Traditionelle WORM-Platten, die physisch nur einmal beschreibbar sind, erhoben den Anspruch die einzig richtigen Medien zu sein. Die Hersteller von Festplattensystemen und WORM-Tapes konterten. Grundsätzlich gilt jedoch, dass Gesetze und Verordnungen medienneutral sind (oder sein sollten), da angesichts der langfristigen Aufbewahrungszeiträume auch Technologiewechsel berücksichtigt werden müssen. Das richtige Medium gibt es daher nicht. Das Verfahren der Archivierung muss geschlossen und sicher sein. Dies geht über die Frage der Laufwerke und Medien hinaus und bezieht auch die organisatorischen Prozesse mit ein.
Ein wichtiges Thema in diesem Umfeld ist auch die Migration. Sie stellt unter Umständen ein Risiko dar, wenn die Informationen nicht nachweislässlich unverändert, vollständig und weiterhin uneingeschränkt wieder findbar von einer Systemlösung auf eine andere migriert werden. Originalität und Authentizität können durch eine Migration in Frage gestellt werden. Anderseits zwingt der technologische Wandel die Anwender auf neue Speicher- und Verwaltungskomponenten rechtzeitig zu wechseln, um die Information verfügbar zu halten. Die Migration ist daher bereits bei der Ersteinrichtung eines Archiv- und Speichersystems zu planen, um ohne Risiko und Aufwand den Wechsel vollziehen zu können. Kontrollierte, verlustfreie, „kontinuierliche Migration“ ist die eine Lösung, Information über Jahrzehnte und Jahrhunderte verfügbar zu halten. Das Thema Migration wurde durch die Veränderungen des Marktes aktuell wieder häufig diskutiert. Der Wegfall von Anbietern und Produkten ist keine Katastrophe, kein Einzelschicksal, sondern in der freien Marktwirtschaft der Regelfall. Wer ein Archivsystem einführt muss sich daher von Anbeginn an mit dem Thema Migrationsplanung beschäftigen.
Die Software macht die Musik!
Entscheidend für den Einsatz von Speichertechnologien ist inzwischen die Software geworden. Sie sichert unabhängig vom Medium die Unveränderbarkeit der Information, sie ermöglicht den schnellen Zugriff und sie verwaltet gigantische Speichermengen. Bisher waren elektronische Archive eine spezielle Domäne der Archivsystemanbieter. Nunmehr wird aber die Speichertechnologie selbst immer intelligenter. Systemmanagement- und Speicherverwaltungssoftware wie Legato, CYA oder Tivoli verwalten inzwischen auch die elektronischen Archive. Zusätzlich kann immer noch ein herkömmliches Archiv-, Records- Management- oder Content-Management-System für die inhaltliche Strukturierung, die Ordnung, Erschließung und Bereitstellung der Informationen eingesetzt werden. Die Speichersystemanbieter rüsten jedoch auf. Ihr Ziel ist es, Archivspeicher als Infrastruktur betriebssystemnah und für alle Anwendungen gleich bereitzustellen. Der neue Trend heißt ILM Information Lifecycle Management. Besonders das Versprechen, das ILM Migrationen unnötig macht oder automatisiert, weckt bei vielen Anwendern Interesse. Der Anspruch an ILM ist dabei deutlich jenseits des herkömmlichen HSM, Hierarchisches-Speicher-Management, angesiedelt. Es geht zunehmend um die Software zur Verwaltung des gesamten Lebenszyklus von Information, es geht um Lösungsangebote anstelle von reiner Speicherhardware.
Durch die Übernahme von Legato und Documentum hat EMC den Markt für Dokumenten-Technologien in Bewegung gebracht. EMC war das erste Unternehmen, das überhaupt in der Lage war, Festplattenspeicher als Archiv anzubieten. EMC hat sich durch die beiden Aufkäufe und die Entwicklung von Centera vom reinen Speicherhardwareanbieter zum ILM-Lösungsanbieter entwickelt. Inzwischen hat ebenfalls Network Appliance, auch durch den Aufkauf von Spinnaker Software, ein ähnliches Produkt geschaffen wie Centera, dennoch entwickelt sich der Markt zur Spielwiese der großen Anbieter. IBM ist traditionell in der Lage mit den eigenen Festplatten und Systemen als auch mit den Softwaresuiten Tivoli, WebSphere und DB2 (hier ist der ContentManager angesiedelt) ein vollständiges ILM Information-Lifecycle- als auch ECM Enterprise-Content-Management-Portfolio anzubieten. FileNet besitzt ein ähnlich breit gefächertes Angebot und rüstet sich durch die Anbindung der Network Appliances Komponenten für den Wettlauf. Auch der neu entstandene Riese im ECM-Markt, OpenText, kann durch seine Akquisitionen wie Gauss, IXOS und SER eGovernment inzwischen mitreden. Besonders IXOS spielt hier eine Schlüsselrolle. Speichersystemanbieter wie Hitachi Data Systems (HDS), sicher aufgeschreckt durch Centera und den Verkauf von Legato an EMC, aber auch StorageTek suchten die Nähe zu IXOS um durch Kooperation das Lösungsportfolio oberhalb der reinen Speichertechnologie auszubauen. Damit dringen die ursprünglichen Hardwaresystemanbieter zunehmend in den Markt für DRT Document Related Technologies ein, der bereits einer starken Konsolidierung unterliegt. Auch andere große Anbieter wie SUN nähern sich dem Thema Archivierung. SUN bietet mit SAM-FS eine Middleware an, die herkömmliche Referenz-Datenbank-Architekturen von Archivsystemen überflüssig macht. Netzwerksoftware- und Infrastrukturanbieter im SAN-Bereich denken inzwischen ebenfalls über Angebote zum Thema Archivierung nach. Die ständig wachsende Informationsmenge und regulative Vorgaben durch Gesetze, Verordnungen und Branchenvorschriften machen aus der ursprünglichen Nische elektronische Archivierung einen übergreifenden IT-Trend. Elektronische Archivierung wird zur IT-Infrastruktur. ILM Information Lifecycle Management beginnt den Markt für Dokumenten- und Content-Management zu unterwandern. Ob die neuen Technologien allerdings auch den Erwartungen der Archivare von 100 oder mehr Jahren Verfügbarkeit gerecht werden, können wir nicht mehr erleben.
© PROJECT CONSULT Unternehmensberatung GmbH 1999 - 2016 persistente URL: http://newsletter.pc.qumram-demo.ch/Content.aspx?DOC_UNID=ed55c28fe4cc4ee0002571e9004a9698