20050309 \  Artikel \  Elektronische Archivierung & Dokumentenmanagement in der öffentlichen Verwaltung (Teil 2)
Elektronische Archivierung & Dokumentenmanagement in der öffentlichen Verwaltung (Teil 2)
von Dr. Ulrich Kampffmeyer, Geschäftsführer und Principal Consultant, und Stefan Meinhold, Seniorberater bei der der PROJECT CONSULT Unternehmensberatung GmbH. Teil 1 des Artikels erschien i m Newsletter 20050218Newsletter 20050218.
   
 8.
Elektronische Archivierung
Der Begriff „Elektronische Archivierung' steht für die unveränderbare, langzeitige Aufbewahrung elektronischer Information. Für die elektronische Archivierung werden in der Regel spezielle Archivsysteme eingesetzt. Der Begriff Elektronische Archivierung fasst im Deutschen unterschiedliche Komponenten zusammen, die im angloamerikanischen Sprachgebrauch separat als "Records Management", "Storage" und "Preservation" bezeichnet werden. Der wissenschaftliche Begriff eines Archivs und der Archivierung ist inhaltlich nicht identisch mit dem Begriff, der von der Dokumentenmanagementbranche verwendet wird.
Der Begriff der elektronischen Archivierung wird daher sehr unterschiedlich benutzt. Während heute Unternehmen schon Aufbewahrungsfristen von 10 Jahren für handelsrechtlich und steuerlich relevante Daten und Dokumente als nur sehr schwierig umsetzbar sehen, wird in historischen Archiven von einer sicheren, geordneten und jederzeit zugreifbaren Aufbewahrung von Informationen mit Speicherzeiträumen von 100, 200 oder gar 300 Jahre gesprochen. Angesichts der sich ständig verändernden Technologien, immer neuer Software, Formate und Standards, eine gigantische Herausforderung für die Informationsgesellschaft.
Archivierung ist kein Selbstzweck. Die Aufbewahrung, Erschließung und Bereitstellung von Information ist eine unabdingbare Voraussetzung für die Arbeitsfähigkeit moderner Verwaltungen. Mit dem exponentiellen Wachstum elektronischer Information wachsen die Probleme der langzeitigen Aufbewahrung obwohl moderne Softwaretechnologien wesentlich besser geeignet sind, Informationen zu verwalten, als dies herkömmlich mit Papier, Aktenordnern und Regalen möglich war. Immer mehr Information entsteht digital und die Ausgabe als Papier ist nur noch eine mögliche Repräsentation des ursprünglichen elektronischen Dokuments. Durch den Einsatz elektronischer Signaturen erhalten elektronische Dokumente den gleichen Rechtscharakter wie ursprünglich manuell unterzeichnete Schriftstücke. Solche digitalen Dokumente existieren rechtskräftig nur noch in elektronischer Form.
   
 8.1.
Definitionen
Durch die internationale Normung gibt es inzwischen grundsätzliche Definitionen und Anforderungen an die elektronische Archivierung:
   
 ·
ISO 17421 
OAIS Open Archive and Information System
In Deutschland haben sich für die elektronische Archivierung zwei Definitionen eingebürgert:
   
 ·
Elektronische Langzeitarchivierung 
Man spricht von Langzeitarchivierung, wenn die Informationen mindestens 10 Jahre und länger aufbewahrt und zugreifbar gehalten werden.
Der Begriff Langzeitarchivierung ist im Prinzip ein "weißer Schimmel", da Archivierung den Langzeitaspekt bereits impliziert.
   
 ·
Revisionssichere elektronische Archivierung 
Man spricht von revisionssicherer Archivierung, wenn die Archivsystemlösung den Anforderungen des HGB §§ 239, 257 sowie der Abgabenordnung und den GoBS an die sichere, ordnungsgemäße Aufbewahrung von kaufmännischen Dokumenten entspricht und die Aufbewahrungsfristen von sechs bis zehn Jahren erfüllt.
Die Anforderungen an die elektronische Archivierung werden aus dem Handels-gesetzbuch und der Abgabenordnung abgeleitet. Sie sind jedoch allgemeingültig zu betrachten:
   
 ·
Ordnungsmäßigkeit
 ·
Vollständigkeit
 ·
Sicherheit des Gesamtverfahrens
 ·
Schutz vor Veränderung und Verfälschung
 ·
Sicherung vor Verlust
 ·
Nutzung nur durch Berechtigte
 ·
Einhaltung der Aufbewahrungsfristen
 ·
Dokumentation des Verfahrens
 ·
Nachvollziehbarkeit
 ·
Prüfbarkeit
Diese Kriterien sind fachlich definiert und bedürfen der Interpretation, wenn es um die Umsetzung in technischen Systemen geht.
   
 8.2.
Zehn Merksätze zur revisionssicheren
Archivi
erung
Die folgenden allgemeinen 10 Merksätze zur revisionssicheren elektronischen Archivierung stammen von Verband Organisations- und Informationssysteme e.V. aus der Publikation „Code of Practice. Grundsätze der elektronischen Archivierung“:
   
 ·
Jedes Dokument muss unveränderbar archiviert werden
 ·
Es darf kein Dokument auf dem Weg ins Archiv oder im Archiv selbst verloren gehen
 ·
Jedes Dokument muss mit geeigneten Retrievaltechniken wieder auffindbar sein
 ·
Es muss genau das Dokument wiedergefunden werden, das gesucht worden ist
 ·
Kein Dokument darf während seiner vorgesehenen Lebenszeit zerstört werden können
 ·
Jedes Dokument muss in genau der gleichen Form, wie es erfasst wurde, wieder angezeigt und gedruckt werden können
 ·
Jedes Dokument muss zeitnah wiedergefunden werden können
 ·
Alle Aktionen im Archiv, die Veränderungen in der Organisation und Struktur bewirken, sind derart zu protokollieren, dass die Wiederherstellung des ursprünglichen Zustandes möglich ist
 ·
Elektronische Archive sind so auszulegen, dass eine Migration auf neue Plattformen, Medien, Softwareversionen und Komponenten ohne Informationsverlust möglich ist
 ·
Das System muss dem Anwender die Möglichkeit bieten, die gesetzlichen Bestimmungen (BDSG, HGB/AO etc.) sowie die betrieblichen Bestimmungen des Anwenders hinsichtlich Datensicherheit und Datenschutz über die Lebensdauer des Archivs sicherzustellen
   
 8.3.
Umsetzung der Anforderungen in elektronischen Archivsystemen
Zur Erfüllung dieser Vorgaben wurden Archivsysteme bestehend aus Datenbanken, Archivsoftware und Speichersystemen geschaffen, die in Deutschland von zahlreichen Herstellern und Systemintegratoren angeboten werden. Diese Systeme basieren meistens auf dem Ansatz über eine Referenzdatenbank mit den Verwaltungs- und Indexkriterien auf einen externen Speicher zu verweisen, in dem die Informationsobjekte gehalten werden. Diese sogenannte Referenz-Datenbank-Architektur war notwendig, um große Mengen von Informationen von den zwar schnellen aber teueren Online-Speichern in separate Archivspeicher auszulagern. Die Datenbank erlaubt über den Index dabei jederzeit das Dokument wieder zu finden und mit einem entsprechenden Anzeigeprogramm dem Anwender bereitzustellen. In den Frühzeiten dieser Technologie handelte es sich meistens um sehr geschlossene, eigenständige Systeme, die praktisch zu „Inseln“ in der IT-Landschaft führten. Heute gliedern sich Archivsysteme als nachgeordnete Dienste in die IT-Infrastruktur ein, werden direkt von Bürokommunikations- und Fachanwendungen bedient und stellen diesen Anwendungen auch die benötigten Informationen zur Verarbeitung und Anzeige wieder zur Verfügung. Für den Anwender ist es dabei unerheblich, wo die benötigte Information gespeichert ist, Archivspeichersysteme und die Speicherorte der Dokumente sind für ihn unerheblich. Die Diskussion um das „richtige“ Speichermedium für die elektronische Archivierung führten meistens nur die IT-Fachleute, Projektmitarbeiter und Rechtsabteilungen wenn es um die Auswahl und Einführung eines elektronischen Archivsystems ging.
   
 8.4.
Funktionale Anforderungen an ein elektronisches Archivsystem
Elektronische Archivsysteme zeichnen sich durch folgende eigenständige Merkmale aus:
   
 ·
programmgestützer, direkter Zugriff auf einzelne Informationsobjekte, landläufig auch Dokumente genannt, oder Informationskollektionen, z.B. Listen, Container mit mehreren Objekten etc.
 ·
Unterstützung verschiedener Indizierungs- und Recherchestrategien, um auf die gesuchte Information direkt zugreifen zu können
 ·
Einheitliche und gemeinsame Speicherung beliebiger Informationsobjekte, vom gescannten Faksimile über Word-Dateien bis hin zu komplexen XML-Strukturen, Listen oder ganzen Datenbankinhalten
 ·
Verwaltung von Speichersystemen mit nur einmal beschreibbaren Medien einschließlich dem Zugriff auf Medien die sich nicht mehr im Speichersystem direkt befinden
 ·
Sicherstellung der Verfügbarkeit der gespeicherten Informationen über einen längeren Zeitraum, der Jahrzehnte betragen kann
 ·
Bereitstellung von Informationsobjekten unabhängig von der sie ursprünglich erzeugenden Anwendung auf verschiedenen Clienten und mit Übergabe an andere Programme
 ·
Unterstützung von „Klassen-Konzepten“ zur Vereinfachung der Erfassung durch Vererbung von Merkmalen und Strukturierung der Informationsbasis
 ·
Konverter zur Erzeugung von langfristig stabilen Archivformaten und Viewer zur Anzeige von Informationsobjekten, für die die ursprünglich erzeugende Anwendung nicht mehr zur Verfügung steht
 ·
Absicherung der gespeicherten Informationsobjekte gegen unberechtigten Zugriff und gegen Veränderbarkeit der gespeicherten Information
 ·
Übergreifende Verwaltung unterschiedlicher Speichersysteme, um z.B. durch Zwischenspeicher (Caches) schnellen Zugriff und zügige Bereitstellung der Informationen zu gewährleisten
 ·
Standardisierte Schnittstellen, um elektronische Archive als Dienste in beliebige Anwendungen integrieren zu können
 ·
Eigenständige Widerherstellungsfunktionalität (Recovery), um inkonsistent gewordene oder gestörte Systeme aus sich heraus verlustfrei wieder aufbauen zu können
 ·
Sichere Protokollierung von allen Veränderungen an Strukturen und Informationsobjekten, die die Konsistenz und Wiederauffindbarkeit gefährden können und dokumentieren, wie die Informationen im Archivsystem verarbeitet wurden
 ·
Unterstützung von Standards für die spezielle Aufzeichnung von Informationen auf Speichern mit WORM-Verfahren, für gespeicherte Dokumente und für die Informationsobjekte beschreibende Meta-Daten um eine langfristige Verfügbarkeit und die Migrationssicherheit zu gewährleisten
 ·
Unterstützung von automatisierten, nachvollziehbaren und verlustfreien Migrationsverfahren
All diese Eigenschaften sollten deutlich machen, dass es nicht um hierarchisches Speichermanagement oder herkömmliche Datensicherung geht. Elektronische Archivsysteme sind eine Klasse für sich, die als nachgeordnete Dienste heute in jede IT-Infrastruktur gehören.
   
 8.5.
Der Unterschied zwischen Datensicherung und Archivierung
Auch im Umfeld der Datensicherung wird häufig von Archivierung gesprochen, obwohl Zweck und Verfahren von einer datenbankgestützten Archivierung im traditionellen Sinn deutlich unterscheidbar sind. Datensicherungssysteme dienen im allgemeinen ausschließlich zur Sicherung großer Datenmen-gen, auf die nur im Notfall durch Spezialisten zur Rekonstruk-tion des ursprünglichen Laufzeitsystems zugegriffen wird. Kennzeichnend ist der Zugriff auf Dateien oder größere Daten-sets und nicht auf einzelne Daten oder Objekte. In diese Kate-gorie fallen auch Systeme, die für die Auslagerung nicht mehr benötigter Daten eingesetzt werden. Bei diesen Daten kann es sich um solche handeln, die nur aus Gründen der Aufbewah-rungspflicht gesichert werden. Wesentliche Charakteristika von Datensicherungssystemen sind daher:
   
 ·
Sicherung zum Zwecke der Wiederherstellung im Störungs- oder Verlustfall für Daten aus Filesystemen und operativen Anwendungen,
 ·
statisches, nur nach Entstehungsdatum der Informationen sortiertes, sequentielles Archiv ohne Änderungsdienst,
 ·
automatische Generierung zu archivierender Informationen durch die Systeme ohne Indizierung,
 ·
kein direkter Zugriff von Anwendern, sondern im Bedarfs-fall Zurückspielen in die ursprüngliche Systemumgebung
 ·
Zugriff nur in Ausnahmesituationen und
 ·
nur gegebenenfalls Einsatz digitaler optischer Speicher in WORM-Technologie.
Typische Anwendungen sind etwa die Sicherung von Rechenzentren und vergleichbare Massendatenanwendungen. Auch COLD-Systeme, die nicht für die individuelle Recherche an Sachbearbeiterplätzen genutzt werden, gehören in diese Kategorie (siehe unten). Ein weiteres Anwendungsgebiet sind Datensicherungs-systeme, bei denen komplette Systemkonfigurationen ausgelagert werden. Datensicherungssysteme gewinnen außerdem im Rahmen der Protokollierung von Zugriffen und Veränderungen in Internet- und Intranet-Systemen an Bedeutung. Hier können durch den Einsatz von WORM-Speichern (siehe unten), die Informationen unveränderbar archivieren, Art und Umfang unberechtigter Zugriffe und Änderungen im System nachvollzogen werden, ohne dass ein “Hacker” die Möglichkeit hätte, seine Spuren im System zu verwischen.
Je nach Einsatzzweck eines Datensicherungssystems kann die-es unterschiedlich ausgelegt sein. Bei der Auslagerung von Datenbeständen aus Datenbanken oder Anwendungssystemen werden die zu archivierenden Daten dem Sicherungssystem übergeben. Dies kann entweder direkt oder im Rahmen eines hierarchischen Speichermanagementsystems (HSM) geschehen. Aufgabe des Datensicherungssystems ist dann, die Informationen aufzubereiten und der Verwaltung des Speichersystems zu übergeben. Da kein direkter Datenbankzugriff auf die Informationen notwendig ist, reicht in der Regel eine Verweisstruktur mit neuem Speicherort und Ursprungsanwendung inklusive Übergabebereich aus.
Viele dieser Systeme werden daher nicht auf den Einzelzugriff auf Dokumente oder Dateien ausgelegt, sondern simulieren herkömmliche Medien wie Mikrofilm-COM-Ausgabe oder sequentiell beschriebene Magnetbänder oder Magnetbandkassetten. Andere Lösungen bilden die herkömmliche Struktur eines Dateisystems auf den optischen Medien nach, so dass sich ein solches Datensicherungssystem bruchlos als unterste Stufe in ein hierarchisches Speichermanagement einfügt. Anstelle des Zugriffs über eine Datenbank tritt der übliche Weg des Zugriffs über ein Dateiverwaltungssystem. Dies erlaubt auch bestehenden Anwendungen ohne Anpassung von Clienten-Programmen auf archivierte Dateien zuzugreifen und diese wieder online zur Verfügung zu stellen.
Bei der Absicherung von Transaktionen oder der Online-Protokollierung werden Datensätze kontinuierlich und ohne Zwischenspeicherung archiviert. Weitere Anwendungen sind im Bereich der Massendatenerfassung wie zum Beispiel bei Umwelt- oder Weltraumdaten angesiedelt. Der Zugriff auf solche Informationen erfolgt in der Regel sequentiell unter Benutzung des mit gespeicherten Datums und der Uhrzeit.
Einen Sonderfall stellt die Archivierung von Dateiübermittlungen im EDI-Umfeld dar, bei der vor der Umwandlung in ein verarbeitbares Format das übermittelte Ursprungsformat für Kontroll- und Nachweiszwecke unveränderbar archiviert wird.
Für alle genannten Arten von Datensicherungssystemen sind keine Verwaltungs- und Zugriffsdatenbanken erforderlich. Da keine Online-Zugriffe erfolgen, können sie vollständig automatisiert und zeitgesteuert im Hintergrundbetrieb ablaufen. Der Rückgriff erfolgt nur mit speziellen Tools durch Personal der Systemadministration.
Charakteristisch für ein Archivsystem ist, dass die abgelegten Dokumente selten bzw. gar nicht mehr geändert werden. Im Gegensatz zu Datensicherungssystemen sind Archivsysteme für den Datenbank-gestützten, individuellen Zugriff auf einzelne Daten und Objekte ausgelegt. Entscheidend ist der direkte Zugriff über Indexmerkmale mit der Datenbank im Unter-chied zur Filesystem-orientierten Ablage im Rahmen einer Datensicherung. Es handelt sich bei Archivsystemen um eine reine Endablage, die im Laufe der Zeit kontinuierlich wächst, und auf die nur selten zugegriffen wird. Da Informationen in Archivsystemen gewöhnlich auf WORM-Medien, die nur einmal beschrieben werden können, abgelegt werden, sind sie revisionssicher.
Datensicherungssysteme und hierarchisches Speichermanagement werden inzwischen zu ILM Information-Lifecycle-Management-Systemen ausgebaut (siehen unten).
   
 8.6.
COLD-Archivierung
Strukturierte Daten aus Anwednungssystemen werden häufig in Gestalt von Reports und Listen ausgegeben. Hierfür gibt es eine spezielle Form der Archivierung, COLD, Computer Output to Laser Disk. Auch wenn es die Laserdisksysteme von Philips seit über einem Jahrzehnt nicht mehr gibt, wird der Name weiterbenutzt. Er sollte ursprünglich den Unterschied zwischen COM, Computer Output on Microfilm, und der Speicherung auf digitalen optischen Datenträgern deutlich machen.
COLD, Computer Output on Laser Disk, bezeichnet unabhängig vom Medium die automatische, regelbasierte Aufbereitung, Indizierung und Archivierung von strukturierten Ausgabedaten aus Anwendungssystemen. COLD-Systeme unterstützen die Speicherung seitenorientierter Computer-Ausgabedateien auf digitalen optischen Speichern und erlauben eine komfortable Suche, Anzeige und Ausgabe der Daten. COLD-Systeme dienen damit zur Archivierung von Dateien (Datensätze oder Druckoutput) aus operativen Anwendungen mit individuellen Zugriffsmöglichkeiten auf einzelne Datensätze oder Dokumente. Sie gehören in die Kategorie der Archivsys-teme.
Es lassen sich zwei Strategien unterscheiden:
   
 ·
Satzweise Speicherung aus Datenbank- oder operativen Anwendungen mit Indizierung jedes Satzes. Bei dieser Strategie kann jedoch die Anzahl der Indizes sehr groß werden und der Index kann fast die Größe der Objekte erreichen.
   
 ·
Listenweise Speicherung aus operativen Anwendungen mit Indizierung der Liste (Sekundärindex). Diese Strategie zieht zwar für eine Suche auf Satzebene eine aufwendigere Header- und Retrievalstrategie mit sich, bietet aber auf Grund der listenweisen Indizierung den Vorteil einer geringeren Anzahl an Primärindizes.
Daneben besteht die Möglichkeit, beide Strategien zu kombinieren und innerhalb einer Liste satzweise zu indizieren, so dass ein Zugriff auf Satzebene möglich ist und Reports je nach Bedarf ad hoc zusammengestellt werden können.
Das ursprüngliche COLD-Verfahren kann durch die Verknüpfung der Daten mit eingescannten Blankoformularen oder Hintergrundlayouts erweitert werden. Auf diese Weise kann zum Beispiel eine originaler Vordruck jederzeit reproduziert werden. Dies ermöglicht eine speicherplatzsparende einmalige Archivierung von Hintergrundlayouts zur Verknüpfung mit den eigentlichen Daten.
Probleme mit verschiedenen Layouts, die für bestimmte Dokumente zu einem bestimmten Zeitpunkt Gültigkeit haben, können entstehen, wenn kein Versionsmanagement für die Hintergrundbilder vorliegt. Die Vorteile der Ausblendung des Hintergrundes liegen in der großen Speicherplatzersparnis. Diese Reduzierung des Speicherplatzes kann jedoch nur dann genutzt werden, wenn die Vordrucke für diesen Zweck entsprechend gestaltet werden.
Die gemischte Archivierung strukturierter und unstrukturierter Daten und Dateien kann sowohl im Druckformat als auch im Imageformat erfolgen. Die Archivierung im Druckformat bietet den Vorteil, dass die Reproduktion der “Originale” weitgehend sichergestellt ist und bestimmte Druckformate wie PDF auch eine inhaltliche Suche gestatten.
Für die Archivierung im Bildformat existieren weltweit gültige Standards (wie TIFF bzw. PDF-Archive für in PDF gewandelte Dokumente) und Dokumente können als „Images“ revisionssicher archiviert werden, da sie 1:1 wieder darstellbar und druckbar sind. Auf die Dokumente kann allerdings nur über den Primärindex zugegriffen werden, eine inhaltliche Suche ist nicht möglich. Zudem können die Dokumente nicht weiterverarbeitet werden. Solche Standards gibt es für COLD nicht. Hier ist man von zahlreichen proprietären Herstellerformaten abhängig, die häufig eine Konvertierung vor der Archivierung erforderlich machen.
Bei der Archivierung im Imageformat ist nur ein Zugriff über den Primärindex möglich, die Images können zudem nicht weiterverarbeitet werden. Die Images können in diesem Fall aber revisionssicher in einem weltweiten Standard archiviert und auch 1:1 reproduziert werden. Leider ist dieses Verfahren für die Archivierung von steuerrelevanten, originär digitalen Daten nicht zulässig. Das COLD-Verfahren aber gestattet im Gegensatz zur Imagespeicherung die Bereitstellung von auswertbaren Daten.
   
 8.7.
Speichertechnologien für die elektronische Archivierung
Bei den elektronischen Speichertechnologien muss man heute eine Trennung zwischen der Verwaltungs- und Ansteuerungssoftware einerseits und den eigentlichen Speichermedien andererseits machen. Herkömmliche magnetische Speichermedien gelten als nicht geeignet für die elektronische Archivierung, da die gespeicherten Informationen jederzeit geändert und überschrieben werden können. Dies betrifft im besonderen Maße Festplatten, die von Betriebssystemen dynamisch verwaltet werden. Magnetische Einflüsse, „Head-Crashs“ und andere Risiken wiesen den Festplatten die Rolle der reinen Onlinespeicher zu. Bei Magnetbändern kam neben der Löschbarkeit hinzu, dass diese hohen Belastungen und Abnutzungen sowie magnetischen Überlagerungen bei zu langer Aufbewahrung unterliegen. In den 80er Jahren wurden daher spezielle digital-optische Speichermedien entwickelt, die in ihrem Laufwerk mit einem Laser berührungsfrei nur einmal beschrieben werden können. Diese Speichertechnologie bezeichnet man als WORM „Write Once, Read Many“. Die Speichermedien selbst waren durch ihre physikalischen Eigenschaften gegen Veränderungen geschützt und boten eine wesentliche höhere Lebensdauer als die bis dahin bekannten magnetischen Medien.
In diese Kategorie von Speichermedien fallen heute folgende Typen:
   
 ·
CD-WORM 
Nur einmal beschreibbare Compact Disk Medien mit ca. 650 MegaByte Speicherkapazität. Die Speicheroberfläche im Medium wird beim Schreiben irreversibel verändert. CD-Medien sind durch die ISO 9660 standardisiert und kostengünstig. Die Qualität mancher billiger Medien ist aber für eine Langzeitarchivierung als nicht ausreichend zu erachten. Für Laufwerke und Medien gibt es zahlreiche Anbieter. Die Ansteuerung der Laufwerke wird von den Betriebssystemen direkt unterstützt.
 ·
DVD-WORM 
Ähnlich wie die CD wird bei der DVD-WORM die Speicheroberflächen irreversibel im Medium verändert. DVD sind derzeit noch nicht einheitlich genormt und bieten unterschiedliche Speicherkapazitäten zwischen 4 und 12 GigaByte. Beim Einsatz für die Archivierung ist daher darauf zu achten, das Laufwerk und Medien den Anforderungen der langzeitigen Verfügbarkeit gerecht werden. Es gibt auch hier zahlreiche Anbieter und die meisten Laufwerke werden auch direkt von den gängigen Betriebssystemen unterstützt.
 ·
5¼“ WORM 
Bei diesen Medien und Laufwerken handelt es sich um die traditionelle Technologie, die speziell für die elektronische Archivierung entwickelt wurde. Die Medien befinden sich in einer Schutzhülle und sind daher gegen Umwelteinflüsse besser gesichert, als CD und DVD, die für den Consumer-Markt entwickelt wurden. Die Medien werden mit einem Laser beschreiben und bieten eine äußerst hohe Verfälschungssicherheit. Der derzeitige Stand der Technik sind so genannte UDO-Medien, die einen blauen Laser verwenden und eine Speicherkapazität von 50 GigaByte bieten. Zukünftig ist mit noch deutlich höheren Kapazitäten je Medium zu rechnen. Nachteilig ist, dass Medien der vorangegangenen Generationen von 5¼“-Medien in den neuen Laufwerken nicht verwendet werden können. Von diesen sind noch mehrere verschiedene Technologien am Markt verfügbar. Für den Anschluss von 5 ¼“-Laufwerken ist spezielle Treibersoftware notwendig.
Für die Verwaltung und Nutzung der Medien sind so genannte '''Jukeboxen''', Plattenwechselautomaten, gebräuchlich. Diese stellen softwaregestützt die benötigten Informationen von Medien bereit. Die Software ermöglicht es in der Regel auch, Medien mit zu verwalten, die sich nicht mehr in der Jukebox befinden und auf Anforderung manuell zugeführt werden müssen. Die Software zur Ansteuerung von Jukeboxen wird direkt in die Archivsoftware integriert aber auch als unabhängige Ansteuerungssoftware angeboten. Zum Anschluss von Jukeboxen bedient man sich in der Regel eigener Server, die auch die Verwaltung und das Caching übernehmen. Inzwischen können solche Systeme aber auch als NAS Network attached Storage oder integriert in SAN Storage Area Networks genutzt werden. Die Software ermöglicht dabei respektable Zugriffs- und Bereitstellungszeiten, die im Regelfall ein ausreichendes Antwortzeitverhalten garantieren.
Neben diese klassischen Archivspeicher, die auf rotierenden, digital-optischen Wechselmedien basieren, treten inzwischen zwei weitere Technologien:
   
 ·
CAS Content Adressed Storage 
Hierbei handelt es sich um Festplattensysteme, die durch spezielle Software die gleichen Eigenschaften wie ein herkömmliches WORM-Medium erreichen. Ein Überschreiben oder der Ändern der Information auf dem Speichersystem wird durch die Kodierung bei der Speicherung und die spezielle Adressierung verhindert. Bei diesen Speichern handelt es sich um abgeschlossene Subsysteme, die allerdings nahezu wie herkömmliche Festplattensysteme direkt in die IT-Umgebung integriert werden können. Sie bieten Speicherkapazitäten mit hoher Performance im TeraByte-Bereich.
 ·
WORM-Tapes 
WORM-Tapes sind Magnetbänder, die durch mehrere kombinierte Eigenschaften ebenfalls die Anforderungen an ein herkömmliches WORM-Medium erfüllen. Hierzu gehören spezielle Bandmedien sowie geschützte Kasetten und besondere Laufwerke, die die Einmalbeschreibbarkeit sicherstellen. Besonders in Rechenzentren, in denen Bandroboter und Librarysysteme bereits vorhanden sind, stellen die WORM-Tapes eine einfach zu integrierende Komponente für die Langzeitarchivierung dar. Die vorhandene Steuersoftware kann mit den Medien umgehen und auch entsprechendes Umkopieren und Sichern automatisieren.
Besonders für größere Verwaltungen und Rechenzentren stellen Festplatten- oder WORM-Tape-Archive eine Option dar, da sie sich einfach in den laufenden Betrieb integrieren lassen.
   
 8.8.
Strategien zur Sicherstellung der Verfügbarkeit archivierter Information
Für die Verfügbarhaltung von archivierten Informationen gibt es unterschiedliche Strategien, die bei der Planung eines Archivsystems bereits berücksichtigt werden müssen:
   
 ·
Standardisierung 
Wesentliche Voraussetzung für die langfristige Verfügbarmachung elektronischer Information ist die Einhaltung von Standards. Zu berücksichtigen sind Aufzeichnungsformate, Metadaten, Medien und die Dateiformate der Informationsobjekte selbst. Schon bei der Erzeugung von Daten sollte die langfristige Speicherung berücksichtigt werden. Langzeitig stabile Formate sollten bevorzugt verwendet werden. Eigenschaften eines solchen Formats sollten eine weite Verbreitung, eine offene Spezifikation (Norm) oder die spezielle Entwicklung als Format zur langfristigen Datenspeicherung sein. Beispiele sind XML-Dateien, TIFF und PDF-Archive.
 ·
Migration 
Eine Methode zur Sicherstellung der Verfügbarkeit ist die Migration von Information in eine neue Systemumgebung. Sie stellt unter Umständen ein Risiko dar, wenn die Informationen nicht nachweislich unverändert, vollständig und weiterhin uneingeschränkt wieder findbar von einer Systemlösung auf eine andere migriert werden. Originalität und Authentizität können durch eine Migration in Frage gestellt werden. Anderseits zwingt der technologische Wandel die Anwender auf neue Speicher- und Verwaltungskomponenten rechtzeitig zu wechseln, um die Information verfügbar zu halten. Die Migration ist daher bereits bei der Ersteinrichtung eines Archiv- und Speichersystems zu planen, um ohne Risiko und Aufwand den Wechsel vollziehen zu können. Kontrollierte, verlustfreie, „kontinuierliche Migration“ ist zur Zeit die wichtigste Lösung, Information über Jahrzehnte und Jahrhunderte verfügbar zu halten. Das Thema Migration wurde durch die Veränderungen und die Konsolidierung des Dokumentenmanagement-Marktes mit dem Verschwinden von zahlreichen Anbietern häufig diskutiert. Der Wegfall einzelner Produkte zwingt zur Migration auf andere Formate, manchmal mit Hilfe eines eigenen Migrationsprogramms. Wer ein Archivsystem einführt, muss sich daher von Anbeginn an mit dem Thema Migrationsplanung beschäftigen.
 ·
Emulation 
In der wissenschaftlichen Welt wird noch ein zweites Modell ähnlich stark diskutiert: Emulation. Emulation heißt, die Eigenschaften eines älteren Systems so zu simulieren, dass damit auch Daten dieses Systems mit neueren Computern und Betriebssystemen wieder genutzt werden können. Beispiele gibt es einige, zum Beispiel bei Computerspielen oder Apple-Computern. Diese Lösungsstrategie wird im Bereich der langfristigen Datenspeicherung aber noch nicht in größerem Ausmaß eingesetzt. Nachteile sind, dass der Aufwand künftiger Emulationsschritte nicht planbar ist und bei einem zu großen Paradigmenwechsel eines Tages vielleicht gar nicht mehr durchführbar ist. Diese Nachteile gelten in ähnlicher Form auch für nicht rechtzeitig durchgeführte Migrationen.
 ·
Kapselung 
Als Vorbereitung für Emulation eignet sich insbesondere das Kapselung-Verfahren. Dabei werden zusätzlich mit der zu bewahrenden Datei oder dem Informationsobjekt auch noch die Software, mit der man es visualisieren und reproduzieren kann, sowie die zugehörigen Metadaten in einer "Kapsel" gespeichert. Damit sind alle für die Nutzung notwendigen Informationen in Zukunft sofort zuzsammenhängend gespeichert. Durch diese Methode können die zu speichernden Objekte sehr groß werden, ohne dass jedoch vollständig sichergestellt ist, dass die mitarchivierte Software auch in zukünftigen Betriebssystemumgebungen lauffähig ist.
 ·
Konversion zur Laufzeit 
Lassen sich die Formate der zu speichernden Informationsobjekte nicht kontrollieren und auf wenige Langzeitformate einschränken, sind Konverter und Viewer systemseitig ständig vorzuhalten, die ältere Formate in anzeigbare Formate beim Aufruf der Objekte wandeln. Dies führt mittelfristig zu einer Vielzahl von bereitzuhaltenden Konvertern und Viewern, für die eine eigenständige Verwaltung erforderlich ist, um zu einem älteren Informationsobjekt den jeweils passenden, aktuellen Konverter aufrufen zu können. Die Konversion zur Laufzeit unterscheidet sich von der Emulation dadurch, dass nicht eine ältere Umgebung aufgerufen, sondern das Objekt für die aktuelle Umgebung gewandelt wird. Spezielle Eigenschaften von Formaten, elektronische Signaturen und Digital-Rights-Management-Komponenten können hierbei, ebenso wie bei den anderen Verfahren, zu Problemen führen.
   
 8.9.
Weiterentwicklung der elektronischen Archivierung
Entscheidend für den Einsatz von Archiv-Speichertechnologien ist inzwischen die Software geworden. Sie sichert unabhängig vom Medium die Unveränderbarkeit der Information, sie ermöglicht den schnellen Zugriff und sie verwaltet gigantische Speichermengen. Bisher waren elektronische Archive eine spezielle Domäne der Archivsystemanbieter. Nunmehr wird aber die Speichertechnologie selbst immer intelligenter. Systemmanagement- und Speicherverwaltungssoftware verwalten inzwischen auch die elektronischen Archive. Zusätzlich kann immer noch ein herkömmliches Archiv-, Records-Management- oder Content-Management-System für die inhaltliche Strukturierung, die Ordnung, Erschließung und Bereitstellung der Informationen eingesetzt werden. Die Speichersystemanbieter rüsten ihre Produkte mit immer weiteren Komponenten auf. Ziel ist, Archivspeicher als Infrastruktur betriebssystemnah und für alle Anwendungen gleich bereitzustellen: Dieser Trend wird seit 2003 ILM Information Lifecycle Management genannt und soll die elektronische Archivierung einschließen. Besonders das Versprechen, das ILM Migrationen unnötig macht oder automatisiert, weckt bei vielen Anwendern Interesse. Der Anspruch an ILM ist dabei deutlich jenseits des herkömmlichen HSM, Hierarchisches-Speicher-Management, angesiedelt. Es geht zunehmend um die Software zur Verwaltung des gesamten Lebenszyklus von Information anstelle von reiner Speicherhardware. Elektronische Archivierung wird als nachgeordneter Dienst eingesetzt, der in Enterprise-Content-Management-Lösungen integriert wird, aber als Archivierungskomponente allen Anwendungen zur Verfügung steht, deren Informationen langfristig und sicher aufbewahrt werden müssen.
(Anm.d.Red.: Der Artikel wird im nächsten Newsletter fortgesetzt.)
© PROJECT CONSULT Unternehmensberatung GmbH 1999 - 2016 persistente URL: http://newsletter.pc.qumram-demo.ch/Content.aspx?DOC_UNID=ff764f7b34a646a6002571e9004e3b6e