von Dr. Ulrich Kampffmeyer, Geschäftsführer der PROJECT CONSULT Unternehmensberatung, Hamburg, Ulrich.Kampffmeyer@PROJECT-CONSULT.com. Einführung
Kurz nach der Erfindung der Schrift wurden die ersten Dokumente geschaffen, kurz darauf entstand der Bedarf, sie aufzubewahren. Das Archiv wurde erfunden. In der Antike wurden wichtige Dokumente der Stadt und ihrer Bürger im Archaion, dem Rathaus, verwahrt. Hiervon leitet sich unser Begriff „Archiv“ ab. Bisher orientierten sich Archive an den physischen Gegebenheiten der aufzubewahrenden Aufzeichnungen – Papier, Tontafeln, Papyri, Buchenholztafeln, Schnurbündel, Bücher, Ordner usw. Seit zwei Generationen, knapp 50 Jahren, verändert sich diese Tradition. Immer mehr Information und Dokumente werden digital geboren. Die elektronische Version ist das Original und der Ausdruck auf Papier ist nur noch eine mögliche Form der Repräsentation. Immer mehr Dokumente sind nicht mehr zur Aufbewahrung in Papierform geeignet. Durch den Einsatz elektronischer Signaturen erhalten elektronische Dokumente den gleichen Rechtscharakter wie ursprünglich manuell unterzeichnete Schriftstücke. Solche digitalen Dokumente existieren rechtskräftig nur noch in elektronischer Form. Die elektronische Archivierung wird immer wichtiger.
Der Begriff elektronische Archivierung steht für die unveränderbare, langzeitige Aufbewahrung elektronischer Information. Für die elektronische Archivierung werden in der Regel spezielle Archivsysteme eingesetzt. In Deutschland werden mit dem Begriff elektronische Archivierung unterschiedliche Komponenten zusammengefasst, die im angloamerikanischen Sprachgebrauch separat als "Records Management", "Storage" und "Preservation" bezeichnet werden. Der wissenschaftliche Begriff eines Archivs und der Archivierung ist zudem inhaltlich nicht identisch mit dem Begriff, der von der Dokumentenmanagementbranche oder bei der Datensicherung verwendet wird.
Archivierung ist kein Selbstzweck. Die Aufbewahrung, Erschließung und Bereitstellung von Information ist eine unabdingbare Voraussetzung für die Arbeitsfähigkeit moderner Unternehmen und Verwaltungen. Mit dem exponentiellen Wachstum elektronischer Information wachsen die Probleme der langzeitigen Aufbewahrung obwohl moderne Softwaretechnologien wesentlich besser geeignet sind, Informationen zu verwalten, als dies herkömmlich mit Papier, Aktenordnern und Regalen möglich war. Diese Entwicklungen zwingen inzwischen jedes Unternehmen sich verstärkt mit dem Thema elektronische Archivierung auseinander zu setzen.
Definitionen rund um die elektronische Archivierung
In Deutschland haben sich für die elektronische Archivierung zwei Definitionen eingebürgert:
Elektronische Langzeitarchivierung
Man spricht von Langzeitarchivierung, wenn die Informationen mindestens 10 Jahre und länger aufbewahrt und zugreifbar gehalten werden. Der Begriff Langzeitarchivierung ist im Prinzip ein Pleonasmus, da Archivierung den Langzeitaspekt bereits impliziert. Er wird aber zunehmend im akademischen und im Bereich der öffentlichen Archive, Museen und Bibliotheken benutzt, um sich von den eher kurzfristiger ausgelegten Strategien der elektronischen Archivierung im kaufmännischen Bereich abzusetzen. Während heute Unternehmen schon Aufbewahrungsfristen von 10 Jahren für handelsrechtlich und steuerlich relevante Daten und Dokumente als nur sehr schwierig umsetzbar sehen, wird in historischen Archiven von einer sicheren, geordneten und jederzeit zugreifbaren Aufbewahrung von Informationen mit Speicherzeiträumen von 100, 200 oder gar 300 Jahre gesprochen. Angesichts der sich ständig verändernden Technologien, immer neuer Software, Formate und Standards, eine gigantische Herausforderung für die Informationsgesellschaft.
Revisionssichere elektronische Archivierung
Man spricht von revisionssicherer Archivierung, wenn die Archivsystemlösung den Anforderungen des Handelsgesetzbuches §§ 239, 257 HGB sowie der Abgabenordnung und den GoBS an die sichere, ordnungsgemäße Aufbewahrung von kaufmännischen Dokumenten entspricht und die Aufbe¬wahrungs¬fristen von sechs bis zehn Jahren erfüllt. Der Begriff revisionssichere Archivierung wurde vom Autor bereits 1992 geprägt und macht deutlich, dass eine es nicht möglich ist, im Vorwege Rechtssicherheit in der Archivierung zu erhalten sondern dass dies erst immer im Rahmen einer Prüfung im laufenden Betrieb nachgewiesen werden kann. Das HGB (HGB) und die Abgabenordnung (AO) geben hier die Grundlagen für die Speicherung, unabhängig ob in herkömmlichen Papierarchiven oder elektronischen Systemen, vor:
| | |
| · | Ordnungsmäßigkeit |
| · | Vollständigkeit |
| · | Sicherheit des Gesamtverfahrens |
| · | Schutz vor Veränderung und Verfälschung |
| · | Sicherung vor Verlust |
| · | Nutzung nur durch Berechtigte |
| · | Einhaltung der Aufbewahrungsfristen |
| · | Dokumentation des Verfahrens |
| · | Nachvollziehbarkeit |
| · | Prüfbarkeit |
Diese Kriterien sind fachlich definiert und bedürfen der Interpretation, wenn es um die Umsetzung in technischen Systemen geht.
Zehn Merksätze zur revisionssicheren Archivierung
Die wesentlichen Anforderungen an die elektronische Archivierung wurden in zehn Merksätzen vom VOI Verband Organisations- und Informationssysteme e.V. veröffentlicht:
| | |
| 1. | Jedes Dokument muss unveränderbar archiviert werden |
| 2. | Es darf kein Dokument auf dem Weg ins Archiv oder im Archiv selbst verloren gehen |
| 3. | Jedes Dokument muss mit geeigneten Retrievaltechniken wieder auffindbar sein |
| 4. | Es muss genau das Dokument wiedergefunden werden, das gesucht worden ist |
| 5. | Kein Dokument darf während seiner vorgesehenen Lebenszeit zerstört werden können |
| 6. | Jedes Dokument muss in genau der gleichen Form, wie es erfasst wurde, wieder angezeigt und gedruckt werden können |
| 7. | Jedes Dokument muss zeitnah wiedergefunden werden können |
| 8. | Alle Aktionen im Archiv, die Veränderungen in der Organisation und Struktur bewirken, sind derart zu protokollieren, dass die Wiederherstellung des ursprünglichen Zustandes möglich ist |
| 9. | Elektronische Archive sind so auszulegen, dass eine Migration auf neue Plattformen, Medien, Softwareversionen und Komponenten ohne Informationsverlust möglich ist |
| | |
| 10. | Das System muss dem Anwender die Möglichkeit bieten, die gesetzlichen Bestimmungen (BDSG, HGB/AO etc.) sowie die betrieblichen Bestimmungen des Anwenders hinsichtlich Datensicherheit und Datenschutz über die Lebensdauer des Archivs sicherzustellen |
Unterschiedliche Ansätze für die elektronische Archivierung
Nimmt man die Liste der Anforderungen an die elektronische Archivierung so kristallisieren sich neben organisatorischen Aufgaben auch technische Merkmale heraus wie die Sicherstellung der Integrität, der Unveränderbarkeit und der Wiederauffindbarkeit. Für die Umsetzung in elektronischen Archivsystemen dominierte früher der „Referenzdatenbank“-Ansatz, heute kommen „BlOb“-Datenbanken und „ILM“-Lösungen hinzu:
Referenzdatenbank
Beim „Referenzdatenbank“-Ansatz werden die zu archivierenden Informationsobjekte mit Metadaten indiziert, die in einer Datenbank verwaltet werden. Die Informationsobjekte selbst werden Filesystem-orientiert oder in speziellen Formaten gebündelt separat gespeichert. Von der Referenzdatenbank weist ein Pointer, eine URL oder eine andere Form der Referenz auf das separat gespeicherte Objekt. Die Suche und die Bereitstellung erfolgt ausschließlich auf Basis der Metadaten in der Index¬datenbank. Die Referenzdatenbank kontrolliert auch den Zugriff. Archivsysteme bestehend aus der Indexdatenbank, einer Archivmanagementsoftware und einem externen Speicherort stellen einen Großteil der heutigen Archivsysteme. Sie wurden in 80er Jahren des vergangenen Jahrtausends entwickelt, um Informationsobjekte wie Dokumente, Listen, Dateien etc. auf digitalen optischen Speichermedien verwalten zu können. Die Datenbank selbst bleibt klein und schnell, beliebig große Informationsmengen können extern und sogar offline verwaltet werden. In Zeiten teuerer magnetischer Festplattenspeicher ein wichtiger Ansatz.
BLOb
Neben dem Referenzdatenbankansatz gibt es schon seit geraumer Zeit die Möglichkeit, Informationsobjekte als „Binary Large Objects“, BLOb, direkt in den Feldern einer Datenbank zu speichern. Besonders Oracle favorisiert diesen Ansatz. Damit entfällt die Referenzierung auf externe Speicher und die Inhalte der Informationsobjekte können zum Teil auch direkt durchsucht werden. Skalierungs- und Verteilungsprobleme der Vergangenheit sind weitgehend überwunden, jedoch ist der Einsatz dieses Verfahrens mit nur einmal beschreibbaren Speichern problematisch, da ganze Tabellen auf diese Medien verteilt werden müssten und Probleme bei der Reorganisation sowie Performance auftreten. BLOb-Speicherung wird daher meistens nur auf Festplatten genutzt, wo es gilt, sehr vielen Anwendern viele und sehr große Objekte schnell zur Verfügung zu stellen. Dies gilt z.B. für Digital Asset Management, E-Library oder Content Management Systeme. Für die Sicherung werden die Mechanismen der Datenbank genutzt und häufig ein traditionelles Archiv- oder HSM-System zusätzlich eingesetzt, um die Anforderungen an eine elektronische, revisionssichere Archivierung zu erfüllen.
ILM Information Lifecycle Management
Unter dem neuen Schlagwort ILM Information Lifecycle Management verbergen sich unterschiedliche technologische Ansätze, besonders wenn es um die Form der Archivierung geht. ILM geht vom Ansatz aus, dass transparent unterschiedliche Speicher zur Verfügung gestellt werden, die die Information entsprechend ihrem Wert auf dem jeweils günstigsten Medium bereithalten. ILM ist eine Weiterentwicklung von HSM hierarchischem Speichermanagement. Die Verwaltung der Informationsobjekte wird von der Speichermanagementsoftware übernommen. Diese kann Informationsobjekte auch auf nur einmal beschreibbaren Speichern ablegen – sei es eine Jukebox mit digital optischen rotierenden Speichermedien, eine automatisierte Tape-Library mit nur einmal beschreibbaren WORM-Tapes oder Festplattensubsysteme, die auf einer magnetischen Einheit die Einmalbeschreibbarkeit sicherstellen. Für die Archivierung gibt es hier sehr unterschiedliche technologische Ansätze, die durch die Kombination verschiedener Middleware (z.B. IBM mit TSM Speichervirtualisierung, HP mit RISS oder SUN mit SAM-FS), Archivierungssoftware (z.B. Netapp Snaplock) und in Verbindung mit besonderen Speichern wie Bändern (WORM-Tapes wie Sony AIT oder StorageTek) und Festplatten (EMC Centera oder IBM DRT) ein sehr heterogenes Bild bieten. Noch gibt es keine standardisierten Verfahren, die eine Kompabitibilität, Voraussetzung für die Verfügbarkeit über lange Zeiträume, sicherstellen. Einen entscheidenden Unterschied gibt es zu den zuvor genannten datenbankbasierten Ansätzen: die Anwendung, die die Informationen an das ILM abgibt, muss sich auch selbst um das Wiederfinden „kümmern“. Ohne eine zusätzliche Indexdatenbank oder ein Records Management System kann eine ILM-Lösung die archivierten Objekte sonst nicht wieder bereitstellen.
Standards für die elektronische Archivierung
In der Welt der Archive, Museen und Bibliotheken setzt man sich schon sehr lange mit der Fragen der elektronischen Archivierung auseinander. Zahlreiche nationale und internationale Organisationen haben Codes of Practice, Anleitungen zum bestmöglichen Umgang mit Informationen, herausgegeben. Die Menge der Vorgaben verstellt inzwischen den Blick auf allgemeingültige Regelungen, da neben einzelnen Institutionen, Verbänden, Projekten und Standardisierungsgremien auch Regierungen Richtlinien herausgegeben haben. Im Kern ähneln sich die meisten, jedoch ist das Problem der Langzeitarchivierung über Jahrhunderte nicht gelöst. Dies betrifft sowohl die Metadaten für die Indizierung und das Verwalten wie auch Speichermedien, Schnittstellen, Formate und Systeme. Man kann sich an der Vielzahl der Dokumente orientieren – eine allgemeingültige Lösung oder gar passende Produkte gibt es noch nicht am Markt. Jedoch zeichnet es sich ab, dass sich Lösungen finden werden und dass Panik nicht angebracht ist. Jedoch wird man die ersten Jahrzehnte der elektronischen Datenverarbeitung in Archäologenkreisen zukünftig als das dunkle Zeitalter der frühen Informationskultur bezeichnen.
Rechtliche und regulative Vorgaben
Um das Thema elektronische Archivierung kommt kein Unternehmen herum. Die Gleichstellung elektronischer und papiergebundener Dokumente, der elektronische Geschäftsverkehr, der Einsatz elektronischer Signaturen – all dies macht die elektronische Archivierung unerlässlich. Im Prinzip ist nicht erklärlich, dass man in der Vergangenheit Software eingesetzt hat, die sich um die Verwaltung und Archivierung von Informationen nicht adäquat gekümmert hat. Elektronische Archivierung ist eine notwendige Infrastruktur in jeder Systemlandschaft. Besonders um die Nachvollziehbarkeit, die Vollständigkeit und die Unverändertheit von Information sicherzustellen und damit die Compliance-Anforderungen zu erfüllen setzt den Einsatz von elektronischen Archivsystemen voraus. Gesetze wie der Sarbanes-Oxley-Act bedrohen inzwischen das Management mit erheblichen Strafen, wenn die Dokumentation der geschäftlichen Tätigkeit nicht vollständig und richtig ist. Im Rahmen der Diskussion der gesetzlichen Anforderungen stellte sich häufig die Frage nach dem „richtigen“ Speichermedium. Dies ist jedoch „zu kurz gesprungen“. Medien sind nur eine Komponente der Archivierung. Software und die Nutzung spielen heute eine weitaus größere Rolle als die Frage, auf welchem Medium archiviert wird. Es geht zunehmend um die Software zur Verwaltung des gesamten Lebenszyklus von Information anstelle von reiner Speicherhardware. Elektronische Archivierung wird als nachgeordneter Dienst eingesetzt, der in Enterprise-Content-Management-Lösungen integriert wird, aber als Archivierungskomponente allen Anwendungen zur Verfügung steht, deren Informationen langfristig und sicher aufbewahrt werden müssen.
Immerhin hat die Diskussion um die rechtlichen und regulatorischen Anforderungen das Thema elektronische Archivierung in das Bewusstsein der Entscheider in den Unternehmen gerückt. Aber neben den Unternehmen darf nicht vergessen werden, dass auch in der öffentlichen Verwaltung, in Museen und Bibliotheken, bei Verlagen und Informationsanbietern sowie sogar beim Privatmann ein immer größerer Bedarf an Archivierungslösungen entsteht. Archivierung nur für Wirtschaftsunternehmen und deren kaufmännische Daten und Dokumente ist nur ein ganz kleiner Aspekt des Themas elektronische Archivierung. Elektronische Archive sind das Gedächtnis der Informationsgesellschaft. Und mit diesem Gedächtnis sind wir alle bisher sehr sträflich umgegangen. Ohne elektronische Archivierung wird die Informationsgesellschaft der Amnesie anheim fallen.
Literatur
Borghoff, U.; Rödig, P.: Scheffczyk, J.: Langzeitarchivierung. dPunkt-Verlag, 2003, ISBN 3-8986-4245-3
Calimera Guidelines: Digital Preservation. Calimera EU IST project, 2004.
ISO 14721, OAIS, Open Archive Information System. ISO International Standardization Organization 2003.
Kampffmeyer, U.; Rogalla, J.: Grundsätze der elektronischen Archivierung. VOI-Kompendium Band 3. VOI Verband Organisations- und Informationssysteme e.V., Darmstadt 1997, ISBN 3-932898-03-6
Kampffmeyer, U.: Elektronische Archivierung und Storage-Technologien. Speicherguide, 2003, Download als PDF auf der ECM-Guide-Webseite
Kampffmeyer, U.: Dokumenten-Technologien: Wohin geht die Reise?. PROJECT CONSULT, Hamburg 2003, 411 Seiten, ISBN 3-9806756-4-5