20020305 \  Normen & Standards \  Kompressionsverfahren in einem elektronischen Archiv
Kompressionsverfahren in einem elektronischen Archiv
Vor der Einführung eines elektronischen Archivs sind grundlegende Überlegungen notwendig. Das Archivformat ist eines der zu beachtenden Faktoren. Schließlich sollen die Dokumente aus dem elektronischen Archiv in einigen Jahrzehnten immer noch lesbar sein. Hier gilt es auf Standards zu setzen. Für Informationen, bei denen es bei der Archivierung auf den unverfälschbaren bildhaften Charakter ankommt, bieten sich neben PDF (siehe Newsletter 20020121Newsletter 20020121) die Formate TIFF und JPEG2000 an.  (JU)
  
PROJECT CONSULT Kommentar:
Mit Standards beschäftigt sich seit 1865 die International Telecommunication Union (ehemals CCITT), kurz ITU genannt. Sie ist eine Unterorganisation der UN und hat 189 Mitgliedsstaaten. Mitglieder sind die Betreibergesellschaften der nationalen Fernmeldenetze. Die ITU erstellt Normen bzw. Empfehlungen für Fernsprech-, Fernschreib- und Rechnernetze sowie für Endgeräte. Im Bereich der DRT (Document Related Technologies) sind die standardisierten TIFF-Dokumente hierbei zu beachten.
Als Archivformat wird sehr oft TIFF ausgewählt. Das TIFF Format unterliegt verschiedenen Kompressionsverfahren. Kommt auf elektronischem Wege ein Fax an, so handelt es sich dabei um ein Dokument nach ITU TIFF-Gruppe 3. Dieses Format wird bei herkömmlichen analogen Faxgeräten für die Übertragung erzeugt. Es bietet eine 1:10 Kompression an und hat damit einen geringeren Kompressionsfaktor als Gruppe 4 (1:20). Dadurch, dass bei Gruppe 3 Komprimierung unkomprimierte Referenzzeilen als Wiederaufsetzpunkte benutzt werden, ist dieses Format für die Archivierung weniger geeignet.
Bei einem Scanner wird standardmässig ein Dokument nach ITU TIFF-Gruppe 4 erzeugt. Hierbei handelt es sich um einen globalen Standard im Archivbereich. Dabei wird das Dokument zeilenweise Bildpunkt  für Bildpunkt analysiert. Dieses Verfahren ist für binäre (schwarz/weiß) Dokumente besonders gut geeignet, und es komprimiert ein TIFF verlustfrei (bei anderen Formaten können -abhängig von der Komprimierungsstufe- Details verschwinden). Es ist für die Archivierung besser geeignet.
Um ein elektronisch eingegangenes Fax ITU TIFF-Gruppe 3 und auch andere Dokumenttypen ins Archiv zu bekommen, werden diese „konvertiert“. Diese Konvertierung findet von Format X (Word, Excel, Txt, Fax-TIFF 3, etc.) in das Format ITU TIFF-Gruppe 4 statt. Hiermit wird ein unveränderliches, von der erzeugenden Anwendung unabhängiges und standardisiertes Format für die Langzeitarchivierung gewählt. Aber auch hier sollte Wert darauf gelegt werden, dass die aktuellen Gesetze bei der Einführung von komplexen DRT-Systemen mit integriertem Archiv Beachtung finden (z.B. HGB, GDPdU, etc.). So ist z.B. für buchhalterische Daten die TIFF Konvertierung ab dem 01.01.2002 ausgeschlossen.
Während das TIFF-Format die Anforderungen der letzten 16 Jahre erfolgreich erfüllen konnte, ist mit neuen Anforderungen an den Markt das noch frische JPEG2000 Format entstanden. Zu diesen Anforderungen gehören u.a. die Verarbeitung von übergroßen Bildern (mehr als 64k x 64 k Pixel), die Integration der Metadaten zur Bildbeschreibung, die Integration der Informationen zum Copyright (Watermarking) und die Erhöhung der Anzeigegeschwindigkeit durch die progressive pixelabhängige Darstellungsform.
Für die Bildkompression bei JPEG2000 setzt man Wavelets ein, die wie ein Filter wirken und den Bildinhalt in zwei Frequenzbereiche zerlegen. Um die Geschwindigkeit zu erhöhen, kommt ein mehrschrittiger, rekursiver Algorithmus zum Einsatz. Jeder Durchlauf des Filters erzeugt ein geglättetes Bild mit den niedrigen Frequenzanteilen sowie ein komplementäres mit den hohen Frequenzen. Beide erzeugten Wavelet-Koeffizienten enthalten genau die halbe Informationsmenge und ergeben zusammengesetzt wieder das Ausgangsbild. Somit gehen weder Informationen verloren noch entstehen redundante Daten. Die Filter werden abwechselnd in Zeilen- und Spaltenrichtung angewandt. Im Laufe des Verfahrens teilt der Algorithmus den Bildinhalt in immer feinere Freuqenzbänder, die sich schließlich nach den Wahrnehmungseigenschaften des Auges unterschiedlich weiterbehandeln lassen.
Diese sogenannte schnelle Wavelet-Transformation ist eine Entwicklung von Stéphane Mallat und Yves Meyer aus dem Jahr 1986 und machte das Verfahren erst praktikabel. Die Verkleinerung der Dateigrößen um den Faktor 40 ist erst durch Wavelet-Verfahren möglich, die weniger Bildfehler produzieren. Die aus über hundert Experten bestehende JPEG2000-Gruppe hat sich in den vergangenen vier Jahren die Aufgabe gemacht, einheitliche Kodierparameter und ein einheitliches Format zu definieren. Das menschliche Auge reagiert auf leichte Unschärfen bei weitem nicht so empfindlich wie auf Moirè- oder Klötzchenmuster. Deshalb sind mit Wavelets -abhängig von der Anwendung- Kompressionsfaktoren bis zu 100 möglich. Die Möglichkeit wichtige Bildteile weniger stark zu komprimieren ist ebenfalls vorhanden. JPEG2000 lässt sich so einstellen, dass bereits die ersten Kilobytes ein grobes Vorschaubild ergeben. Bei Bedarf können noch mehr Daten nachgeladen werden und das Bild wird immer feiner. Der Anwender kann die Übertragung der Daten jederzeit beenden, wenn die Darstellung seinen Qualitätsanspruch erreicht hat. Aber Achtung: es gibt zwei universelle Wavelets zur Basisversion von JPEG2000, und nur eines davon ist für die verlustfreie Kompression zuständig. Erste Viewer und Entwicklungswerkzeuge sind bereits kostenlos im Internet verfügbar.
Mit JPEG2000 sind somit höhere Kompressionsfaktoren als bei TIFF Gruppe 4 möglich. Der wesentliche Vorteil ergibt sich aber daraus, dass dieses Format eine verlustfreie Archivierung und eine verlustbehaftete Anzeige zur Steuerung der Netzwerkkapazitäten ermöglicht. (JU)
© PROJECT CONSULT Unternehmensberatung GmbH 1999 - 2016 persistente URL: http://newsletter.pc.qumram-demo.ch/Content.aspx?DOC_UNID=9e1f760f71b743ec002571e9003dc4a0