Konstanz. - Die CGK Computer Gesellschaft Konstanz (www.cgk.de), eine 100prozentige Tochter der Siemens AG, erweitert ihr Produktportfolio um Software-Komponenten zur Erfassung und Erschließung von Informationen. So soll der Flaschenhals der manuellen Indizierung überwunden werden. Mit DOKuStar hat die CGK eine Produktfamilie entwickelt, die auf unterschiedlichen Ebenen Klassifizierungen von Dokumenten ermöglicht. Der DOKuStar Index analysiert und indexiert gescannte Dokumente und liefert als Ergebnis ein selbstbeschreibendes XML-Dokument. Der erst in drei Monaten verfügbare DOKuStar Document Reader beschränkt sich nicht nur auf die Erkennung einzelner Informationen zur Vergabe von Indizes, vielmehr soll das Finden und Interpretieren von Dokumenteninhalten wie in tabellarischen Dokumenten ermöglicht werden und diese im XML-Format ausgegeben werden. Das bereits verfügbare Produkt DOKuStar Classify besteht aus drei Komponenten zur Erkennung von Dokumenttypen. Das DOKuStar Design Studio ermöglicht in einer integrierten grafischen Umgebung die Klassifizierung von Scanmustern für die Definition von Dokumentenklassen auf der Basis regulärer Ausdrücke. Die Definitionen solcher Klassen werden in einer Projektdatei gehalten, die es der zweiten Komponente DOKuStar Server ermöglicht, die eigentliche Arbeit der Klassifizierung zu erledigen. Schlägt die Klassifizierung fehl, so unterstützt DOKuStar Verfiy die manuelle Zuordnung. (RK) | |
| PROJECT CONSULT Kommentar:
|
CGK Computer Gesellschaft Konstanz ist seit langen Jahren einer der renommiertesten deutschen Anbieter im Bereich der konventionellen Belegerfassung. Die Erfahrungen der CGK in den Bereichen der Zeichenerkennung und Hardware-Entwicklung (Scanner, Belegerfasser etc.) kommen der Produktfamilie DOKuStar zu Gute. Der Sprung von der Auswertung standardisierter Belege wie z. B. im Bankenverkehr zu einer universell einsetzbaren Interpretation von Seiteninhalten ist gelungen. Die Erkennungs- und Auswertungsprogramme liefern sehr gute Ergebnisse, jedoch fehlt eigentlich der Anschluß an Datenbanken zur Verwaltung der gewonnenen Index-Merkmale und die Integration in Dokumenten-Management- und Archivsysteme zur Speicherung der Daten und Dokumente. Dokumenten-Management-Lösungen weisen eine Reihe von spezifischen Merkmalen auf, um Dokumente und Daten effizient zu verwalten, die seitens der CGK-Lösung noch nicht standardmäßig unterstützt werden. Hierzu gehört die Bildung von Klassen gleichartiger Dokumente (Dokumentenklassen, Informationsobjekt-Klassen) mit definierten Merkmalen, beschreibenden Profilen und Steuerungsfunktionalität. Auch ist die Ausrichtung auf gescanntes Schriftgut im Vergleich zu anderen automatischen Klassifikationssystemen heute zu eng. Wettbewerber bieten Komponenten, die auch E-Mails, Textdokumente und andere schwach strukturierte Informationen nach den gleichen Kriterien auswerten können wie ein gescanntes oder gefaxtes Image. Hier fehlen CGK offenbar noch Erfahrungen. Dies wird jedoch durch das Vertriebskonzept von CGK aufgefangen. Die CGK erreicht durch ihre Partnerschaft-Strategie in der DOKuStar Produktlinie den schnelleren Anschluß an Dokumenten-Management und Archivsysteme, nicht zuletzt durch die Verwendung von XML als Ausgabeformat. CGK sieht dabei das eigene Produkt als eine Basiskomponente innerhalb einer Gesamtlösung, die von großen Systemintegratoren erstellt wird. Da die automatische Klassifikation von Dokumenten eine der Basistechnologien für Knowledge Management ist, interessieren sich derzeit zahlreiche DRT-Anbieter für die neue Produktlinie und das Unternehmen. (RK)