20090226 (Teil 2) \  Gastbeiträge \  RDF: Das neue XML?
RDF: Das neue XML?
Gastbeitrag von Stefan Ukena, Wissenschaftlicher Mitarbeiter eGovernment und Semantic Web,  
German University in Cairo
 E-Mail stefan.ukena@gmx.de Webseite: http://stefanukena.de 
Stefan
Ukena war von 1998 bis 2001 Mitglied des PROJECT CONSULT Teams.
Jeder kennt mittlerweile die drei Buchstaben: XML, aber bei genauerem Hinsehen stellt sich häufig heraus, dass falsche Vorstellungen verbunden damit werden, was XML leisten kann und was nicht. Ein Standard mit scheinbar ähnlicher Zielsetzung hat, von vielen unbemerkt, 2004 erfolgreich seinen Lauf durch die Gremien des W3C beendet und ist damit zu einer W3C-Empfehlung geworden: RDF1 (das Resource Description Framework, in etwa: Rahmenwerk zur Beschreibung von Ressourcen). RDF hat damit denselben Standardisierungsstatus wie das ebenfalls vom W3C standardisierte XML aus dem Jahr 19982.  Im letzten Jahr fand RDF zunehmend Beachtung auch außerhalb der kleinen Community des W3C. Für IT-Entscheider und Anwender wird RDF in den nächsten Monaten in Form von „semantischen Applikationen“ oder „semantischen Meta-Daten“ verstärkt zum Thema werden. Dieser Artikel beantwortet die Fragen: Was ist RDF, was ist der Unterschied zu XML und wann sollte RDF eingesetzt werden? Zunächst eine Rekapitulation der Zielsetzungen von XML:
XML trat an, eine Bresche in das Dickicht der Datenaustauschformate zu schlagen und es hat viele Probleme gelöst: Es stellt für Schnittstellenentwickler eine einheitliches Basisvokabular zur Verfügung, mit dessen Hilfe man Datenaustauschformate definieren kann. Zusammen mit Unicode gehören Kodierungsinkompatibilitäten nicht mehr zu den großen Problemen in diesem Bereich. XML wurde als Datenaustauschformat entwickelt und soll die Kommunikation von Systemen auf syntaktischer Ebene vereinfachen. Vereinfacht gesagt: XML definiert eine Syntax und eine Menge  an Bausteinen, aus dem sich jeder sein eigenes Datenaustauschformat zusammenstellen kann. Zusätzlich gibt es den Standard „XML Schema“, mit dessen Hilfe man das eigene Datenaustauschformat maschinenlesbar dokumentieren kann, einschließlich einiger grundlegender Datentypen. Das so definierte Datenaustauschformat kann von jeder beliebigen XML-fähigen Software verarbeitet werden.
Das mag zunächst nach der Lösung aller Interoperabilitätsprobleme klingen. Man muss allerdings genau hinsehen, was hier mit „verarbeiten“ gemeint ist. Tatsächlich werden die Probleme nämlich nur auf eine andere Ebene verschoben. Mithilfe von XML kann ein Computer zwar „verstehen“, dass ein Datum etwas anderes ist als eine Zahl. Aber die unterschiedliche Bedeutung zweier Zahlen lässt sich damit nicht formulieren: der Jahresumsatz und der Quartalsumsatz werden für einen Computer alleine durch Verwendung von XML nicht wirklich sinnvoll zu verarbeiten sein.3  Wenn man also im Zusammenhang von XML von automatischer Verarbeitung spricht, ist damit vornehmlich das problemlose Lesen und Schreiben von Daten gemeint.
Was ist RDF?
Das W3C positioniert RDF als einen zentralen Baustein der kommenden Generation des Internets, dem sog. Semantic Web4. Sinn und Zweck von RDF ist es, Wissen auf eine Art und Weise darzustellen, die automatisierte Verarbeitung durch Computer ermöglicht. Es handelt sich bei RDF also nicht vorrangig um ein Datenaustauschformat wie bei XML, sondern um eine Technologie zur Wissensrepräsentation. Die Grundidee von RDF ist der von XML verwandt, aber dennoch eine andere. Die enge Verwandtschaft und gewisse Überscheidungen im Anwendungsbereich haben auf diesem Gebiet zu einiger Verwirrung geführt. So wurde RDF zeitweise als Nachfolger von XML missverstanden.
Was ist Unterschied zwischen XML und RDF?
Bei RDF handelt es sich nicht um ein Datenaustauschformat sondern um ein Modell für den Datenaustausch. Wenn Sie diesen Unterschied verstehen, dann wissen Sie bereits mehr über RDF und XML als die meisten Experten. Diese Unterscheidung wird häufig übersehen, weil sie in der täglichen Arbeit keine große Rolle zu spielen scheint; schließlich definiert auch XML implizit ein Datenmodell. Warum ist diese Unterscheidung dennoch relevant? Weil hierdurch die größten Missverständnisse über das Verhältnis von RDF zu XML entstehen. RDF ist nämlich unabhängig von einem Datenformat definiert, während XML genau dies ist: ein Datenformat. Man kann also Daten nicht im „RDF-Format“ speichern, sondern muss sich hierzu eines der verfügbaren Speicherformate für RDF bedienen. Das XML-Format ist eine mögliche Variante RDF-Daten zu speichern (auch „serialisieren“ genannt), andere sind Turtle5  und N-Triples6. Hieraus darf man gerade nicht folgern, dass RDF und XML äquivalent sind.
Kompliziert wird die Sache dadurch, dass XML ebenfalls ein Datenmodell zugrunde liegt, welches jedoch nicht explizit definiert wurde. Dieses Datenmodell unterscheidet sich grundlegend vom RDF-Datenmodell. In der Praxis führt dies zu Vor-, aber auch zu Nachteilen. Beispielsweise ist die Verwendung der im XML-Umfeld angesiedelten Abfragesprache XQuery im Zusammenhang mit RDF nicht empfehlenswert; stattdessen sollte man die Abfragesprache SPARQL7 verwenden, die den Besonderheiten des RDF-Datenmodells Rechnung trägt. RDF hat eine Reihe von Eigenschaften, die besonders im Zusammenhang mit der Erzeugung von Metadaten vorteilhaft sind. Hierzu gehört, dass es in RDF leicht möglich ist, jegliche Art von Daten zu beschreiben. Vorraussetzung dafür ist, dass die Daten durch eine eindeutige Kennung nach dem URI/IRI-Standard identifizierbar sind. Für Webseiten ist dies in der Regel durch ihre eindeutige URL der Fall.
Für welche Anwendungsszenarien ist RDF besonders geeignet?
Der Einsatz von RDF empfiehlt sich, wenn eine oder mehrere der folgenden Bedingungen erfüllt sind:
   
 ·
Daten müssen organisationsübergreifend durch Metadaten beschrieben werden
 ·
Es muss auf organisationsübergreifende Datenbestände zugegriffen werden
 ·
Organisationsübergreifende Datenbestände müssen integriert werden
Wenn es sich bereits um Web-basierte Anwendungen handelt, ist eine Umstellung auf oder Ergänzung um RDF-Daten technisch nicht schwierig. So gibt es beispielsweise frei verfügbare Werkzeuge, die RDF-Beschreibungen aus einer relationalen Datenbank erzeugen und so die Daten anderen RDF-basierten Anwendungen zugänglich machen.
Im Internet gibt es eine Reihe von Anwendungen, die RDF einsetzen, veröffentlichen und / oder verarbeiten können. Zu den bekanntesten gehört der Online-Dienst OpenCalais8 der Nachrichtenagentur Reuters. Es handelt sich dabei um einen Web-Service, der beliebige (z. Zt. nur englische) Texte automatisiert um RDF-Beschreibungen ergänzt, beispielsweise um Verweise auf zusätzliche Informationen zu Firmen und Branchen. Die von OpenCalais erzeugten RDF-Beschreibungen verweisen dabei auf offene RDF-basierte Datenquellen wie DBPedia9.
Dieser Artikel hat nur einen kleinen Einblick in die RDF-Technologie geben. Es wurde deutlich, dass RDF kein Nachfolger von XML ist, sondern eine sinnvolle Ergänzung für bestimmte Anwendungsfälle. RDF wird mit der Entwicklung im Bereich von semantischen Technologie, vor allem im Zusammenhang mit der Weiterentwicklung des Internets zu einem „Internet der Daten“, weiter an Bedeutung gewinnen. Einen guten Überblick über aktuelle Entwicklungen rund um RDF und das Semantic Web bieten die Seiten des W3C unter http://www.w3.org/2001/sw. (SU)
 


1
In dieser Einführung zum Thema wird zugunsten der Verständlichkeit und Prägnanz die Bezeichnung RDF synonym für die RDF-Familie verwendet, d.h. für RDF und RDF-Schema.
2
Ein erster Entwurf zu RDF wurde bereits 1999 vom W3C vorgelegt. Dieser wurde dann aber noch einmal vollständig überarbeitet und erst 2004 zu einer Empfehlung.
3
Dass dies dennoch funktioniert liegt, nicht an XML sondern an der zusätzlichen Geschäftslogik, die entsprechende Programme besitzen. Hier hat schlicht und ergreifend ein Programmierer das nötige Wissen „hineinprogrammiert“.
4
Die Verwirrung um diesen Begriff ist groß. Einen guten Überblick liefern die Seiten des W3C zum Thema:  http://www.w3.org/2001/sw/
5
6
7
8
9
Weitere Kapitel
© PROJECT CONSULT Unternehmensberatung GmbH 1999 - 2016 persistente URL: http://newsletter.pc.qumram-demo.ch/Content.aspx?DOC_UNID=ab8ccb17db3b4b0b002575a30063574e