Grundlagen

Beginnen wir mit einer grundsätzlichen Betrachtung zum von mir ‘semantisches Content Management’ genannten Feld. Meine Aussagen beschreiben hier mein persönliches Verständnis, über andere Sichten oder Hinweise auf Fehler in meinem Verständnis freue ich mich immer!

Anders als bei den Ansätzen eines relationalen Systems, das die Informationen in einem vorher entworfenen Datenmodell verhältnismäßig starr ablegt und ihre Verwendungsmöglichkeit und Bedeutung damit implizit fixiert, werden bei Verwendung von Konzepten des Semantic Web die Informationsartefakte inhärent mit den für sie relevanten Eigenschaften versehen. Dies kann ungewichtet durch einfache Tags bzw. Schlüsselwörter geschehen, oder gewichtet, indem vorher (oder auch im Nachhinein) definierte Eigenschaften mit Werten versehen werten, man spricht hier von Annotation. Dies geschieht in sogenannten Triples aus Subjekt, Prädikat und Objekt. Beispiel: Nico Frieling → hat_wohnort → Gütersloh. Die w3c stellt hierfür ein standardisiertes Dateiformat zur Verfügung, das Resource Description Framework (RDF).

Es entsteht eine Wolke nicht grundsätzlich unterschiedlich gewichteter Artefakte, die rein Ihrer Eigenschaften nach abgefragt werden können. Beispiel: Nenne mir alle Mitarbeider mit Wohnort Gütersloh. Um hier eine sinnvolle Vorgabe zu machen, welche Eigenschaften für welche Artefakte sinnvoll oder auch obligatorisch sind, erstellt man eine formale Abbildung der Bedeutungen mit ihren Zusammenhängen und, so nötig, ihrem Geltungsbereich, eine sogenannte Ontologie. Auch hier gibt es ein standardisiertes Dateiformat, die Web Ontolgy Language (OWL).

Da diese Ontologien ein dem Menschen verständliches Bedeutungsmodell abbilden, kann man Abfragen gegen die Datenmenge zwar noch nicht in der Form, aber im Inhalt so stellen, wie man sie einem Menschen stellen würde. Beispiel: In welchen Bundesländern gibt es Minigolfspieler, die sich mit Semantic Web beschäftigen? Auch für diese Abfragen gibt es einen Standard, wenn auch viele Anwendungen zusätzlich sinnvolle, proprietäre Lösungen haben: die SPARQL Query Language for RDF (SPARQL).

Da die Bedeutungsebene (OWL) getrennt von der Informationsebene (RDF) ist, kann man leicht neue Ontologien auf bestehende, annotierte Datenmengen abbilden. Ebenso kann man vorliegende, strukturierte Informationen durch Mapping in eine semantische Datenwolke überführen und durch eine übergreifende Ontologie mit den vorhandenen Informationen anreichern. Ähnlich wie bei der Business Intelligence/Online Analytical Processing kann man hierdurch Verknüpfungen von Daten aus unterschiedlichen Quellen realisieren. Da hierfür keine definierten Cubes vorausgesetzt sind, kann man Informationen verständlicher und flexibler verknüpfen, aggregieren und auswerten.

Nutzt man die semantische Datenbasis zur klassischen Darstellung von Inhalten, kann man relevante Daten ohne Redundanz (natürlich abgesehen von Sicherungen) ablegen und an den notwendigen Stellen lediglich referenzieren. Dies ermöglicht es, Inkonsistenzen bereits auf konzeptioneller Ebene auszuschließen.