
Mit zunehmender Konsolidiung von Daten und Datenbanken durch das WWW ist ein Wissenspool entstanden, der es zusehends erschwert, eine präzise Suche durchzuführen. Wenn man sich nicht gerade mit Suchoperatoren für Google oder entsprechend anderen Suchmaschinen befasst hat, dann wird einem bei jedem mehr oder minder bekannten Begriff eine Lawine von Suchergebnissen entgegengeschleudert.
Dank Web 2.0 (Ein Artikel von mir dazu folgt noch) wurde eine ganze Informationsflut ausgelöst, die sich vor allem in tausenden neuer Weblogs äussert. Durch die vielen Cross- und Backlinks, Trackbacks und Blogrolls ergibt so eine Blog eine wahre Fundgrube für Webcrawler und die Bots der Suchmaschinen. Entsprechend hoch ist das Google ranking dieser Blogs, zumal Pingseiten wie Technorati und Co. diesen Trackback-Effekt nochmals enorm verstärken.
Wenn man schnell ein hohes Google-Ranking erreichen möchte, dann geht das am einfachsten mit einem Blog.
Google seinerseits unterstützt diese Bewegung; nicht nur duch ihr eigenes Blogsystem Blogger.com, sondern auch mit dem Bloghoster Bloghost.com. Natürlich werden die dort erstellten Blogs duch Google mit Vorliebe indiziert.
Dazu kommt noch eine andere Erfindung des Web 2.0: Die Wikis. Diese freie (Web)Enzyklopädie wird von der OpenSource-Community gehegt und gepflegt (mehr oder minder). So umfasst alleine der deutsche Ableger der Wikipedia über 300 000 Artikel zu allen nur erdenklichen Themen.
Kurzum: Es herrscht Chaos, wenn es darum geht, gezielt zu suchen oder sich an ein Ergebnis heranzuarbeiten. Und genau hier will die Semantik ansetzen: Musste man bis jetzt immer genau wissen, was man sucht und welche Suchbegriffe man zu verwenden hat, dann konnte man nur hoffen, dass die Anzahl der Suchtreffer sich nicht im 5-stelligen Bereich befand. Gab man zu viele Sucheinschränkungen an, dann wurde oft kein Ergebnis oder nichts geeignetes gefunden.
The Semantic Web provides a common framework that allows data to be shared and reused across application, enterprise, and community boundaries. It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners. It is based on the Resource Description Framework (RDF), which integrates a variety of applications using XML for syntax and URIs for naming.
Das W3C beschäftigt sich seit einiger Zeit mit dem Thema der semantischen Netze. Es wurde z.B. das Projekt Annotea der Semantic Web Advanced Development (SWAD) des W3C gestartet.
Doch auch die genannte Wikipedia befasst sich mit dem Thema und präsentiert hier einen Ansatz. Die Fernuni Hagen beschreibt in einer Präsentation die Wissensrepräsentationsparadigma der mehrschichtigen erweiterten semantischen Netze (das sogenannte MultiNet-Paradigma).

Die Universität von Amsterdam stellt hier mit einem Java-Applet dar, wie die Semantischen Netze funktionieren: Durch die Verknüpfung von Wörtern auf Sinnebene können assoziative Bezugspukte hergestellt werden. Das geschieht entweder durch hierarchische Verknüpfung (Katze ist ein Sägetier), Kausation (Unfall führt zu kaputtem Auto), Synonymie (Tempo heisst auch Papiertaschentuch) und Antonymie (lebendig ist das Gegenteil von tot).
Durch diese Abhängigkeiten ist es nun möglich assoziative Sinnstrukturen zu erstellen, mit denen der Mensch weit besser klarkommt, als z.B. mit hierarchischen Ordnerstrukturen/Listen. Ausserdem wird das Lernen vereinfacht, da sich Zusammenhänge erschliessen und Wissen einfach transferiert werden kann (Synergiemanagement).
Ich denke, dass es noch etwas dauern wird, bis diese Semantischen Netze soweit ausgereift sind, dass wir unsere Websuche damit erleichtern können, jedoch ist es mit Sicherheit eine weit effektivere Methode, Wissen zu konsolidieren, als es im Moment duch Tagging versucht wird.
{ 2 trackbacks }
{ 0 comments… add one now }