Folksonomy als “Übergangslösung” zum SemWeb
9. Januar 2008, 08:00 Uhr RSS 2.0, Kommentar schreiben, Trackback
Vorweg muss erklärt werden, dass ich unter dem Begriff “Semantik” die Lehre der Wortbedeutung verstehe (ich hoffe das ist wissenschaftlich richtig). Die Semantik, als Teilgebiet der Linguistik, beschäftigt sich also mit dem Sinn von Wörtern und Wortkombinationen (sprich Sätzen). Genau dies ist heute durch Computer nicht realisierbar, da diese Bedeutungsinterpretation (noch) nicht durch Algorithmen abzubilden ist. Eine derartige Leistung kann nur durch das menschliche Gehirn erbracht werden.
Eine Offenbarung zu diesem Thema ist für mich das Buch “The long tail” von Chris Anderson. Ein zusammenfassendes Fazit des Buches ist: “Mache alles verfügbar und hilf mir, es zu finden.“. Dabei bezieht sich das Mache alles verfügbar auf die grundlegende Nischentheorie des Buchs. Der Rest des Satzes (”und hilf mir es zu finden.“) aber hat es in sich, denn die heute verfügbaren Hilfen, etwas im Internet zu finden, sind noch ziemlich dürftig. Das Gros der Content- oder Produktanbieter verfährt immer noch nach dem Prinzip “Content is king”. Auch Google, Yahoo, Wikipedia und die üblichen Verdächtigen gehören mit zum Gros.
Chris Anderson ist da aber schon viel weiter und ruft das Zeitalter des “Context is king” aus. In meinen Augen absolut richtig. Es gibt nur noch das Problem der technischen Realisierung zu lösen. Dazu gibt es diverse Ansätze.
Der erste und vermutlich Bekannteste wird schon seit geraumer Zeit von Tim Berners-Lee in Form des SemWebs propagiert. In diesem Videointerview erklärt er ausführlich seine Vision. Letztendlich wird angestrebt, die vorhandenen Spezifikationen des W3C um semantische Tags zu erweitern. Den aktuellen Stand kann man unter W3C Semantic Web Activity einsehen.
Ein weiterer Ansatz wird in Form der sogenannten “Mikroformate” verfolgt. Zu diesem Thema schreibt Benedikt Köhler, Autor des Blogs viralmythen:
“Wer sich in Web2.0-Kreisen bewegt, ist sicher schon einmal auf den Begriff “microformat” gestoßen. Was verbirgt sich dahinter? Im wesentlichen geht es hier um einfache, offene Datenformate, die sowohl maschinen- als auch menschenlesbar sein wollen.” Die ausführliche Abhandlung des Themas findet sich hier.
Der nächste Ansatz geistert schon seit einiger Zeit als Neologismus durch die Webwelt: Taggen. Jeder kann mit diesem Begriff etwas anfangen, aber kann auch jeder damit umgehen? Eine hilfreiche Erklärung liefert Markus Tressl, der sich neben seiner Berufstätigkeit mit der Thematik Suchen und Finden auseinandersetzt.
Bleiben mir noch zwei Punkte zu erwähnen.
Erstens gibt es zahlreiche Portale, die sich mit der Thematik erfolgsversprechend auseinandersetzen. Eine Liste der 10 wichtigsten Aktivitäten findet sich hier.
Zweitens gibt es den Ansatz des Gemeinschaftlichen Indexieren (Folksonomy). So wie es auf Wikipedia definiert ist und durch Chris Anderson interpretiert wird (Artikel ist vom 04.07.2005, was man als visionär bezeichnen kann) ist es in meinen Augen der vielversprechendste Ansatz, bevor Maschinen in der Lage sein werden semantisch zu “denken”.
Kommentar:
Bei allen Ansätzen das Internet semantisch zu machen, kommt dieselbe Vorgehensweise zum Einsatz. Inhalte werden mittels Metaauszeichnungen verknüpft, um eine Contextrelevanz herzustellen. In meine Augen ist die Problematik dabei, dass die Inhalte der Metaauszeichnungen - wie immer die technische Umsetzung aussieht - von (wenigen) Menschen gefüllt werden. Und schon ist man wieder am Ausgangspunkt, denn ich bin sicher, das die Tags die ich einem Content geben würde, sich von den Tags anderer User stark unterscheiden würden. Das ist also keine Hilfe es zu finden.
Als Übergangslösung zum SemWeb wie ich es verstehe, käme daher nur eine Folksonomy mit Schwarmintelligenz in Frage. Dazu müssten möglichst viele User ein und denselben Inhalt taggen. Die Schnittmenge aller vergebenen Tags, würde dann den Content einer breiteren Userschaft suchtechnisch näher bringen und somit auffindbar machen.
Wir werden sehen und suchen.

Am 9. Januar 2008 um 13:21 Uhr
Hallo Herr Backhaus,
dieser “Aufsatz” ist natürlich ein absolutes Highlight. ! Meinen Kommentar formuliere ich nach Durchsicht der umfangreichen Dokumentation.
Vielen Dank und die allerbesten Wünsche
Horst Bressem
Am 9. Januar 2008 um 13:31 Uhr
Danke Herr Bressem,
bin auf Ihren weiteren Kommentar gespannt.
Am 10. Januar 2008 um 03:24 Uhr
Hallo Herr Backhaus,
die von Ihnen beschriebene neue Internet-Generation macht deutlich, das die digitale Ausrichtung der Geschäftsmodelle über Sein oder Nichtsein entscheiden wird.
Die angekündigte, verbesserte Suchsystematik und die kommenden mobilen Web-Applikationen werden derartige Leistungssteigerungen zur Folge haben, dass Wirtschaftsunternehmen wie Individuen gar keine andere Wahl haben, wie diese modernen Standarts zu übernehmen.
Die Frage ist, ob in Deutschland genügend unternommen wird, um die Bewußtseinsbildung und Wissensvermittlung voran zu bringen.
Sie haben ja schon auf den erheblichen Unterschied zu Japan hingewiesen.
Am 10. Januar 2008 um 09:14 Uhr
Hallo Herr Bressem,
Sie liegen genau richtig. Auch wenn die Anstrengungen in Deutschland noch nicht zu erkennen sind, so glaube ich doch, dass sich einiges tut, wie man an den zahlreichen Startups im Jahre 2007 sehen kann.
Ich hoffe die Macher haben alle Naisbitt und Anderson gelesen, um auch das theoretische Wissen hinter Ihren Tun zu haben.