Social Tagging, Waxmann 2008 @mprove

Zusammenfassung

Tagging-Systeme bieten eine neue Form der Organisation von digitalen Informationen. Der Artikel beleuchtet das Phänomen aus formaler Sicht und zeigt auf, welche Möglichkeiten sich für die Anwender ergeben, wenn sie mit sozialen Objekten interagieren und ihre persönlichen Keywords zur bedeutungstragenden Ebene namens Folksonomy aggregiert werden.

Einleitung

Seit der Mensch die Sprache entwickelt hat, bezeichnet er die Dinge in seinem Umfeld mit Worten. Er benutzt die Sprache, um sich mit seinen Mitmenschen zu unterhalten und um über die Welt nachzudenken. Neben der Sprache entwickelte sich die Schrift, die das gesprochene Wort unabhängig vom Redner repräsentiert und mit der Nachrichten vom Sender über Distanz und Zeit zu einem Empfänger übermittelt werden können. Briefe und E-Mails sind zwei Beispiele für eine Form von Nachrichten, die von einem Absender über eine gewisse Entfernung zu einem Adressaten transportiert werden. Im Falle von Briefen dauert die Zustellung wenige Tage – E-Mails erreichen Ihr Ziel in der Regel in Sekunden.

Notizen sind knappe Nachrichten, die man primär an sich selbst schreibt, um sich zu einem späteren Zeitpunkt an etwas zu erinnern. Etiketten oder Post-It-Notes sind dabei praktische Möglichkeiten, Begriffe direkt an den Gegenständen anzuheften, zu denen sie in Bezug stehen. In »Things that make us smart« (1993) bezeichnet Don Norman diese Art mentaler Hilfsmittel als kognitive Artefakte, da sie die Erinnerungsleistung extern unterstützen und so das Gehirn entlasten. Dem Objekt werden Attribute zugeordnet, die man sich für den Moment nicht mehr merken muss, an die man aber erinnert wird, wenn man die Worte auf dem Notizzettel liest.

Es ist verwunderlich, dass Tagging als elektronisches Äquivalent der Post-Its so lange auf sich warten ließ, da es ein kognitives Instrument darstellt, mit dem der Anwender die Informationen im weltweiten Datennetz für sich ordnen kann.

Das Attribuieren von Webseiten fügt den Daten eine persönliche Bedeutungsebene hinzu, die im Laufe der Zeit Strukturen bildet, die ohne dieses Hilfsmittel kaum zu erkennen gewesen wären. Zusätzlich bietet das gemeinschaftliche Taggen von Web-Ressourcen die Möglichkeit die semantischen Auszeichnungen Anderer für sich selbst zu nutzen.

Im folgenden Abschnitt wird zunächst formal definiert, was Tags und Tag-Wolken sind. Danach wechselt die Perspektive hin zu den Nutzern, die mit den Tag-Systemen interagieren.

Modell des Taggings

Was passiert auf der Systemebene, wenn ein Anwender ein Objekt taggt? Um die Konzepte zu erklären, wird hier zwischen Tag, Tag-Label und Tag-Instanz unterschieden.

Das Tag

Das Taggen eines Objekts erzeugt auf der Systemebene einen Datenbankeintrag, der die Relation zwischen dem Objekt, dem Tag-Label und dem Anwender ausdrückt. Zusätzliche Daten wie beispielsweise der Zeitpunkt des Tag-Vorgangs werden je nach System mit abgespeichert. Somit ist eine Tag-Instanz ein n-Tupel der Form:

( Object, Label, User, … )

Die Ressource-Objekte müssen eindeutig referenzierbar sein. Im Web geschieht dies meist durch die Adresse der Webseite, die das Objekt primär darstellt, also zum Beispiel durch den PermaLink eines Blog-Eintrags oder durch die URL zu einem Film in YouTube.

Ein Tag-Label ist eine im Prinzip frei wählbare Zeichenketten, für die es keinerlei Vorgaben seitens des Systems gibt. Ein neues Label wird in dem Moment erzeugt da es vom Nutzer vergeben wird.

Der dritte Parameter bezeichnet den Anwender, der das Tag vergeben hat. Er muss immer mitgeführt werden um zu verhindern, dass ein Label mehrfach pro Objekt vergeben wird. Die Zuweisung verschiedener Label für ein Objekt ist nicht nur zulässig, sondern stellt einen signifikanten Vorteil gegenüber hierarchischen Ordnungssystemen dar. Man muss sich nicht mehr entscheiden, ob ein Dokument entweder in dem Ordner „Reise“ oder in dem Ordner „Städte“ abgelegt wird. Man vergibt einfach beide Tags für das Objekt und stellt so eine Beziehung zu beiden Begriffen her. Dabei wird entsprechend für jedes neue Label eine Tag-Instanz erzeugt und der Datenbank hinzugefügt.

Ein Tag ist nun ein Paar aus Tag-Label und der Menge aller Objekte, für die es Tag-Instanzen mit eben diesem Label gibt:

(Label_i, { Object_j | ex. (Object_j, Label_i, User_x) })

Die Struktur aus Objekten und Tags bildet einen Hypergraphen; eine Tag-Hyperkante verbindet alle Objektknoten miteinander, denen das jeweilige Tag-Label zugewiesen wurde.

Im Sinne des Hypertextes ist ein Tag ein Hyperlink, der auf ein oder mehrere Zielobjekte verweist. Das Tag-Label wird dann auf der Webseite zum Ankertext des Links. Ein Klick aktiviert das Tag und liefert eine Seite mit allen referenzierten Objekten.

Die Tag-Wolke

Die Anzahl der vorhandenen Tag-Instanzen für jedes Tag kann leicht aufaddiert werden, sodass sich für jedes Tag ein Häufigkeitswert ergibt. Normiert man die Werte, um sie auf Zeichensatzgrößen umzurechnen und stellt die Label in einer alphabetisch fortlaufenden Liste dar, so gelangt man zu den so genannten Tag-Wolken (tag clouds). Tag-Wolken sind folglich eine typographische Datenvisualisierung von Label/Wert-Paaren, die im Vergleich zu einer Tabelle oder einem Histogramm Vorteile in der Wahrnehmung der Maximalwerte und der zugehörigen Begriffe liefert und zudem eine bessere Platzausnutzung auf dem Bildschirm bietet.

Die Tags sind in realen Tagging-Systemen höchst ungleich verteilt. Einige wenige werden innerhalb eines Systems sehr oft vergeben, was sich unter anderem durch die Rückkopplung mit der sozialen Gruppe erklären lässt. Die meisten Tags werden hingegen nur sehr selten benutzt, so dass insgesamt eine Exponentialverteilung anzunehmen ist. Bei der Normierung ist dies durch einen logarithmischen Ausdruck zu kompensieren, damit die Tag-Wolke nicht nur wenige überdimensionierte Wörter enthält.

Wird in die Berechnung noch der Zeitparameter einbezogen, kann die Tag-Wolke beispielsweise aktuelle Entwicklungen ausdrücken. Man erhält auf dies Art eine Visualisierung der Themen, die im Moment besondere Beachtung finden. Dies geschieht insbesondere bei Technorati, um den Besuchern der Website einen schnellen Eindruck zu geben, welche Themen aktuell in der Blogosphäre behandelt werden.

Anwendungsperspektive des Taggings

Für den Anwender ist Tagging ein noch recht ungewohntes Element, das ihm aber immer häufiger auf partizipativen Websites begegnet. Der Vorteil des Taggings ergibt sich nicht unmittelbar und muss erst erlernt werden. So ist nicht sofort zu erkennen, welchen Effekt die Vergabe von Schlagworten hat. Erst mit zunehmender Nutzung des jeweiligen Systems und kontinuierlicher Vergabe von Tags bildet sich ein Verständnis für das System und der individuelle Mehrwert wird für den Anwender ersichtlich (Müller-Prove 2007).

Getaggte Objekte sind im allgemeinen Web-Ressourcen, die für den Nutzer eine besondere Bedeutung haben. Er taggt ein Objekt, um es aus der Unmenge von Informationen im Web hervorzuheben und es in eine persönliche Ordnung einzusortieren. Bei der Auswahl der Tags benutzt er sein eigenes Wortverständnis und gestaltet auf diese Weise das Vokabular seiner persönlichen Tag-Wolke.

Da beim gemeinschaftlichen Taggen (social tagging) jeder Nutzer in der gleichen Situation ist, ihre Tag-Wolken aber aggregiert werden, kommt es zu Rückkopplungseffekten bei der Vergabe der Tags. Allmählich bildet sich so ein Gruppenwortschatz, da häufig vergebene Tags auffälliger und damit attraktiver werden.

Das Taggen

Der Aufwand des Taggens sollte für den Nutzer möglichst gering sein, damit er nicht all zu sehr vom Kontext seiner eigentlichen Tätigkeit abgelenkt wird. Die aktuelle Web-Technologie erlaubt zum Beispiel mittels Ajax einen Interaktionsfluss, der sich nicht über mehrere Seitenaufrufe verteilen muss, sondern en passant auf der gleichen Seite vorgenommen werden kann. Einige Systeme unterstützen den Nutzer auch bei der Vergabe der Tags durch das Einblenden oder die automatische Vervollständigung von Tags, oder sie machen dem Nutzer Vorschläge, welche Tags benutzt werden sollten, da diese schon von anderen Nutzern für das selbe Objekt vergeben wurden. Beides hat zur Folge, dass die Tags häufiger benutzt werden und so ihre ordnende Funktion entfalten können.

Das Vokabular

Wenn die Tags aus einem vorgegebenen Verzeichnis stammen müssen, spricht man von einem kontrollierten Vokabular. Insbesondere das Bibliothekswesen hat in dieser Hinsicht eine lange Tradition. Es zieht beispielsweise die singularische Nominalform den gebeugten Formen vor. Außerdem wird unter Synonymen ein Begriff ausgezeichnet, der als Schlagwort vergeben wird, wohingegen die anderen ungenutzt bleiben und allenfalls im Index auf den Hauptbegriff verweisen. Dieses Vorgehen ist dort sinnvoll, wo eine größere Gruppe auf die Verschlagwortung oder Indexierung angewiesen ist, um Dokumente oder sonstige Artefakte aufzufinden, für die es eine etablierte Ordnung gibt.

Da Tagging-Begriffe ad-hoc, nach persönlichem Geschmack und Sprachverständnis vergeben werden, hat man es hier mit einem unkontrollierten Vokabular zu tun. Ein Abgleich mit einem Regelwerk oder Thesaurus würde einen zeitlichen und kognitiven Mehraufwand bei der Vergabe der Tags bedeuten, dessen Nutzen dem Anwender nicht unmittelbar einsichtig wäre.

Demgegenüber ist (fast) alles als Label erlaubt, was sich über die Tastatur eingeben lässt. Einzig bei der Behandlung des Leerzeichens gibt es systemspezifische Unterschiede, da es oft als Trennung zwischen den Tags interpretiert wird. Die Eingabe von „New York“ kann dann je nach System zu einer oder zu zwei Tag-Instanzen führen, was unerwünschte Auswirkungen haben kann. Technisch versierte Anwender umgehen diese systembedingte Designschwäche durch eigene Notationen, wie etwa durch „NewYork“ oder „New_York“.

Statt des Leerzeichens fordern einige Systeme auch ein Komma für die Auflistung der Tag-Label mit dem Vorteil, dass zusammengesetzte Begriffe leicht erkannt werden können. Bei Tag-Systemen ohne Kommata werden teilweise Anführungszeichen benutzt, dessen Funktionsweise aber den Anwendern nicht immer geläufig ist.

Soziale Objekte

Menschen benutzen Dinge um miteinander zu interagieren. So ist beispielsweise ein Fußball ein Objekt, der das Fußballspiel erst ermöglicht. Die Spieler verabreden Spielregeln, bilden Mannschaften, suchen sich ein Spielfeld und spielen. Wenn der Ball nun zu schwer ist oder nicht genügend Luft zum Prellen hat, so hat das einen enormen Einfluss auf den Verlauf des Spiels.

In der digitalen Welt verhält es sich recht ähnlich, da die abstrakten Daten auf dem Bildschirm als soziale Objekte betrachtet werden sollten, die die Anwender zum Interagieren benutzen. Die angebotenen Interaktionsmöglichkeiten können eine aktive Teilnahme der Anwender fördern und maßgeblich dazu beitragen, dass sich um die Objekte herum eine Gemeinschaft bildet.

Neben dem reinen Konsumieren der Informationen existieren partizipative Aktivitäten, die nach Intensität geordnet wie folgt lauten:

Abstimmen
Bewerten (voting)
Taggen
Verschlagworten
Annotieren
Kommentieren
Diskutieren

Das Abstimmen ist für den Anwender die denkbar einfachste Form sich einzubringen. Das soziale Nachrichtenportal Digg.com ist ein Beispiel dafür, wie die Anwender durch einen Mausklick abstimmen, um Artikel auf die Startseite der Website zu befördern. Im Musikportal last.fm können die Hörer mit einem Klick zwischen „Express your love for this track“ und „Don’t ever play me this track again“ auswählen. Amazon bietet ein Bewertungssystem an, bei dem die Kunden mit fünf zu vergebenden Sternchen ausdrücken, wie sehr ihnen das Produkt gefällt. Das ist für die Anwender eine etwas differenziertere Methode als das bloße Abstimmen.

Alle folgenden Methoden sind textlicher Natur. Das Taggen ist dabei die einfachste verbale Form der Partizipation, da das Vokabular im Gegensatz zur Verschlagwortung nicht kontrolliert ist. Schlagworte bieten allerdings den Vorteil, dass den Begriffen eine Ontologie hinterlegt sein kann.

Kommentare und Annotationen sind kurze Texte, die ein Anwender über ein Objekt oder bestimmte Teile davon in ein Textfeld eingibt. Alle Weblog-Systeme bieten solch Kommentarfunktionen an, mit der die Leser auf den Eintrag antworten können. Der entstehende Dialog kann der Beginn einer lebhaften Diskussion sein.

Die Methoden Abstimmen, Bewerten, Taggen und Verschlagwortung können automatisch ausgewertet werden. Das Taggen ist dabei bei gleichzeitiger Flexibilität die ausdrucksstärkste Form. Die übrigen Methoden um das Kommentieren herum können demgegenüber nur durch eine Volltextsuche erschlossen werden und eignen sich nicht zur Aggregation.

Bei der Gestaltung eines kollaborativen Systems ist also die Entscheidung zu treffen, in welcher Form die Anwender mit den sozialen Objekten interagieren sollen und welche dynamischen Strukturen erwünscht sind. Entsprechend wählt man das Spektrum an Interaktionsmethoden und bindet sie über die Benutzungsschnittstelle an die Web-Ressource an. Beides zusammen – Ressource und Interaktionsmöglichkeiten – bilden dann die sozialen Objekte des Systems.

Folksonomy

Obwohl jeder einzelne Anwender seinen eigenen Wortschatz zum Taggen verwendet, ergibt die Aggregation zu Tag-Wolken kein Chaos. Ganz im Gegenteil sind die entstehenden Strukturen bedeutungstragend und damit buchstäblich sinnvoll.

Der Informationsarchitekt Thomas Vander Wal hat dafür 2004 den Begriff Folksonomy eingeführt (Merholz 2006). Es ist ein Neologismus aus dem englischen „Folk“ und „Taxonomy“ – quasi die pluralistische Stimme des Volkes, die durch die Tagging-Aktivitäten der Einzelnen eine neue Sinnebene erzeugt. Es gibt keine Experten, die die Bedeutung und Ordnung der Dinge festlegen, sondern einen dezentralen, unkoordinierten, sozial-kumulativen Prozess. Die verwendeten Tag-Label sind individuell. Sie müssen nicht widerspruchsfrei vergeben werden – nicht einmal innerhalb des Bereichs eines einzelnen Nutzers. Trotzdem ist der Vergleich mit Taxonomien zulässig, da Tags auch Semantik induzieren. Die Folksonomy ist also genau wie die Taxonomie eine bedeutungstragende Ebene.

Ausblick

Im Tagging verbirgt sich ein Potential im Umgang mit digitalen Informationen, dessen Entfaltung gerade erst begonnen hat. So sind Tag-Wolken auf zahlreichen modernen kollaborativen Plattformen anzutreffen, ohne dass ihr Einsatz in jedem Fall angebracht wäre. Die Informationsarchitekten müssen erst noch lernen, unter welchen Bedingungen Tagging-Systeme sinnvoll eingesetzt werden können – den Interaktionsdesignern fällt hingegen die Aufgabe zu Funktionen derart zu gestalten, dass die Anwender effizient Tags vergeben und Tag-Wolken auf die wirklichen Bedürfnisse anpassen können.

Auf Seiten der Anwender bedeutet das, dass sie eine Medienkompetenz im Umgang mit diesen neuen semantischen Ordnungs- und Visualisierungsmethoden entwickeln müssen. Sowohl bei der Gestaltung des Tag-Vokabulars, als auch bei der Interpretation der Tag-Wolken ist Sorgfalt geboten. Denn es besteht einerseits die Gefahr unübersichtliche und chaotische Tag-Wolken zu produzieren und andererseits die angebotenen Tag-Wolken als Navigation zu den vorhandenen Objekte zu unterschätzen, nur weil sie Begriffe enthält, die auf den ersten Blick abschreckend wirken.

Yusef Hassan-Montero und Victor Herrero-Solana (2006) argumentieren zum Beispiel, dass die übliche Form von Tag-Wolken für das Information-Retrieval nicht optimal ist, sondern nur dort effizient eingesetzt werden kann, wo dem Anwender das Tag-Vokabular bekannt ist. Sie stellen einen Algorithmus vor, der die Tags nicht alphabetisch sortiert, sondern sie gemäß der Häufigkeit gruppiert, in der sie zusammen auftreten (co-occurence). Damit kann ein Anwender aus der räumlichen Nähe von Tags die Bedeutung ihm unbekannter Tags erahnen.

Ein weiteres Problem ist die Abgeschlossenheit vieler Systeme. Da jedes Tagging-System eine eigene Datenbasis besitzt und es keinen einheitlichen Standard zum systemübergreifenden Austausch der Tag-Daten gibt, besteht auch hier Handlungsbedarf, um die semantischen Informationen verschiedener Plattformen miteinander zu verbinden.

Trotz aller anfänglicher Schwierigkeiten bietet Tagging schon jetzt bedeutende Möglichkeiten für die persönliche und kollaborative Wissensorganisation. Die Vernetzung und Zusammenführung der Daten erschließt für die Anwender neue Ressourcen, wobei die Tags wie kleine Nachrichten den Sinn mittels eines gemeinsamen und impliziten Sprachverständnisses im weltweiten Netz transportieren.

Literatur

Hassan-Montero, Y., & Herrero-Solana, V. (2006). Improving Tag-Clouds as Visual Information Retrieval Interfaces. In I International Conference on Multidisciplinary Information Sciences and Technologies, InSciT2006. Mérida, Spain: www.scribd.com/doc/8319/Improving-TagClouds-as-Visual-Information-Retrieval-Interfaces.
Merholz, P., Starmer, S., Surla, S., McMullin, J., & Reiss, E. (2006). Annual Report, 2004-05. The Information Architecture Institute: http://iainstitute.org/news/000464.php.
Müller-Prove, M. (2007). Taxonomien und Folksonomien – Tagging als neues HCI-Element. i-com, 6, (1): www.mprove.de/script/07/icom/.
Norman, D. A. (1993). Things That Make Us Smart. Reading, MA: Addison-Wesley.
O’Reilly, T. (2005). What Is Web 2.0 – Design Patterns and Business Models for the Next Generation of Software: www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-web-20.html.

Feedback – please leave a message

I'd be happy to receive and read your feedback via_

hci.social/@mprove or norden.social/@chronohh
mprove@acm.org
More channels

Modell und Anwendungsperspektive des Social Tagging