Understanding the Efficiency of Social Tagging Systems using Infomation Theory
Proceedings of ICWSM’08, Poster session
E. H. Chi and T. Mytkowicz
Palo Alto Research Center

(Chi and Mytkowicz, 2008) proposent une analyse d’un site de social tagging, del.icio.us. L’objectif de ce travail est de proposer une évaluation de ce type de systèmes quant à leur pertinence pour « encoding navigation paths to information sources ».

Si certains ont publié à la faveur de l’utilité de tels systèmes en tant que dispositifs de communication contribuant à lier les collections documentaires aux représentations mentales qu’ont les utilisateurs de ces collections, (Chi and Mytkowicz, 2008) entendent étudier la pertinence du vocabulaire formé par les tags associés à un document pour en décrire le contenu.

fig1-avecLégende

Les analyses de distribution en fonction du temps effectuées sur leur corpus de travail, reportées en Figure 1, montrent que, si les courbes de documents associés aux utilisateurs ont une croissance similaire, la courbe des tags descripteurs de ces documents évolue de façon exponentielle. De ce point de vue, le vocabulaire n’est pas stabilisé. Deux facteurs sont à prendre en compte : les popular tags proposés par ces systèmes ont pour effet de réduire la variété des tags ; au contraire, les tags choisis par les utilisateurs en dehors de ces listes en font exploser la quantité.

Deux questions sont alors soulevées : les tags les plus populaires sont-ils pertinents pour décrire les contenus ? Peut-on vraiment concevoir que les utilisateurs s’accordent sur leur représentation mentale d’un contenu informationnel ? A cela, les auteurs n’apportent pas de réelle réponse, concluant simplement : « Rather than providing popular tags for user’s, tagging sites should ask them to think of tags that describe the document that are not in the popular list ».