Yochaï Benkler, une vue très "linguistique appliquée" de l'analyse du web
Par Marguerite le mardi 2 juin 2009, 23:55 - Web Sémantique ? - Lien permanent
Dans une excellente
interview de Yochaï Benkler, InternetActu reprend le propos de l'éminent chercheur :
une véritable synthèse multidimensionnelle des pratiques actuelles observables
en ligne.
Du contexte socioculturel jusqu'à l'analyse comparative des tendances entre des communautés de bloggers, je souhaite juste mettre l'emphase sur l'un des aspects de son propos :
Les nouvelles méthodes d’observation (comme la visualisation) ne doivent pas nous éviter l’interprétation : au contraire, elles fournissent de nouvelles sources de savoir et exigent de nouvelles formes d’interprétations. On observe les structures, mais pas nécessairement ce qu’en font les gens. Les ordinateurs doivent assister les recherches humaines et pas seulement nous aider à les systématiser.
Il l'explique donc très clairement : décrire une topologie du
web n'explique rien en soi sur la nature du buzz. Dire que des gens
parlent entre eux n'explique rien sur la structure conversationnelle de leur
échange (explication brève, explication longue).
Son analyse sur les positionnements politiques dans la blogosphère américaine l'amènent à un intéressant constat :
les outils que nous utilisons peuvent aussi masquer des pratiques plus que les révéler (...) la prochaine frontière repose sur l’analyse textuelle (...)
intéressant, non ?
L'idée de ces outils d’analyse de contenus est de permettre d’analyser les discours et leurs positionnements, de créer des lignes de temps afin de mieux observer où émergent les concepts et les idées, comment ils se diffusent des médias classiques à la blogosphère (et inversement) et comment petit à petit ils prennent place dans l’agenda public des débats (...)
Une véritable leçon d'introduction à l'analyse textométrique - branche de la linguistique appliquée qui relève du TAL, regroupant analyse linguistique et statistique textuelle -. Et d'aller plus loin :
On ne peut pas s’arrêter à l’analyse visuelle (...) il faut aussi procéder à une analyse humaine et de contenus, afin de comprendre que l’analyse, l’anglage, la façon dont on parle d’un même évènement est différente d’un média à l’autre, d’un blog à l’autre. La comparaison des termes permet de comprendre et expliquer où se situent les différences entre les journaux.
Un bon augure pour la valorisation des linguistes TAL, à qui ces méthodes de travail sont enseignées très tôt dans les formations universitaires en Sciences du Langage, et qui font l'objet de spécialisations dans des parcours comme ceux proposés par l'initiative PluriTAL.
Commentaires
Petit ajout après un test de MediaCloud
L'expertise en analyse textuelle est lacunaire : MediaCloud ne dépasse pas le stade du décompte de fréquences d'occurrences de formes et de cooccurrences de forme. Les outils de textométrie français d'il y a dix ans font largement mieux que ça (Lexico3, Hyperbase notamment). Les derniers arrivés de 2008 (Le Métier Lexicométrique aka Le Trameur) sont d'une performance supérieure, offrant aux linguistes TAL des fonctionnalités d'exploration textométrique fines.