MyLinguistics - Marguerite Leenhardt's Web Log

Aller au contenu | Aller au menu | Aller à la recherche

jeudi 10 septembre 2009

Opinion Mining and Sentiment Analysis, Pang and Lee (2008)

Pang_Lee2008.jpg Une instructive lecture sur la dernière somme de référence en date sur l'opinion mining et la sentiment analysis. J'avais eu à en faire une note, que j'ai ressortie de mes cartons : cela mérite d'être partagé! On comprendra sans doute mieux en quoi (j'y reviendrai sans doute ultérieurement) la problématique de la modélisation linguistique est cruciale et constitue l'une des clés de l'évolution des systèmes d'opinion mining et de sentiment analysis. Ma petite note de lecture, donc...

Synopsis
Cet ouvrage consiste en une étude fondée sur plus de trois cent travaux de recherche, donnant un aperçu des évolutions dans le domaine de la fouille de données orientée opinion (opinion mining) et de l’analyse des sentiments (sentiment analysis). Il présente les techniques et approches développées et fournit un panorama de l’effort de recherche ainsi que des ressources existantes.

  • Historique, types d’applications et enjeux

L’émergence du World Wide Web et l’utilisation, aujourd’hui répandue, des applications issues des Technologies de l’Information et de la Communication (TIC), ont suscité l’apparition de nouveaux modes de communication, ce faisant, contribué à instaurer de nouveaux espaces de propagation de l’information. Pouvoir accéder, et partant, élaborer une métrique pour évaluer « ce qui est dit », « comment on le dit » et « sur qui/quoi on le dit », est alors devenu un objet de recherche, ainsi qu’un enjeu stratégique pour les entreprises et les institutions.

Si des chercheurs se sont penchés sur le sujet avant l’an 2000, c’est véritablement à partir de 2001 que le nombre de travaux s’accroît. La jeunesse de ce domaine suscite des instabilités terminologiques importantes. En effet, l’effort de recherche s’est essentiellement orienté sur des problématiques applicatives, laissant les aspects épistémologiques de côté. Les travaux traitant de questions purement linguistiques sont par ailleurs peu nombreux.

Quatre grands types d’applications sont mis en exergue par les auteurs : (i) les applications liées aux sites d’avis de consommateurs, par exemple sur les films ou les jeux vidéos ; (ii) l’intégration de modules spécifiques dans des systèmes de e-commerce, de GRC (Gestion de la Relation Clientèle) ou encore de Questions/Réponses ; (iii) les applications de veille stratégique et de veille institutionnelle ; (iv) enfin, l’analyse de discours politiques.

Bien qu’elles découlent de la fouille de données et de l’analyse de textes, les technologies d’opinion mining et de sentiment analysis posent des problèmes spécifiques, qui les distinguent et les rendent plus complexes, à plusieurs égards, que les premières.

  • Problématiques de classification et d’extraction de l’information

La classification documentaire et l’extraction d’information sont les principaux domaines sur lesquels s’est concentré l’effort de recherche : les auteurs y consacrent d’ailleurs une analyse détaillée. Cet effort, lié à la mise au point d’algorithmes, donne lieu à la discussion de nouveaux concepts et méthodes, comme en témoigne l’élaboration de modèles de langage dédiés.

Des problématiques variées sont exposées. L’intégration des traits linguistiques – en particulier les propriétés syntaxiques et le traitement de la négation – et statistiques – l’impact de la présence et de la fréquence des occurrences de formes dans les textes – dans le processus d’analyse, constituent un enjeu important pour l’amélioration des systèmes.

L’adaptation au domaine de ces derniers, tout comme l’impact de l’utilisation de données manuellement annotées, est aussi largement traité. De ce point de vue, c’est avant tout le problème de la réutilisabilité des ressources qui est considéré. Par ailleurs, les technologies de classification et d’extraction sont abordées selon les approches d’apprentissage supervisé et non supervisé.

Améliorer la prise en compte du contexte dans l’analyse, en particulier par l’intégration de la structure discursive, impacte autant la classification que l’extraction. Cependant, l’identification des attributs d’un produit ou d’une opinion dans l’avis des consommateurs, comme celle des foyers de l’expression de l’opinion – la question des opinion holders –, sont plus spécifiquement liées à des problématiques d’extraction.

  • Problématiques de résumé automatique de l’information

Deux paradigmes de résumé automatique, qui prennent soit pour objet un seul texte, soit un ensemble de textes, sont successivement abordés par les auteurs. En effet, les améliorations de l’un impactent celles de l’autre. Les problématiques sont communes, même s’il faut distinguer entre les techniques de résumé fondées sur l’identification automatique de thématiques de celles qui ne le sont pas.

Corrélativement, certains systèmes peuvent intégrer une dimension temporelle pour la représentation graphique de l’information. Observer l’évolution de l’opinion en fonction du temps s’avère utile lors de l’étude de thématiques ou d’avis de consommateurs sur une marque, un produit ou un service. L’analyse du discours politique est également enrichie par des considérations diachroniques.

Les données utilisées provenant le plus souvent de sites d’avis de consommateurs, les applications de résumé automatique peuvent aussi tirer parti de la réputation des utilisateurs, par le biais de scores qui leur sont associés par la communauté, qui évalue ainsi leur crédibilité et donc, indirectement, leur pouvoir d’influence, de recommandation.

  • Domaines d’applications variés, problématiques élargies

Les travaux confirmant les corrélations entre les ventes de produits et la tendance positive ou négative des avis de consommateurs se sont multipliés. Le principe de la recommandation d’achat « de bouche à oreille », que les avis publiés en ligne permettent de suivre et d’analyser, donc la question de l’influence des leaders d’opinion sur les consommateurs, a un impact économique important.

De manière générale, les applications de fouille de données visant à étudier les préférences des individus, posent parfois un problème de confidentialité, en particulier lorsqu’il s’agit de données récoltées à partir de sources non accessibles publiquement.

Un autre aspect mentionné par les auteurs concerne la manipulation de l’information. En effet, la participation des acteurs économiques, voire institutionnels, aux conversations en ligne, peut avoir pour objectif d’introduire un biais dans la diffusion de l’information. Certaines études ont en effet révélé que ces acteurs sont attentifs à la façon dont tirer profit de cette diffusion.

  • Ressources publiquement accessibles

Cette section traite en premier lieu des banques de données textuelles, annotées ou non, dont la plupart ont été élaborées à partir de 2005. D’autre part, 2006 marque l’entrée de tâches d’opinion mining ou de sentiment analysis dans les campagnes d’évaluation TREC et NTCIR. Plusieurs ressources lexicales, par exemple des dictionnaires annotés ou des lexiques d’adjectifs, sont également pris en compte.

Il faut souligner que les ressources mentionnées sont en anglais. Loin d’être un biais initié par les auteurs, la bibliographie met en exergue le fait que peu de chercheurs européens se sont penchés sur le problème jusqu’à présent. En conséquence, les tutoriaux, banques bibliographiques et autres listes de diffusion – en particulier la liste SentimentAI – sont mises en ligne par quelques universitaires nord-américains.

Cet ouvrage est, à l’heure actuelle, l’un des premiers à donner accès à une telle compilation de travaux, problématiques et ressources, dans le domaine de l’opinion mining et de la sentiment analysis.

Référence complète : Bo PANG, Lillian LEE, Opinion Mining and Sentiment Analysis, Now Publishers Inc., 2008, 135 pages, ISSN 1554-0669.

lundi 17 août 2009

Mozbot/Twitter : un bon combo

Image_1.png Mozbot proposait déjà des possibilités fort sympathiques pour tout utilisateur de moteur de recherche en quête de fonctionnalités peu banales. On se souvient du Mozcloud, qui permettait par exemple de paramétrer la fréquence d'occurrence des formes à représenter dans le nuage de mots. Plusieurs fonctions avaient malheureusement été "purgées" à la demande de Google, tout récemment, en février 2009. On compte parmi ces pertes, précieuses m'est avis, de bien pratiques features :

  • la possibilité de blacklister un lien lors de recherches ultérieures,
  • le choix du domaine de recherche par défaut,
  • l'affichage des copies d'écran des sites,
  • la restitution d'informations connexes sur le site (statistiques d'Alexa),
  • les statistiques sur la fréquence de saisie d'une requête donnée.

Et encore, je fais l'impasse sur d'autres petites choses agréables, mais qui touchent davantage à la customization, comme le choix de la couleur de l'interface; sans parler non plus de fonctions largement répandues depuis que Mozbot a pointé son nez en 2006, typiquement la proposition de requêtes connexes ou encore la correction orthographique.

En bref, il était vraiment dommage de voir Mozbot déplumé de son beau ramage de fonctionnalités innovantes par le plumeur Google. C'est donc avec plaisir que j'ai ouï parler du nouveau temps d'avance de Mozbot : retourner des résultats provenant aussi de Twitter, dans le frame gauche de l'interface.

Image_2.png

Et de trépigner à la lecture des futures moutures annoncées par ActuAbondance sur le sujet :

les deux listes de résultats ont chacune leur utilité : les liens "organiques", issus de Google, proposent sur la gauche les résultats "de confiance", souvent issus de sites importants en dehors de l'actualité "chaude", alors que les résultats Twitter donnent, pour leur part, une vision du "buzz" autour du domaine demandé. Ainsi, par exemple, la requête "3 Suisses" proposera sur Google des liens "corporate", alors que Twitter fournira des infos sur le "Google bombing" subi actuellement par la société

Que nous réserve l'outil du consortium frenchie Abondance, Raynette et Brioude Internet ?

D'autres fonctionnalités suivront dans les semaines et mois qui viennent.

On n'en saura pas plus pour l'instant, mais c'est décidément une affaire à suivre!

lundi 22 juin 2009

A crunch on Hunch ? "Skip this question"

hunch.jpg Hunch, le nouveau produit de la start-up de Caterina Fake (co-fondatrice de Flickr), sorti en juin dernier. En quelques mots? Un moteur qui bénéficie peut-être des effets collatéraux de la campagne de Bing sur le moteur de recherche comme aide à la décision, comme le souligne ActuAbondance (qui nous apprend aussi au passage que Miss Fake s'est, à l'occasion, entourée de chercheurs du MIT) .

Le principe? Intégrer un système incrémental utilisant des arbres de décision pour retourner des propositions à l'utilisateur.

Une sortie discrète pour un outil sur lequel personne n'a grand chose à dire : on en présente le principe ici et , sans vraiment chercher à le tester. Here we go...

Une transparence appréciable et juste ce qu'il faut de camemberts... Hunch-teachHunch-camembert.PNG
Hunch nous dit quelles sont les feuilles de l'arbre de décision qui l'ont mené à nous faire une suggestion donnée : on clique sur Why did Hunch pick this? et on accède aux quatre questions qui ont le plus de poids dans le parcours de l'algorithme. Il indique également, de façon simple, votre "positionnement", en fait le pourcentage de personnes qui ont donné la même réponse que vous à l'une des questions.

Mais une base de connaissances à couverture encore restreinte
Allez donc raconter à Hunch que vous habitez en Europe de l'ouest en testant l'un des parcours proposés à la première connexion "Which cheese would I enjoy?". Surprise! Il connaît des fromages italiens, le brie, mais pas le munster! Testez le mot-clé "munster" dans la boîte de dialogue "Today I'm making a decision about..." : après vous avoir suggéré un "Did you mean : monster", il propose quelques réponses, mais sans rapport avec le fromage... Mince, et si j'avais envie de décider quel vin j'allais boire avec mon munster ce soir?

Pas de procès d'intention, mais une question : pourquoi généraliser à l'ensemble des utilisateurs du Web une procédure de décision typiquement américaine? Seriously, I never bought anything in a Walmart! Why don't you ask me what I think of an Auchan or a Leclerc? En somme, l'outil gagnera beaucoup lorsqu'il sera décliné et mieux adapté à la diversité de ses potentiels utilisateurs.

Pour finir, Hunch a quelques réflexions très curieuses pour un outil ouvert sur l'international, en particulier celle-ci : Hunch-question.PNG

Au bout du compte, on utilise beaucoup la fonction "Skip this question".

jeudi 4 juin 2009

Wolfram a buzzé, Google Labs sort Squared des tiroirs

Image_2.png Un précédent billet donnait quelques éléments en faveur d'une opposition mal posée : Google vs. Worlfram Alpha.
L'idée était de mettre en avant que, non seulement Wolfram Alpha n'avait pas vocation à concurrencer Google, mais que Google commençait à s'inspirer des modèles de restitution des résultats de recherche de son faux outsider. En tous cas, pour ceux qui n'en étaient pas convaincus, on a la preuve tangible que l'information structurée est bien l'avenir des moteurs de recherche grand public.

On pouvait lire début mail sur TechCrunch un excellent billet sur le sujet, dans une perspective comparative à la défaveur de Wolfram Alpha. L'autre membre de la comparaison? Google Squared, très attendu, dont ActuAbondance et TechChunch-fr parlent aujourd'hui.

Nous y voilà : Google s'est bien inspiré de Wolfram Alpha, si la chronologie que donne à voir le web sur ce point peut être estimée fiable. La différence? Wolphram Alpha compute sur quelques dizaines de teraoctets. Avec Squared, Google est en train d'opérer sur le web entier pour que l'utilisateur le perçoive comme mieux rangé, facilitant son accès à l'information "pertinente". Oui, des guillemets. TechChrunch l'avait vu venir de loin, c'est déjà en train de se passer, mais comme la pilule est bien emballée, l'utilisateur l'avalera sans peine :

Turning the Web into a giant database will crush any attempt to segregate the “best” information into a separate database so that it can be processed and searched more deeply.

Une bonne raison pour les internautes de considérer avec précaution la pertinence de la référence nommée Google.

A l'heure où Pasquier prend soin de vous éviter un geste en plus en vous vendant des pains au lait prédécoupés, Google n'est-il pas en train de nous vendre de la pertinence prédécoupée, rongeant un peu plus notre envie de questionner la pertinence du résultat?

mardi 2 juin 2009

Yochaï Benkler, une vue très "linguistique appliquée" de l'analyse du web

Dans une excellente interview de Yochaï Benkler, InternetActu reprend le propos de l'éminent chercheur : une véritable synthèse multidimensionnelle des pratiques actuelles observables en ligne.

Du contexte socioculturel jusqu'à l'analyse comparative des tendances entre des communautés de bloggers, je souhaite juste mettre l'emphase sur l'un des aspects de son propos :

Les nouvelles méthodes d’observation (comme la visualisation) ne doivent pas nous éviter l’interprétation : au contraire, elles fournissent de nouvelles sources de savoir et exigent de nouvelles formes d’interprétations. On observe les structures, mais pas nécessairement ce qu’en font les gens. Les ordinateurs doivent assister les recherches humaines et pas seulement nous aider à les systématiser.

Il l'explique donc très clairement : décrire une topologie du web n'explique rien en soi sur la nature du buzz. Dire que des gens parlent entre eux n'explique rien sur la structure conversationnelle de leur échange (explication brève, explication longue).

Son analyse sur les positionnements politiques dans la blogosphère américaine l'amènent à un intéressant constat :

les outils que nous utilisons peuvent aussi masquer des pratiques plus que les révéler (...) la prochaine frontière repose sur l’analyse textuelle (...)

intéressant, non ?

L'idée de ces outils d’analyse de contenus est de permettre d’analyser les discours et leurs positionnements, de créer des lignes de temps afin de mieux observer où émergent les concepts et les idées, comment ils se diffusent des médias classiques à la blogosphère (et inversement) et comment petit à petit ils prennent place dans l’agenda public des débats (...)

Une véritable leçon d'introduction à l'analyse textométrique - branche de la linguistique appliquée qui relève du TAL, regroupant analyse linguistique et statistique textuelle -. Et d'aller plus loin :

On ne peut pas s’arrêter à l’analyse visuelle (...) il faut aussi procéder à une analyse humaine et de contenus, afin de comprendre que l’analyse, l’anglage, la façon dont on parle d’un même évènement est différente d’un média à l’autre, d’un blog à l’autre. La comparaison des termes permet de comprendre et expliquer où se situent les différences entre les journaux.

Un bon augure pour la valorisation des linguistes TAL, à qui ces méthodes de travail sont enseignées très tôt dans les formations universitaires en Sciences du Langage, et qui font l'objet de spécialisations dans des parcours comme ceux proposés par l'initiative PluriTAL.

Wolfram Alpha / Google : les bons termes de la Question ?

WolframAlpha.PNGWolfram Alpha buzze depuis quelques semaines déjà.
L'image d'un effet d'annonce autour d'un non Google-killer le poursuit, celle d'un énième moteur de recherche "intelligent" qui laisse surtout le goût d'une communication bien orchestrée par Stephen Wolfram à ceux qui en ont parlé. En témoignent les articles parus dans 20minutes.fr et LeMonde.fr.

Des bases de données pas à jour, voire lacunaires. Une mauvaise gestion des chaînes de caractères. Un taux élevé d'échec à fournir une réponse. Ce sont ses trois grands défauts. Futura-sciences.com, qui consacrait un bel article à Wolfram en mai dernier, y fait le constat suivant :

En attendant, Google, Wikipédia et les liens qu’ils fournissent sont la plupart du temps largement meilleurs.

Sur Slate.com, la conclusion n'est pas très enjouée non plus :

Wolfram Alpha doesn't revolutionize search; at best, it adds a marginally useful new layer on top of it.

De toute évidence, en l'état, Wolphram n'a pas l'allure d'un moteur grand public. D'un moteur auquel certains trouveront des utilités, peut-être. En tous cas, il connaît un peu le breton, et ça a été une fort bonne surprise de pouvoir tester une requête sur le "Malagasy Language", pour trouver en quelques clics des informations sur le dialecte Betsimsaraka parlé dans le sud du pays. Dans le même cas de figure, Google ne fait pas aussi bien. Les fonctions de "Word Puzzle" sont sympa, les dictionnaires ne sont pas plus surprenants que ça, mais le rendu est agréable.

Manifestement, Wolfram Alpha ne suscite pas les mêmes comportements de recherche. Il s'adresse sans doute davantage à des utilisateurs en quête d'information spécifique, restituée dans un contenu structuré qui va à rebours de la logique de foisonnement de résultats. De l'information qui, si elle est estimée valide, peut être directement intégrée dans un document de travail, comme on le ferait avec des résultats d'InternetWorldStats ou d'Alexa.

Wolfram-resultats-facebook.PNG

Wolfram Alpha will prove helpful to some people. Because it's based on Wolfram Mathematica, a software package that can do complex calculations, mathematicians, engineers, and scientists will find much to love in it. Wolfram Alpha solves difficult equations and makes nice graphs for lots of specialized inquiries,

peut-on lire sur Slate.com.

Une belle transition à l'avis de Q - initiateur du présent billet -, qui met tout le monde d'accord :

Ceci étant dit, je tends à valider la conclusion que les geeks, les ingénieurs et les chercheurs en sciences devraient y trouver du bon...

Et celui-ci de conclure, fort perspicacement :

WolframAlpha ne vise pas à concurrencer Google, mais Google intègre de plus en plus de résultats Wolfram-style (tapes "scores L1" dans Google, pour voir...)

Wolfram-Google-resultat-Ligue1.PNG

Heureusement, Q est là pour montrer un nez au milieu d'une figure parfois trop familière. Prendre Google comme référence, soit, oublier que parfois, il peut s'inspirer des autres... c'est à croire qu'on peut avoir le nez bien court.

A lire à part ça : des doutes sur la Google Search Appliance 6.0

lundi 1 juin 2009

"The 100 most mentioned brands on Twitter" : de l'erreur de méthode à la désinformation

Début mai, Revolutionmagazine publiait un billet avec un titre plein de promesses, une porte ouverte (gratuite) à une étude de visibilité des marques sur Twitter : LE classement des 100 marques les plus citées.

Par l'odeur alléchée, je m'y rends, à l'affût de quelque découverte : une nouvelle application, une bonne idée, un biais méthodologique particulier... Le chapeau du billet annonce tout de même :

Revolution teamed up with i-level's social media agency Jam to reveal the 100 most mentioned brands on Twitter and how they are aiming to capitalise on the buzz

Le tableau à cinq colonnes, précisant la marque, son rang, le nombre de mentions de la marque, le compte Twitter et le nombre de followers, est un panorama un peu léger, mais passons. Pour entrée en matière, ça fait l'affaire.

LE problème? La matière justement... Aucune information sur la méthode employée, pas de contextualisation des résultats, un tableau, simplement un tableau. Indiqué par une astérisque, le seul commentaire du tableau précise :

*Figures are correct according to Jam's research which took place over three days in April 2009

Quels jours? Quels plages horaires? Un petit lien vers la 'Jam social media agency'? On n'en saura pas plus. Et pour le how they are aiming to capitalize on the buzz, on repassera.

L'idée d'observer la visibilité et l'implication des marques sur Twitter est bonne, incontournable même pour un état du 2.0. Mais les résultats de telles observations ne valent que par le contexte qui les entoure, surtout quand on parle de l'analyse d'un stream continu d'information. C'est ce point qu'il faut mettre en avant pour les lecteurs de l'étude : c'est un instantané du web qui doit être interprété avec précaution.

Des outils et une méthode de travail adaptée auraient rendu cet essai plus concluant et plus riche d'enseignements pour la métacommunauté des analystes web. Quid d'une application de TAL avec quelques bases élémentaires de statistique textuelle dedans, des ressources pour traiter plus finement les contenus? Pourquoi pas un petit graphique de l'évolution du nombre de citations par jour dans les tweets, mieux, en fonction d'une typologie des tweets?

Avec une méthodologie inexistante (un décompte manuel sur trois jours sans contexutaliser les résultats), il serait sans doute bon d'être un peu plus précautionneux lorsqu'on joue avec les effets d'annonce.

Parce qu'une information mal traitée est un premier pas vers la désinformation.

jeudi 28 mai 2009

AV, Siri! Ou l'intelligence pour iPhone et Smartphones

Image_1.pngSiri, l'AV (assistant virtuel) qui va révolutionner l'expérience utilisateur sur l'iPhone et autres Smartphones. Quelques explications...

Siri n'a pas l'objectif de révolutionner la recherche en ligne sur terminal mobile, mais de proposer des solutions pour faciliter la vie : ce n'est pas là d'un énième Google Killer, mais un assistant virtuel dont l'arrivée marque un tournant technologique majeur dans notre interaction quotidienne avec nos goodies high-tech!

Mais avant tout, qu'est-ce qu'un assistant virtuel ?

  • aider l'utilisateur à accéder à une information ou à exécuter une tâche;
  • comprendre l'intention de l'utilisateur en fonction du contexte;
  • travailler pour l'utilisateur, i.e. être autonome dans l'exécution des tâches intermédiaires pour apporter une réponse finale à l'utilisateur.

Le shift? On passe de l'adaptation d'outils - ce qu'on fait constamment en configurant les interfaces qu'on utilise au quotidien - à l'interaction avec une application intelligente. (A voir : la Technology Review du MIT en parlait dans son édition de mars/avril)

On annonce des performances exceptionnelles en reconnaissance vocale - ce que Google offre déjà avec Android - mais sur le principe, Siri fait mieux : c'est un agent conversationnel nouvelle génération, en plus d'être un outil qui n'impose pas à l'utilisateur de se servir des touches pour exécuter des actions. Tout peut se faire à la voix. L'intégration de fonctionnalités de synthèse vocales sont à l'étude, ce qui garantirait une accessibilité optimale aux utilisateurs atteints de cécité, par exemple.

Siri mettrai à profit les technologies d'autocomplétion et de navigation contextuelle. Son avantage saillant ? L'opérationnalisation, i.e. découper votre besoin en tâches et sous-tâches à exécuter pour retourner une réponse pertinente, en fonction des données contextuelles qu'il connaît sur son utilisateur. Une belle performance d'utilisation des algorithmes d'apprentissage automatique!

Les ressources actuelles pour la géolocalisation, la reconnaissance et l'extraction d'entités nommées (noms de personnes et dates, par exemple) et les technologies fondées sur les ontologies du langage (ne poussons pas le rêve trop loin, c'est un assistant, pas un humain en boîte) seraient particulièrement bien exploitées. En bref, une grille de lecture du monde étendue qui vous facilite la vie!

Siri, une startup qui aura bien exploité sa levée de fonds de 8,5 millions de dollars en 2008!

Pour aller plus loin : à lire chez nos amis de TechCrunch et de Twine

lundi 4 mai 2009

SEM'09// Les présentations sont en ligne!

Comme prévu, les présentations faites au Search Engine Meeting sont en ligne ici. Merci à toute l'équipe d'Infonortics!

Bonne lecture!

jeudi 30 avril 2009

SEM'09// le programme en images, plus quelques mots sur l'audience

Le secret d'un événement de qualité? L'organisation, le lieu et l'audience. Avec une centaine de personnes rassemblées dans l'ambiance feutrée des salons du Copley Plaza à Boston, il est intéressant de remarquer que plusieurs représentants d'institutions étaient présents parmi les attendees. De la web & enterprise search à l'institutional search?

En tous cas, comme promis, voici les scans du programme en détails, pour vous donner un aperçu de la façon dont se sont déroulés les deux jours du SEM'09.

L'équipe de Infornortics - parmi lesquels Madame Anne Girard, qui avait par exemple présidé la conférence Les apports de l'Intelligence Economique et Concurrentielle à la compétitivité des entreprises à l'i-expo 2004 -, emmenée avec brio par Monsieur Harry Collier, a mis en place une organisation irréprochable!

La jolie couverture du programme de cette année

program1.jpg

Les speakers du premier jour

program_day1.jpgMicrosoft, Nstein et une superbe intervention de Stephen E. Arnold sur ses fameuses Google Studies. En prime, un speech qualifié par la rumeur des couloirs de "provocative" par Frank Bandach (Eeggi).



Les speakers du second jour

program_day2.jpgTrès intéressante, la présentation de David Milward (Linguamatics); des interventions riches d'enseignement sur les problèmes de sécurité en contexte d'enterprise search, par l'équipe de New Idea Engineering, et sur la faceted search, par Daniel Tunkelang (Endeca). Cherry on top : Peter Noerr (MuseGlobal) a présenté son approche de l'underground information.

Tout ceci n'est, bien entendu, qu'un rapport non exhaustif de la richesse qui a été exposée dans les salons du Fairmont Copley Palza pendant les deux jours du SEM'09. Je vous enjoins donc fortement à vous ruer ici dès le 4 mai : toutes les présentations seront disponibles en ligne.

- page 3 de 10 -