is it ok to drink and drive? Lexxe vs. Powerset
Par Marguerite le vendredi 27 mars 2009, 15:17 - In my WebOpinion - Lien permanent
Lexxe vs. Powerset?
Lexxe, dont la version alpha est
sortie en 2005, figurait début 2007 dans le Top 100 des moteurs de recherche
alternatifs, établi par Charles S. Knight dans ce billet. Ce dernier en a également
reparlé plus tard cette année-là, dans un billet riche d'informations sur le fonctionnement de
Lexxe, qui était le Search Engine of the Day :
Lexxe is one of the new Semantic (”meaning based”) search engines that are designed to let you ask a question in plain language,
introduit-il, avant de souligner que l'approche de cet outil relève du Traitement Automatique des Langues (Natural Language Processing).
Lexxe treats the keywords as “words”, not symbols ... (it) addresses the linguistic property within the keywords as a core issue for search,
précise-t-il, avant de poursuivre :
Lexxe does not use “website popularity” as a factor to decide if a webpage is relevant or not. The relevance of a webpage is decided by the matching between the keywords and the content of the webpage based on Lexxe’s linguistic computing and algorithms.
Lexxe est donc un moteur qui s'appuie sur les technologies d'analyse linguistique, tout comme Powerset, dont on avait parlé dans un ou deux billets. Nés dans la même période - à ma connaissance, les deux ont commencé à faire parler d'eux entre 2005 et 2007 -, avant le rachat en 2008 de Powerset par Microsoft.
Si la comparaison des résultats retournés par chacun de ces moteurs à une
requête identique, ne doit pas être appréhendée comme absolument représentative
de leurs performances générales, on a quand même regardé ce que ça
donne...
Le constat immédiat : Lexxe ose me répondre, Powerset a l'air un peu
perdu. N'exagérons rien et n'allons pas prendre pour argent comptant la réponse
positive de Lexxe 
Il faut dire que la question posée "is it ok to drink and drive?"
(merci AntEater pour ce fort bon exemple), ne correspond pas à la structure
canonique de la phrase interrogative, par exemple dans le contexte d'une
application de Questions/Réponses : pas de mot interrogatif (type "wh-") à
l'initiale, la tournure de cette question utilise l'inversion sujet/verbe et ne
contient aucune forme de type entité nommée (par exemple un nom de
personne).
Il y aurait sans doute aussi à regarder du côté de la taille de la fenêtre de mots; par exemple, si la collocation "drink and drive" est présente au moins dans les 5 premiers résultats de Lexxe, elle ne figure dans aucun des 5 premiers résultats retournés par Powerset.
En tous cas, j'espère que Lexxe sera l'objet de d'améliorations futures, car il me semble prometteur sur le segment des moteurs de recherche généralistes. Un écho qui fait bonne transition vers ces feedbacks un peu plus anciens :
"So far it (Lexxe) hasn't generated as much buzz, but the fact that it's in beta, and working is promising."
"This completely new search engine is great from the start, even in it's alpha version if you search in English."
"The concept of Lexxe will be more visible with a query like 'Who was Nietzsche'. As expected, Google produces a very long list of relevant links, but there is no topical order. In contrast Lexxe which is clustering: • German Philosopher of the Late 19th • Superman (Übermensch) • Minister • Mother • Reader • Clergyman • Author• Etc. I'm interested in his relationship to his mother and get more relevant links to his biography, to his medical history, to his mother etc. That's the true strength of Lexxe - topical drilling"


