Lexxe vs. Powerset?

LexxeLogo.jpg Lexxe, dont la version alpha est sortie en 2005, figurait début 2007 dans le Top 100 des moteurs de recherche alternatifs, établi par Charles S. Knight dans ce billet. Ce dernier en a également reparlé plus tard cette année-là, dans un billet riche d'informations sur le fonctionnement de Lexxe, qui était le Search Engine of the Day :

Lexxe is one of the new Semantic (”meaning based”) search engines that are designed to let you ask a question in plain language,

introduit-il, avant de souligner que l'approche de cet outil relève du Traitement Automatique des Langues (Natural Language Processing).

Lexxe treats the keywords as “words”, not symbols ... (it) addresses the linguistic property within the keywords as a core issue for search,

précise-t-il, avant de poursuivre :

Lexxe does not use “website popularity” as a factor to decide if a webpage is relevant or not. The relevance of a webpage is decided by the matching between the keywords and the content of the webpage based on Lexxe’s linguistic computing and algorithms.

Lexxe est donc un moteur qui s'appuie sur les technologies d'analyse linguistique, tout comme Powerset, dont on avait parlé dans un ou deux billets. Nés dans la même période - à ma connaissance, les deux ont commencé à faire parler d'eux entre 2005 et 2007 -, avant le rachat en 2008 de Powerset par Microsoft.

PowersetLogo.jpg

Si la comparaison des résultats retournés par chacun de ces moteurs à une requête identique, ne doit pas être appréhendée comme absolument représentative de leurs performances générales, on a quand même regardé ce que ça donne...

La réponse de Powerset PowersetReponse.jpg

La réponse de Lexxe LexxeReponse.jpg

Le constat immédiat : Lexxe ose me répondre, Powerset a l'air un peu perdu. N'exagérons rien et n'allons pas prendre pour argent comptant la réponse positive de Lexxe :)

Il faut dire que la question posée "is it ok to drink and drive?" (merci AntEater pour ce fort bon exemple), ne correspond pas à la structure canonique de la phrase interrogative, par exemple dans le contexte d'une application de Questions/Réponses : pas de mot interrogatif (type "wh-") à l'initiale, la tournure de cette question utilise l'inversion sujet/verbe et ne contient aucune forme de type entité nommée (par exemple un nom de personne).

Il y aurait sans doute aussi à regarder du côté de la taille de la fenêtre de mots; par exemple, si la collocation "drink and drive" est présente au moins dans les 5 premiers résultats de Lexxe, elle ne figure dans aucun des 5 premiers résultats retournés par Powerset.

En tous cas, j'espère que Lexxe sera l'objet de d'améliorations futures, car il me semble prometteur sur le segment des moteurs de recherche généralistes. Un écho qui fait bonne transition vers ces feedbacks un peu plus anciens :

"So far it (Lexxe) hasn't generated as much buzz, but the fact that it's in beta, and working is promising."

"This completely new search engine is great from the start, even in it's alpha version if you search in English."

"The concept of Lexxe will be more visible with a query like 'Who was Nietzsche'. As expected, Google produces a very long list of relevant links, but there is no topical order. In contrast Lexxe which is clustering: • German Philosopher of the Late 19th • Superman (Übermensch) • Minister • Mother • Reader • Clergyman • Author• Etc. I'm interested in his relationship to his mother and get more relevant links to his biography, to his medical history, to his mother etc. That's the true strength of Lexxe - topical drilling"