Microsoft et Powerset : la rumeur de rachat
Par Marguerite le vendredi 27 juin 2008, 10:28 - Web Sémantique ? - Lien permanent
Lu dans ReadWriteWeb et TechCrunchFrance ce matin.
Powerset fait parler de
lui depuis quelques temps déjà. MarketWatch l'avait vu venir de loin :
Powerset's technology is different from prior attempts in this vein
La force de Powerset : une autre conception de
l'indexation :
Indexing in natural language requires about 100 times more computational power than indexing keywords, which is what the popular search engines do today. The cost of central-processing unit cycles was eight times more expensive six years ago (in other words, three iterations of Moore's Law).
That's the problem with existing search engines, Powerset's founders say. Conventional search indexes words based on the occurrence they're mentioned and their proximity are to one another. Where they fall short is they don't index the relationships between words or the meanings of the words themselves.
Forbes a initié le buzz en début d'année, Crunchbase,
GenerationNT, ZDNet on largement relayé et délayé sur l'existence de ce "Google
outsider".

J'ai testé rapidement. Where is Madagascar?, How do you
say hello in russian?, Who is Eichiro Oda?, When was
Noam Chomsky born?. Eh ben, ça marche plutôt bien
et ça évite de
connaître par coeur les "define:" et autres "howto:" pour interroger l'ami
Google.
La preuve en image :

Si Microsoft veut mettre la main dessus, c'est qu'il y a du potentiel
là-dedans... Surtout lorsqu'on sait que Microsoft Research planche sur les
technologies de sentiment analysis et d'opinion mining
depuis 2004 (à ma connaissance).
Commentaires
A venir, d'intéressantes remarques de Q1 qui a testé l'engin avec des requêtes retorses!
Résultats de requêtes :
Who is Alan Moore ?
+ : La première page wikipedia est bien celle consacrée au scénariste de comics concerné
- : Le résumé ne donne pas exactement ses oeuvres majeures et a une fâcheuse tendance à se polluer de mots génériques (series, tory, novel) pas très parlants.
Who wrote Dead Man ?
Rien à redire, "Dead Man : screenplay by Jim Jarmusch", avec photo du gars. Nickel chrome, impeccable.
Who wrote Dead Man Walking ?
Et là, c'est le drame... Big Fun a écrit Dead Man Walking (terme ambigu, certes, m'enfin l'interprétation foireuse de la phrase :
Ca craint du boudin, vu qu'au final, ce serait plutôt Nigel Fairs, la bonne réponse. Y'a de l'analyse grammaticale à améliorer.
What the hell is a grapefruit?
"Où l'on découvre que powerset ne gère pas les formes familières"
Nota : What is a grapefruit donne un résultat tiptop, quand même...
What is Waffen SS ?
-> des résultats assez médiocres, pollués à mort par des mots communs et peu explicites.
L'ajut d'un tiret (Waffen-SS) change la liste de mots associés, mais ça reste très peu clair. Perso, j'en déduis pas que la Waffen-SS était un corps d'armée nazi... Allemand, si je sais reconnaître des bout de langue teutonne, mais nazi non.
How to smother someone to death ?
Il reconnaît bien le synonyme strangle et donne pas mal de pages parlant de meurtre par étranglement, mais point de détail sur comment qu'on fait. Tant mieux pour l'ordre public, tant pis pour la précision.
Conclu à Quentin :
Si je voulais être médisant, je dirais que Powerset se laisse bouffer facilement par pas grand chose. Mais les réponses exactes ont tellement de la gueule que je suis tenté d'être plutôt indulgent envers ce moteur.
Bon alors j'ai écris, de façon très narcissique il est vrai "Qui est véritablement Thomas Perrodin ?".
Résultat, aucune réponse.
J'en déduis que :
1. Je ne suis pas connu, en tout cas personne n'a écrit sur moi dans les affres du net participatif.
2.Powerset est vraiment loin de toute les questions de vérité et je ne pense pas qu'il dispose, et d'ailleurs aucune manière, de la science infuse.
A la question "C'est quoi la Qualia ?"
Le moteur m'a renvoyé sur la fiche de Jean Dupuy, vif représentant du mouvement artistique fluxus.
Le lien à ma question est une publication "1991 QUOI ? QUOI ?, Donguy Paris"
Par contre, dans l'idée de la Qualia, le lien à Fluxus est plutot bien vu (http://fr.wikipedia.org/wiki/Qualia).
Qualia est le pluriel de quale, donc "les Qualia" mais avec le pluriel aucun résultat ne ressort.
Voilà..
Hmmmm...Pas convaincu, je lui ai demandé quelles sont les espèces de loutres vivant en europe, pas foutu de me répondre. J'ai continué avec "Les skinheads sont ils racistes ?" et les résultats même si probants restent assez vagues.
Le coup de grâce: "Is it ok to drink and drive ?"
Reponse completement dans les choux a base de paroles de Ok computer de radiohead et de tout et n'importe quoi. Sur ce je vais boire et conduire puisque Powerset a l'air d'accord.
à la question "when did herculine barbin die?", powerset répond par "Herculine Barbin: year of death 1868". ni plus ni moins. je suis impressionné!
deuxième question: "what are munchies?". powerset me donne une liste d'éventuelles réponses. la première entrée est celle que j'attendais : "The "Munchies" is a term that is often used to describe the increased appetite that comes from using cannabis."
quand je demande "how to prepare a shirley temple?", powerset me propose en première entrée la biographie de shirley temple et en deuxième entrée la recette du cocktail. mais pourquoi en deuxième s'il y a une suite Det + N? calcul de probabilités?
si on demande "what is cockcheese?", powerset répond par: "Smegma, a secretion of mammalian genitals" et donne un lien vers une page sur le smegma. j'ai cherché le mot "cockcheese" sur cette page et il n'y apparait pas. c'est bizarre! il doit y avoir des mots associés cachés...
je vais continuer à tester