MyLinguistics - Marguerite Leenhardt's Web Log

Aller au contenu | Aller au menu | Aller à la recherche

Tag - Wolfram Alpha

Fil des billets - Fil des commentaires

jeudi 27 mai 2010

Des nouvelles de Wolfram

Wolfram, notre ami le moteur computationnel dont on a déjà eu l'occasion de parler sur ce petit carnet web - ici, ici et notamment - a refait pulser certaines régions du web en premier Quarter 2010. Par quoi cette émulation fut-elle générée ? Par un prix, pardi !

Incipit. Wolfram participe au South by Southwest (SXSW, Inc.), un événement culturel global (cinéma, musique, technologies digitales) actif depuis 1987, au Texas (USA). Sélectionnée pour figurer parmi les finalistes le 12 février, c'est l'annonce des lauréats des SXSW web awards 2010 le 14 mars qui coiffe la famille d'outils Wolfram de succès.

La brève AFP qui en découle est relayée par Le Figaro le 15 mars 2010. Un billet de Motrech sur le prix SXSW remporté par Wolfram Alpha, en parle également dès le 18 mars.

Ce retour sur le devant de la scène est fort bénéfique à Wolfram, qui fait l'objet d'une excellente présentation, parue le 26 mai, dans la Tribune de Genève :

une pléiade de sites Web, parmi lesquels un compendium de connaissances mathématiques (Wolfram Math World, mathworld.wolfram.com), un répertoire de visualisations interactives (Demonstrations Project, demonstrations.wolfram.com) et le moteur «computationnel» Wolfram Alpha (lire ci-dessus). Plus léger et amusant, Wolfram Tones (tones.wolfram.com) permet de composer sa propre musique à partir de modèles sonores et de formules mathématiques. Bluffant!

Ce qui est sûr, c'est que le moteur a bénéficié d'une nette amélioration des résultats : la base de données computables s'est considérablement étendue.

Seule petite ombre : Wolfram a d'emblée pâti de verrous en Traitement Automatique des Langues, ce que nous expliquait Tom Krazit de chez CNET News en août 2009, dans un billet republié sur la version US de ZDNet où il rapportait les propos de Stephen Wolfram :

linguistic problems are to blame for half of the occasions when Wolfram Alpha does not return a result. That percentage is changing as Wolfram refines the science behind Wolfram Alpha, but it will take some time.

Voyons-voir, avec un petit test simple. La base en Traitement Automatique des Langues, c'est avant tout de travailler avec des unités textuelles "propres", i.e. bien isolées et pour lesquelles on a observé une grande quantité de phénomènes d'occurrence afin d'identifier des problèmes d'ambiguïté, de silence (ce qui est pertinent et que l'on n'arrive pas à capter) et de bruit (ce que l'on capte et qui n'est pas pertinent) potentiels.

Voyons donc :

Etape 1 : WolframAlpha_test_1.png

Constat 1 > Le moteur ne sait pas comment interpréter.

Etape 2 : WolframAlpha_test_2.png

Constat 2 > Le moteur interprète et retourne une réponse. Il m'explique ce qu'est un astérisque.

Etape 3 : WolframAlpha_test_3.png

Constat 3 > Le moteur interprète et retourne une réponse. Il m'explique à nouveau ce qu'est un astérisque.

Qu'en dire ? Le blanc (espace entre deux caractères alphanumériques) n'est pas un critère distinctif pour le moteur, il retourne donc la même réponse pour la séquence "a*" et "a *". On suppute dans l'oreillette que la segmentation du texte saisi par l'utilisateur ne fait probablement pas trop cas de ce qui se trouve à gauche ou à droite pour y isoler des unités.

Oui, je l'avoue, si la réponse du Test 3 me paraît pertinente et riche en informations sur le caractère qu'est l'astérisque, j'espérais secrètement que Wolfram mette en rapport la recherche du Test 2 avec l'écriture conventionnelle de l'étoile de Kleene, souvent notée V*. En regexp, c'est proche (recherche d'un caractère alphabétique en casse majeure ou mineure suivi d'une astérisque).

Par contre, regardez : Wolfram_whatisalinguist.png

Et oui, Wolfram est un moteur bien cultivé :) Les ressources encyclopédiques du système sont en constante expansion, et même si des remarques plus consistantes sont possibles - sur la segmentation par exemple - je pense que ces points sont en cours de résolution et que Wolfram Alpha est véritablement à la hauteur des retours positifs suite au SXSW.

A voir pour en savoir plus sur l'ensemble des initiatives Wolfram :

  • http://www.wolfram.com/solutions/france/
  • http://blog.wolframalpha.com/
  • http://www.wolframalpha.com/
  • http://www.wolfram.com/

jeudi 4 juin 2009

Wolfram a buzzé, Google Labs sort Squared des tiroirs

Image_2.png Un précédent billet donnait quelques éléments en faveur d'une opposition mal posée : Google vs. Worlfram Alpha.
L'idée était de mettre en avant que, non seulement Wolfram Alpha n'avait pas vocation à concurrencer Google, mais que Google commençait à s'inspirer des modèles de restitution des résultats de recherche de son faux outsider. En tous cas, pour ceux qui n'en étaient pas convaincus, on a la preuve tangible que l'information structurée est bien l'avenir des moteurs de recherche grand public.

On pouvait lire début mail sur TechCrunch un excellent billet sur le sujet, dans une perspective comparative à la défaveur de Wolfram Alpha. L'autre membre de la comparaison? Google Squared, très attendu, dont ActuAbondance et TechChunch-fr parlent aujourd'hui.

Nous y voilà : Google s'est bien inspiré de Wolfram Alpha, si la chronologie que donne à voir le web sur ce point peut être estimée fiable. La différence? Wolphram Alpha compute sur quelques dizaines de teraoctets. Avec Squared, Google est en train d'opérer sur le web entier pour que l'utilisateur le perçoive comme mieux rangé, facilitant son accès à l'information "pertinente". Oui, des guillemets. TechChrunch l'avait vu venir de loin, c'est déjà en train de se passer, mais comme la pilule est bien emballée, l'utilisateur l'avalera sans peine :

Turning the Web into a giant database will crush any attempt to segregate the “best” information into a separate database so that it can be processed and searched more deeply.

Une bonne raison pour les internautes de considérer avec précaution la pertinence de la référence nommée Google.

A l'heure où Pasquier prend soin de vous éviter un geste en plus en vous vendant des pains au lait prédécoupés, Google n'est-il pas en train de nous vendre de la pertinence prédécoupée, rongeant un peu plus notre envie de questionner la pertinence du résultat?

mardi 2 juin 2009

Wolfram Alpha / Google : les bons termes de la Question ?

WolframAlpha.PNGWolfram Alpha buzze depuis quelques semaines déjà.
L'image d'un effet d'annonce autour d'un non Google-killer le poursuit, celle d'un énième moteur de recherche "intelligent" qui laisse surtout le goût d'une communication bien orchestrée par Stephen Wolfram à ceux qui en ont parlé. En témoignent les articles parus dans 20minutes.fr et LeMonde.fr.

Des bases de données pas à jour, voire lacunaires. Une mauvaise gestion des chaînes de caractères. Un taux élevé d'échec à fournir une réponse. Ce sont ses trois grands défauts. Futura-sciences.com, qui consacrait un bel article à Wolfram en mai dernier, y fait le constat suivant :

En attendant, Google, Wikipédia et les liens qu’ils fournissent sont la plupart du temps largement meilleurs.

Sur Slate.com, la conclusion n'est pas très enjouée non plus :

Wolfram Alpha doesn't revolutionize search; at best, it adds a marginally useful new layer on top of it.

De toute évidence, en l'état, Wolphram n'a pas l'allure d'un moteur grand public. D'un moteur auquel certains trouveront des utilités, peut-être. En tous cas, il connaît un peu le breton, et ça a été une fort bonne surprise de pouvoir tester une requête sur le "Malagasy Language", pour trouver en quelques clics des informations sur le dialecte Betsimsaraka parlé dans le sud du pays. Dans le même cas de figure, Google ne fait pas aussi bien. Les fonctions de "Word Puzzle" sont sympa, les dictionnaires ne sont pas plus surprenants que ça, mais le rendu est agréable.

Manifestement, Wolfram Alpha ne suscite pas les mêmes comportements de recherche. Il s'adresse sans doute davantage à des utilisateurs en quête d'information spécifique, restituée dans un contenu structuré qui va à rebours de la logique de foisonnement de résultats. De l'information qui, si elle est estimée valide, peut être directement intégrée dans un document de travail, comme on le ferait avec des résultats d'InternetWorldStats ou d'Alexa.

Wolfram-resultats-facebook.PNG

Wolfram Alpha will prove helpful to some people. Because it's based on Wolfram Mathematica, a software package that can do complex calculations, mathematicians, engineers, and scientists will find much to love in it. Wolfram Alpha solves difficult equations and makes nice graphs for lots of specialized inquiries,

peut-on lire sur Slate.com.

Une belle transition à l'avis de Q - initiateur du présent billet -, qui met tout le monde d'accord :

Ceci étant dit, je tends à valider la conclusion que les geeks, les ingénieurs et les chercheurs en sciences devraient y trouver du bon...

Et celui-ci de conclure, fort perspicacement :

WolframAlpha ne vise pas à concurrencer Google, mais Google intègre de plus en plus de résultats Wolfram-style (tapes "scores L1" dans Google, pour voir...)

Wolfram-Google-resultat-Ligue1.PNG

Heureusement, Q est là pour montrer un nez au milieu d'une figure parfois trop familière. Prendre Google comme référence, soit, oublier que parfois, il peut s'inspirer des autres... c'est à croire qu'on peut avoir le nez bien court.

A lire à part ça : des doutes sur la Google Search Appliance 6.0