MyLinguistics - Marguerite Leenhardt's Web Log

Aller au contenu | Aller au menu | Aller à la recherche

dimanche 4 octobre 2009

"Google's not a content company" : E. Schmidt sur le web, la presse et le journalisme

Une petite pensée aux connaissances web-journalistiques, qui ne doivent pas manquer de prêter l'oreille aux mots de Schmidt...

Danny Sullivan, chez SearchEngineLand, propose une série d'articles suite à son interview d'Eric Schmidt, CEO de Google depuis 2001, au sujet de la stratégie du leader de la recherche en ligne par rapport aux producteurs et éditeurs de contenus.

Le contexte ambiant, qui combine mutations de la presse off et online, apparition de web services dédiés - Fast Flip chez Google, la bonne initiative du Newspaper Consortium chez Yahoo! - , et plus généralement la mise à disposition des ressources culturelles bibliographiques et journalistiques notamment, oriente l'échange des deux protagonistes autour de la question de la fonction de Google dans l'univers Web - puisqu'il n'est plus besoin de disserter sur sa position de leader incontesté, pour l'instant.

Schmidt affirme :

We need these content partners to survive. We need their content. We are not in the content business. So, you could decide that we’re just evil businessmen trying to give money to the newspapers through the Fast Flip revenue shari..., or you could decide that we’re altruistic and trying to save an important Fourth Estate of American political discourse. Whichever one leads to the same outcome. I hope you believe the second. But even if you believe the first, it’s still good business. We need their content.

Google a besoin de contenu, il innove donc en élaborant de nouveaux outils de gestion et de production de contenus à destination du plus grand nombre. Du contenu qu'il peut se réapproprier aussitôt : je pense en particulier à la prochaine indexation de vos Google Docs, qui mérite un peu d'attention tout de même. On n'aura donc pas d'information produite par Google en dehors de la communication traditionnelle autour de ses technologies.

Pour aller plus loin, lisez les positions de Schmidt :

vendredi 18 septembre 2009

Le TAL français relancé par le volet numérique : petit panorama

NKM a fait un certain bruit médiatique avec les mesures relatives au volet numérique du plan de relance, plutôt focalisé autour du Serious Gaming que des Projets Web Innovants. Je m'intéresse ici surtout à ces derniers, qui ont généré une petite émulation dans la bulle TAL française.

Le mois de septembre a marqué un tournant pour quelques dizaines d'entreprises et laboratoires universitaires qui s'étaient, en juin dernier, lancés dans une haletante ruée vers les Projets Web Innovants. Comme promis, près de trois mois plus tard, le Ministère de l'Economie, de l'Industrie et de l'Emploi annonce la liste des projets financés.

Concernant les laboratoires plutôt connus pour leur spécialité TAL (et pas uniquement en ingénierie documentaire ou en IHM), on remarque le LIP6, le LINA et différents pôles de l'INRIA (Nancy et Sophia-Antipolis notamment), qui partagent la scène avec des écoles, en particulier Sciences-Po Médialab, et Télécom ParisTech.

Côté entreprises, on note surtout :

  • la belle performance de Syllabs, jeune entreprise qui fleurit à sa troisième année, avec Feed-ID, un projet plutôt orienté référencement que pur TAL, pour une agrégation de compétences qui semble prometteuse, compte tenu des briques technologiques développées par cette société et qui sont pour partie destinées à l'aide aux linguistes; un point intéressant à retenir lorsque l'on sait les proximités des solutions de TAL avec les nouvelles industries de la veille web et du monitoring d'information;
  • l'air du temps que respire Lingway, avec un projet de représentation cartographique et d'analyse sémantique - qui n'est pas sans rappeler d'autres projets dans la même veine, en particulier le projet Doxa, débuté l'an dernier;
  • le très intéressant projet GlipFix, dédié à la co-création de contenus informationnels de qualité, porté par FaberNovel, qui s'est pour l'occasion notamment associé à Exalead - fleuron du moteur de recherche made in France, par ailleurs très bien implanté sur le segment des solutions entreprise;
  • on reste dans le thème de l'édition collaborative, avec le projet Topos, autour duquel on retrouve PERTIMM, entreprise également située sur le segment du traitement de l'information.

Sans savoir s'ils ont tous répondu à cet appel d'offres, j'aurais aimé avoir une trace de Temis, SineQua ou Synapse Développement - pour ne citer qu'eux. Tout cela augure cependant un bel avenir à ces - presque incontournables - noms du TAL hexagonal, et instaure un terrain favorable au développement de cette industrie en France.

samedi 12 septembre 2009

Emulations et Google-killing (by M & Q)

  • Solutions grand public : pourquoi confondre "search" et "computational" engines?

Courant mai, la sortie de Wolfram Alpha avait fait son bruit, de bonne qualité m'est avis, comme on le disait ici. Wolfram incarnait alors l'archétype de l'outil de niche, l'outil "geek-profiled", pas forcément compatible avec la recherche grand public telle qu'on la connaît depuis une bonne décennie. Et à raison, parce que Wolfram n'a pas vocation à indexer l'Internet, mais à fournir des calculs complexes sur une pléiade de domaines de connaissances calculables.

ZDNet.fr publiait, début juin, un intéressant comparatif sur les performances de Bing vs. Google, lequel mettait en exergue avantages et faiblesses de chacun des protagonistes. On retiendra, entre autres, que Google a toujours de l'avance sur la pertinence des réponses, même si Bing apporte quelques fonctionnalités intéressantes (display de la recherche d'images, par exemple). J'ajouterais que la gestion de l'appariement est assez raffinée chez Google, ceci contribuant sans doute à expliquer cela.

Un peu plus tardivement dans le mois, TechCrunch US titrait :

When It Comes To Search Trends, Google Is Lagging Behind Bing

On pouvait lire, un peu plus loin dans l'article :

On Google, you can create charts showing the popularity of keywords using Google Trends. On Bing, this feature is called xRank. For all but the most popular terms, Google Trends shows a lag of about three days, whereas xRank shows data that is up to date as of today.

Et Eric Shonfeld de souligner que This may not be a major feature, but it shows a weakness in Google’s armor : cela auguré par le co-auteur de TechCrunch-Us, ça valait le coup d'être quoté!

Toutes choses égales par ailleurs, Bing est plutôt bien accueilli, malgré des habitudes de recherche généralistes fortement liées à Google : Bing gagnait 8% de VU sur le mois de juin 2009, et Google le reconnaissait fin juillet comme l'alternative à la Google-search.

Septembre. Pour la rentrée, Cuil - dont on a parlé ici il y a plus d'un an maintenant et qui s'est modestement rebaptisé "the world's biggest search engine" - a étendu son indexation aux contenus d'actualité, comme l'annonçait ActuAbondance il y a quelques jours de cela. Yuba, - qui vole pour le moment en dessous des radars du web et dont on ne reparlera pas dans ce billet - refait parler de lui, avec une année de plus également. Ils avaient participé au concours TheSearchRace l'an dernier - remporté par iSeek pour la petite histoire -, et soufflent donc leur première bougie en 2009.

  • Mais qu'en dit Alexa?

Un petit tour sur Alexa devrait permettre de se donner un point de vue sur l'évolution de ces différents acteurs de la recherche en ligne. Voyons donc...

alexa-big_three-google_yahoo_bing_wolfram.PNG

A première vue, rien de trop nouveau sous le soleil : Google est toujours la référence, suivi de relativement près par Yahoo!. Quant à Bing, il a trouvé une place et s'y tient malgré tout.

alexa-wolfram_cuil.PNG

Cuil, stable sur les 6 derniers mois tout du moins, n'a pas pâti de l'arrivée de Wolfram Alpha. A noter tout de même que sur le mois d'août, leurs mouvements respectifs en termes de pagerank sont assez synchrones, ce qui conforte l'idée de non concurrence entre ces nouveaux moteurs.

Décidément, comme on avait commencé à le dire ici, Wolfram Alpha ne devrait pas être inclus dans le paradigme des "search engines", puisqu'il n'en est pas un : son positionnement est explicable par son statut de "computational engine". L'ami Q a d'ailleurs une bonne métaphore sur la question :

Wolfram Alpha est à Google et consorts ce qu'une équipe de rugby est à une équipe de football : des gens qui ne jouent pas du tout le même jeu et n'ont rien à faire sur le même terrain.

A noter qu'environ un an après l'acquisition de Powerset par Microsoft, la firme de Steve Ballmer initie un rapprochement entre Bing et Wolfram Alpha. Bing entrerait donc dans l'innovation par la porte du "natural language + computational search inside". Et Q de rajouter :

Mais qu'est-ce qu'une équipe de foot va bien pouvoir faire avec des rugbymen? L'avenir nous le dira, mais on peut d'ores et déjà prévoir des confrontations musclées...

Le point de vue de Q d'après les statistiques Alexa :

parts_google-yahoo-bing.PNG

La diversification des activités de Google et Yahoo! fait que ces statistiques ne peuvent être prises pour argent comptant. En effet, sur la totalité des visiteurs de Yahoo! et Google, une partie non négligeable ne visite pas le moteur de recherche en propre, mais bien le webmail. Or, les statistiques de Bing ne reflètent qu'une pure utilisation de recherche, la fréquentation du webmail de Microsoft -mail.live.com- étant bien séparée de la fréquentation de Bing -bing.com-.

On aurait donc Google qui sur 35% d'internautes en attire 65% (21,78% une fois les comptes effectués) sur la recherche, là où Yahoo, sur ses 26% du total des internautes, n'en voit qu'un petit 10,5% visiter son moteur de recherche (soit 2,72%). Et Bing devancerait donc Yahoo en affichant 3,3% des internautes, tous en recherche.

Si les stats d'Alexa sont un tant soit peu fiables, et si mon raisonnement n'est pas faussé par le jéroboam de palinka qu'on vient de descendre, Bing pourrait être déjà le numéro 2 de la recherche en ligne.


  • Et après...

... une tendance qui devrait s'intensifier. Le récent rapprochement de Yahoo! et Microsoft - fruit d'une négociation longue et riche en rebondissements - a suscité des interrogations chez certains, des réactions sur les perspectives de développement de cette union chez d'autres. L'avis de Fanck Watson chez SearcEnhineWatch.com :

What impact will it really have? OK, Microsoft's market share will be the combined number of the two companies. Add this to the slight rise Bing has received through the new branding and advertising, and Microsoft may be able to start grabbing a little more of the market from Google.

La très sérieuse étude comScore de juillet dernier, fait le tour de la question :

The analysis reveals that while the two companies’ combined search share still lags Google by a wide margin, their combined search audience offers opportunity to become more competitive in the search marketplace.

Si Bing et Yahoo! parviennent à mieux fidéliser leur audience - point fort à la faveur de Google -, ce dernier pourrait céder une plus grosse part de cake à la concurrence.

Merci à Q pour ses croustillants et pertinents insights sur la question!

lundi 17 août 2009

Mozbot/Twitter : un bon combo

Image_1.png Mozbot proposait déjà des possibilités fort sympathiques pour tout utilisateur de moteur de recherche en quête de fonctionnalités peu banales. On se souvient du Mozcloud, qui permettait par exemple de paramétrer la fréquence d'occurrence des formes à représenter dans le nuage de mots. Plusieurs fonctions avaient malheureusement été "purgées" à la demande de Google, tout récemment, en février 2009. On compte parmi ces pertes, précieuses m'est avis, de bien pratiques features :

  • la possibilité de blacklister un lien lors de recherches ultérieures,
  • le choix du domaine de recherche par défaut,
  • l'affichage des copies d'écran des sites,
  • la restitution d'informations connexes sur le site (statistiques d'Alexa),
  • les statistiques sur la fréquence de saisie d'une requête donnée.

Et encore, je fais l'impasse sur d'autres petites choses agréables, mais qui touchent davantage à la customization, comme le choix de la couleur de l'interface; sans parler non plus de fonctions largement répandues depuis que Mozbot a pointé son nez en 2006, typiquement la proposition de requêtes connexes ou encore la correction orthographique.

En bref, il était vraiment dommage de voir Mozbot déplumé de son beau ramage de fonctionnalités innovantes par le plumeur Google. C'est donc avec plaisir que j'ai ouï parler du nouveau temps d'avance de Mozbot : retourner des résultats provenant aussi de Twitter, dans le frame gauche de l'interface.

Image_2.png

Et de trépigner à la lecture des futures moutures annoncées par ActuAbondance sur le sujet :

les deux listes de résultats ont chacune leur utilité : les liens "organiques", issus de Google, proposent sur la gauche les résultats "de confiance", souvent issus de sites importants en dehors de l'actualité "chaude", alors que les résultats Twitter donnent, pour leur part, une vision du "buzz" autour du domaine demandé. Ainsi, par exemple, la requête "3 Suisses" proposera sur Google des liens "corporate", alors que Twitter fournira des infos sur le "Google bombing" subi actuellement par la société

Que nous réserve l'outil du consortium frenchie Abondance, Raynette et Brioude Internet ?

D'autres fonctionnalités suivront dans les semaines et mois qui viennent.

On n'en saura pas plus pour l'instant, mais c'est décidément une affaire à suivre!

lundi 22 juin 2009

A crunch on Hunch ? "Skip this question"

hunch.jpg Hunch, le nouveau produit de la start-up de Caterina Fake (co-fondatrice de Flickr), sorti en juin dernier. En quelques mots? Un moteur qui bénéficie peut-être des effets collatéraux de la campagne de Bing sur le moteur de recherche comme aide à la décision, comme le souligne ActuAbondance (qui nous apprend aussi au passage que Miss Fake s'est, à l'occasion, entourée de chercheurs du MIT) .

Le principe? Intégrer un système incrémental utilisant des arbres de décision pour retourner des propositions à l'utilisateur.

Une sortie discrète pour un outil sur lequel personne n'a grand chose à dire : on en présente le principe ici et , sans vraiment chercher à le tester. Here we go...

Une transparence appréciable et juste ce qu'il faut de camemberts... Hunch-teachHunch-camembert.PNG
Hunch nous dit quelles sont les feuilles de l'arbre de décision qui l'ont mené à nous faire une suggestion donnée : on clique sur Why did Hunch pick this? et on accède aux quatre questions qui ont le plus de poids dans le parcours de l'algorithme. Il indique également, de façon simple, votre "positionnement", en fait le pourcentage de personnes qui ont donné la même réponse que vous à l'une des questions.

Mais une base de connaissances à couverture encore restreinte
Allez donc raconter à Hunch que vous habitez en Europe de l'ouest en testant l'un des parcours proposés à la première connexion "Which cheese would I enjoy?". Surprise! Il connaît des fromages italiens, le brie, mais pas le munster! Testez le mot-clé "munster" dans la boîte de dialogue "Today I'm making a decision about..." : après vous avoir suggéré un "Did you mean : monster", il propose quelques réponses, mais sans rapport avec le fromage... Mince, et si j'avais envie de décider quel vin j'allais boire avec mon munster ce soir?

Pas de procès d'intention, mais une question : pourquoi généraliser à l'ensemble des utilisateurs du Web une procédure de décision typiquement américaine? Seriously, I never bought anything in a Walmart! Why don't you ask me what I think of an Auchan or a Leclerc? En somme, l'outil gagnera beaucoup lorsqu'il sera décliné et mieux adapté à la diversité de ses potentiels utilisateurs.

Pour finir, Hunch a quelques réflexions très curieuses pour un outil ouvert sur l'international, en particulier celle-ci : Hunch-question.PNG

Au bout du compte, on utilise beaucoup la fonction "Skip this question".

jeudi 4 juin 2009

Wolfram a buzzé, Google Labs sort Squared des tiroirs

Image_2.png Un précédent billet donnait quelques éléments en faveur d'une opposition mal posée : Google vs. Worlfram Alpha.
L'idée était de mettre en avant que, non seulement Wolfram Alpha n'avait pas vocation à concurrencer Google, mais que Google commençait à s'inspirer des modèles de restitution des résultats de recherche de son faux outsider. En tous cas, pour ceux qui n'en étaient pas convaincus, on a la preuve tangible que l'information structurée est bien l'avenir des moteurs de recherche grand public.

On pouvait lire début mail sur TechCrunch un excellent billet sur le sujet, dans une perspective comparative à la défaveur de Wolfram Alpha. L'autre membre de la comparaison? Google Squared, très attendu, dont ActuAbondance et TechChunch-fr parlent aujourd'hui.

Nous y voilà : Google s'est bien inspiré de Wolfram Alpha, si la chronologie que donne à voir le web sur ce point peut être estimée fiable. La différence? Wolphram Alpha compute sur quelques dizaines de teraoctets. Avec Squared, Google est en train d'opérer sur le web entier pour que l'utilisateur le perçoive comme mieux rangé, facilitant son accès à l'information "pertinente". Oui, des guillemets. TechChrunch l'avait vu venir de loin, c'est déjà en train de se passer, mais comme la pilule est bien emballée, l'utilisateur l'avalera sans peine :

Turning the Web into a giant database will crush any attempt to segregate the “best” information into a separate database so that it can be processed and searched more deeply.

Une bonne raison pour les internautes de considérer avec précaution la pertinence de la référence nommée Google.

A l'heure où Pasquier prend soin de vous éviter un geste en plus en vous vendant des pains au lait prédécoupés, Google n'est-il pas en train de nous vendre de la pertinence prédécoupée, rongeant un peu plus notre envie de questionner la pertinence du résultat?

mardi 2 juin 2009

Wolfram Alpha / Google : les bons termes de la Question ?

WolframAlpha.PNGWolfram Alpha buzze depuis quelques semaines déjà.
L'image d'un effet d'annonce autour d'un non Google-killer le poursuit, celle d'un énième moteur de recherche "intelligent" qui laisse surtout le goût d'une communication bien orchestrée par Stephen Wolfram à ceux qui en ont parlé. En témoignent les articles parus dans 20minutes.fr et LeMonde.fr.

Des bases de données pas à jour, voire lacunaires. Une mauvaise gestion des chaînes de caractères. Un taux élevé d'échec à fournir une réponse. Ce sont ses trois grands défauts. Futura-sciences.com, qui consacrait un bel article à Wolfram en mai dernier, y fait le constat suivant :

En attendant, Google, Wikipédia et les liens qu’ils fournissent sont la plupart du temps largement meilleurs.

Sur Slate.com, la conclusion n'est pas très enjouée non plus :

Wolfram Alpha doesn't revolutionize search; at best, it adds a marginally useful new layer on top of it.

De toute évidence, en l'état, Wolphram n'a pas l'allure d'un moteur grand public. D'un moteur auquel certains trouveront des utilités, peut-être. En tous cas, il connaît un peu le breton, et ça a été une fort bonne surprise de pouvoir tester une requête sur le "Malagasy Language", pour trouver en quelques clics des informations sur le dialecte Betsimsaraka parlé dans le sud du pays. Dans le même cas de figure, Google ne fait pas aussi bien. Les fonctions de "Word Puzzle" sont sympa, les dictionnaires ne sont pas plus surprenants que ça, mais le rendu est agréable.

Manifestement, Wolfram Alpha ne suscite pas les mêmes comportements de recherche. Il s'adresse sans doute davantage à des utilisateurs en quête d'information spécifique, restituée dans un contenu structuré qui va à rebours de la logique de foisonnement de résultats. De l'information qui, si elle est estimée valide, peut être directement intégrée dans un document de travail, comme on le ferait avec des résultats d'InternetWorldStats ou d'Alexa.

Wolfram-resultats-facebook.PNG

Wolfram Alpha will prove helpful to some people. Because it's based on Wolfram Mathematica, a software package that can do complex calculations, mathematicians, engineers, and scientists will find much to love in it. Wolfram Alpha solves difficult equations and makes nice graphs for lots of specialized inquiries,

peut-on lire sur Slate.com.

Une belle transition à l'avis de Q - initiateur du présent billet -, qui met tout le monde d'accord :

Ceci étant dit, je tends à valider la conclusion que les geeks, les ingénieurs et les chercheurs en sciences devraient y trouver du bon...

Et celui-ci de conclure, fort perspicacement :

WolframAlpha ne vise pas à concurrencer Google, mais Google intègre de plus en plus de résultats Wolfram-style (tapes "scores L1" dans Google, pour voir...)

Wolfram-Google-resultat-Ligue1.PNG

Heureusement, Q est là pour montrer un nez au milieu d'une figure parfois trop familière. Prendre Google comme référence, soit, oublier que parfois, il peut s'inspirer des autres... c'est à croire qu'on peut avoir le nez bien court.

A lire à part ça : des doutes sur la Google Search Appliance 6.0

lundi 1 juin 2009

"The 100 most mentioned brands on Twitter" : de l'erreur de méthode à la désinformation

Début mai, Revolutionmagazine publiait un billet avec un titre plein de promesses, une porte ouverte (gratuite) à une étude de visibilité des marques sur Twitter : LE classement des 100 marques les plus citées.

Par l'odeur alléchée, je m'y rends, à l'affût de quelque découverte : une nouvelle application, une bonne idée, un biais méthodologique particulier... Le chapeau du billet annonce tout de même :

Revolution teamed up with i-level's social media agency Jam to reveal the 100 most mentioned brands on Twitter and how they are aiming to capitalise on the buzz

Le tableau à cinq colonnes, précisant la marque, son rang, le nombre de mentions de la marque, le compte Twitter et le nombre de followers, est un panorama un peu léger, mais passons. Pour entrée en matière, ça fait l'affaire.

LE problème? La matière justement... Aucune information sur la méthode employée, pas de contextualisation des résultats, un tableau, simplement un tableau. Indiqué par une astérisque, le seul commentaire du tableau précise :

*Figures are correct according to Jam's research which took place over three days in April 2009

Quels jours? Quels plages horaires? Un petit lien vers la 'Jam social media agency'? On n'en saura pas plus. Et pour le how they are aiming to capitalize on the buzz, on repassera.

L'idée d'observer la visibilité et l'implication des marques sur Twitter est bonne, incontournable même pour un état du 2.0. Mais les résultats de telles observations ne valent que par le contexte qui les entoure, surtout quand on parle de l'analyse d'un stream continu d'information. C'est ce point qu'il faut mettre en avant pour les lecteurs de l'étude : c'est un instantané du web qui doit être interprété avec précaution.

Des outils et une méthode de travail adaptée auraient rendu cet essai plus concluant et plus riche d'enseignements pour la métacommunauté des analystes web. Quid d'une application de TAL avec quelques bases élémentaires de statistique textuelle dedans, des ressources pour traiter plus finement les contenus? Pourquoi pas un petit graphique de l'évolution du nombre de citations par jour dans les tweets, mieux, en fonction d'une typologie des tweets?

Avec une méthodologie inexistante (un décompte manuel sur trois jours sans contexutaliser les résultats), il serait sans doute bon d'être un peu plus précautionneux lorsqu'on joue avec les effets d'annonce.

Parce qu'une information mal traitée est un premier pas vers la désinformation.

jeudi 28 mai 2009

AV, Siri! Ou l'intelligence pour iPhone et Smartphones

Image_1.pngSiri, l'AV (assistant virtuel) qui va révolutionner l'expérience utilisateur sur l'iPhone et autres Smartphones. Quelques explications...

Siri n'a pas l'objectif de révolutionner la recherche en ligne sur terminal mobile, mais de proposer des solutions pour faciliter la vie : ce n'est pas là d'un énième Google Killer, mais un assistant virtuel dont l'arrivée marque un tournant technologique majeur dans notre interaction quotidienne avec nos goodies high-tech!

Mais avant tout, qu'est-ce qu'un assistant virtuel ?

  • aider l'utilisateur à accéder à une information ou à exécuter une tâche;
  • comprendre l'intention de l'utilisateur en fonction du contexte;
  • travailler pour l'utilisateur, i.e. être autonome dans l'exécution des tâches intermédiaires pour apporter une réponse finale à l'utilisateur.

Le shift? On passe de l'adaptation d'outils - ce qu'on fait constamment en configurant les interfaces qu'on utilise au quotidien - à l'interaction avec une application intelligente. (A voir : la Technology Review du MIT en parlait dans son édition de mars/avril)

On annonce des performances exceptionnelles en reconnaissance vocale - ce que Google offre déjà avec Android - mais sur le principe, Siri fait mieux : c'est un agent conversationnel nouvelle génération, en plus d'être un outil qui n'impose pas à l'utilisateur de se servir des touches pour exécuter des actions. Tout peut se faire à la voix. L'intégration de fonctionnalités de synthèse vocales sont à l'étude, ce qui garantirait une accessibilité optimale aux utilisateurs atteints de cécité, par exemple.

Siri mettrai à profit les technologies d'autocomplétion et de navigation contextuelle. Son avantage saillant ? L'opérationnalisation, i.e. découper votre besoin en tâches et sous-tâches à exécuter pour retourner une réponse pertinente, en fonction des données contextuelles qu'il connaît sur son utilisateur. Une belle performance d'utilisation des algorithmes d'apprentissage automatique!

Les ressources actuelles pour la géolocalisation, la reconnaissance et l'extraction d'entités nommées (noms de personnes et dates, par exemple) et les technologies fondées sur les ontologies du langage (ne poussons pas le rêve trop loin, c'est un assistant, pas un humain en boîte) seraient particulièrement bien exploitées. En bref, une grille de lecture du monde étendue qui vous facilite la vie!

Siri, une startup qui aura bien exploité sa levée de fonds de 8,5 millions de dollars en 2008!

Pour aller plus loin : à lire chez nos amis de TechCrunch et de Twine

dimanche 26 avril 2009

A venir : une présentation d'OpenCalais

Cela fait déjà quelques mois que je repousse le moment de mettre sérieusement à parler du système OpenCalais. Promis, j'arrête la procrastination et je vous prépare quelque chose pour bientôt!

- page 2 de 5 -