Lu sur TechCrunch il y a trois jours. Il y a sans doute nouvelle plus fraîche que celle-là, mais concentrons-nous sur la tendance lourde, comma dirait une amie super veilleuse au sens de la formule éveillé.
Le rachat des boîtes de développement de moteurs de recherche sémantique : après Powerset, Summize. Avec des acquéreurs effectifs ou potentiels au profil très différent.
Summize-Twitter vs Powerset-Microsoft, l'opposition sans intérêt qu'on peut poser tout de même, pour mettre en perspective deux destins d'applications d'analyse du langage naturel. Aggréger l'information pour la classification automatique en fonction de l'opinion - ce que fait Summize en proposant un classement des résultats selon le paramètre ''Attitude'' - le tout appliqué aux contenus twittés. Palpitt, bien meilleur expert que moi sur l'artefact Twitter, livre à cet égard quelques considérations dans son analyse de la libération de Bétancourt sur Twitter :

- Les battements de Twitter sont intimement liés à l'actualité

- Twitter est un champion de la réactivité, de l'info de dernière minute (de la "breaking news"), au point qu'il devienne pour certains un lieu privilégié de découverte d'informations.

twitter centralise l'information

A lire aussi : Ingrid Betancourt libérée (Wikipédia a été tout aussi réactif)

- Les tweets qui ne comportent pas de liens sont le plus souvent de l'ordre du ressenti

Plusieurs choses. L'ensemble de données auxquelles on applique l'indexation, ou comment la réactivité de la source d'information doit être un acquis. Pour mémoire, Powerset indexe les contenus de Wikipédia. Ensuite, l'objectif de l'application : Microsoft investit dans l'interrogation en langage naturel, Twitter dans le langage subjectif comme paramètre pour la pertinence des résultats. Ce dernier champ de recherche s'est développé avec les applications liées au marketing en ligne de mire, pour mieux classer les cibles.

Attendons la suite.