MyLinguistics - Marguerite Leenhardt's Web Log

Aller au contenu | Aller au menu | Aller à la recherche

mercredi 20 août 2008

IBM, la reconnaissance vocale et ses nouveaux marchés

BusinessWeek en parle cette semaine : IBM entend trouver de nouveaux marchés pour ses applications de reconnaissance vocale embarquée,

in applications including autos, mobile phones, call centers, medical systems, and transcription services.

Ces dernières années, de nombreux chercheurs à travers le monde se sont préoccupés de l'adaptation de technologies et de la constitution de ressources pour des langues peu dotées (depuis l'arabe dialectal irakien jusqu'au khmer, en passant par l'amharique). Si IBM ne trouve pas un marché tout à fait réceptif aujourd'hui, la firme peut tout de même envisager le rachat, tout du moins l'absorption des retombées de ces travaux (pour mémoire, je vous invite à lire la section 3 d'un précédent papier lié à ce billet).
Espérons Rêvons que l'assaut d'IBM pour transférer ces technologies, initialement développées pour des utilisations militaires, à des marchés grand public, n'oubliera pas l'ensemble des problématiques humaines, culturelles, éducationnelles liées à l'effort de recherche.

mercredi 23 juillet 2008

Outils de traitement de corpus et langues peu dotées

Les langues rares, en voie d'extinction ou dans le meilleur des cas encore pratiquées par une communauté active, sont majoritairement sous représentées sur la grande toile d'information nommée Web. Il est certain que des enjeux économico-historiques ont contribué à cet état de fait, en particulier pour ce qui impacte les politiques linguistiques, d'instruction et d'équipement en infrastructures d'enseignement.
J'ai trouvé l'occasion, dans un devoir pour un cours intitulé Outils de traitement de corpus, de constituer un modeste panorama du sujet, en recensant quelques outils de TAL existants ainsi que certaines initiatives pour l'accès à la numérisation de ces langues, dites peu dotées.

Vous trouverez le papier ici (OTC-languesPeuDotées) et le résumé ci-dessous :

Nous nous proposons ici de donner un panorama des recherches et outils développés pour le traitement automatique des langues peu dotées, ou langues-pi. La possibilité de pouvoir constituer et analyser des ressources linguistiques informatisées pour de telles langues relève de perspectives humaines et culturelles. En effet, les travaux de recherche du TAL appliquées aux langues minoritaires contribuent sans doute de leur survie, s'inscrivant dans une perspective de préservation du patrimoine culturel associé à une langue, et peuvent par ailleurs constituer paramètre décisif dans l'alphabétisation des populations.