Je vous propose un petit papier écrit cette année écrit pour un cours d'Analyse Robuste, qui brosse une introduction aux modèles d'analyse du TAL et les problèmes de robustesse : en fait, ça se résume à la capacité des systèmes d'analyse à produire une donnée pertinente pour l'objectif de l'application.

Voici le papier (AnalyseRobuste-DM) et son résumé :

Du point de vue du Traitement Automatique des Langues (TAL), la notion d'analyse renvoie à l'analyse des formes linguistiques, c'est-à-dire des séquences de symboles constitutives du donné linguistique. Il s'agit de mobiliser un modèle d'interprétation de ces séquences de symboles, défini en fonction de données extérieures que sont, par exemple, les connaissances linguistiques, entre autres conventions d'interprétation des symboles que l'on souhaite analyser. Nous tenterons dans ce devoir de faire état des différents niveaux d'analyse, des transformations qu'elles appliquent aux données en entrée et d'identifier les problèmes de robustesse des applications qui découlent de ces analyses.