Ceci est une ancienne révision du document !


Les modèles de langages

Cet enseignement présente les principales méthodes utilisées pour évaluer, estimer et intégrer des modèles de langage dans un cadre stochastique. Les notions abordées sont successivement :

  1. l’évaluation des modèles de langage (Perplexité, Taux d’erreur mot)
  2. les classes d’équivalence d’historiques (L’approche n-gramme, le modèle cache, les modèles exponentiels) ainsi que des alternatives (Modèle par arbres de décision, grammaires probabilistes hors-contexte et grammaires probabilistes lexicalisées)
  3. l’estimation des modèles de langage (Les distributions de probabilités, les différents types d’estimation: maximum de vraisemblance, maximum a posteriori, Good-Turing, …)
  4. les méthodes de lissage (l’interpolation et le repli, les principales méthodes : Jelinek-Mercer, Katz, Witten-Bell, Kneser-Ney)
  5. l’intégration dans un système de dialogue oral (facteur d’échelle, facteurs de pénalité, stockage et accès rapide)
  6. autres exemples d’application (la correction orthographique et grammaticale, la traduction automatique : méthode par analogie)
enseignement/ml.1353367595.txt.gz · Dernière modification: 2012/11/20 00:26 par janiszek