Traitement automatique du langage naturel

lfial2620  2020-2021  Louvain-la-Neuve

Traitement automatique du langage naturel
En raison de la crise du COVID-19, les informations ci-dessous sont susceptibles d’être modifiées, notamment celles qui concernent le mode d’enseignement (en présentiel, en distanciel ou sous un format comodal ou hybride).
5 crédits
22.5 h
Q1
Enseignants
Fairon Cédrick; Tack Anaïs (supplée Fairon Cédrick);
Langue
d'enseignement
Français
Préalables
/
Thèmes abordés
Le cours débute par l'étude de l'architecture d'un système complexe de traitement automatique du langage (reconnaissance, analyse, génération). Il se poursuit par l'étude de théories linguistiques et formalismes informatiques centraux dans le domaine du TALN. Une attention particulière est accordée à la présentation et à l'analyse d'applications réelles.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Le cours apportera à l'étudiant les bases théoriques nécessaires à la compréhension des objectifs et des défis actuels du traitement automatique du langage naturel (TALN). En parallèle, l'étudiant apprendra à analyser et à expliquer les limites pratiques et techniques que l'on rencontre dans la mise en place de systèmes informatiques destinés au traitement des langues (problèmes d'ambiguïtés, nécessité d'adaptabilité des ressources linguistiques, multilinguisme, etc.). Au terme du cours, l'étudiant aura eu un aperçu de " l'état de l'art " en matière de TALN, sera en mesure de porter un regard critique sur des applications de TALN et aura une connaissance générale des principales théories du domaine
 
Contenu
Le cours est donné sous forme d'exposé magistral interactif. Un dossier de lecture composé d'articles spécialisés permet aux étudiants de préparer les cours.
Plan du cours :
- Le domaine du TAL (dénomination, aperçu historique, niveaux d'analyse)
- Le codage et les pré-traitements
- Les langages formels (expressions régulières, FSA)
- Les modèles de langue probabilistes (notions de probabilité, modèles n-grams)
- Les ressources lexicales (dictionnaires électroniques, etc.)
- La lemmatisation
- La détermination des natures (approche par règles, HMMs)
- Les grammaires formelles (hiérarchie de Chomsky, grammaires non contextuelles)
- Le parsing syntaxique (principes généraux, alternatives)
- La sémantique lexicale (thésaurus, ontologies, WordNet)
- La sémantique vectorielle (distributionnalisme, plongements lexicaux)
Modes d'évaluation
des acquis des étudiants

En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.

- Deux travaux pratiques à réaliser au cours du quadrimestre [6 points]
- Examen écrit (ou oral) portant portant majoritairement sur le cours et, dans une moindre mesure, sur les concepts importants issus des lectures obligatoires [14 points]
Autres infos
English-friendly course : cours enseigné en français mais offrant des facilités en anglais.
Support de cours
  • Jurafsky & Martin, "Speech and Language Processing" (2nd edition)
Faculté ou entité
en charge
FIAL


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en science des données, orientation statistique

Master [120] en linguistique

Master [120] en langues et lettres anciennes et modernes

Master [120] en langues et lettres françaises et romanes, orientation français langue étrangère