5 crédits
30.0 h + 15.0 h
Q1
Enseignants
Dupont Pierre; Fairon Cédrick;
Langue
d'enseignement
d'enseignement
Anglais
Thèmes abordés
- Concepts de base en phonologie, morphologie, syntaxe et sémantique
- Ressources linguistiques
- Etiquetage en partie du discours
- Modélisation statistique de la langue (N-grams et modèles de Markov cachés)
- Algorithmes d'analyse robuste, grammaires hors-contexte probabilistes
- Applications de l'ingénierie linguistique telles que les logiciels de correction orthographique ou grammaticale, l'étiquetage en partie du discours ,l'indexation automatique de documents ou la catégorisation de textes
Acquis
d'apprentissage
d'apprentissage
A la fin de cette unité d’enseignement, l’étudiant est capable de : | |
1 | Eu égard au référentiel AA du programme « Master ingénieur civil en informatique », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants :
Eu égard au référentiel AA du programme « Master [120] en sciences informatiques », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants :
Les étudiants ayant suivi avec fruit ce cours seront capables de
Les étudiants auront développé des compétences méthodologiques et opérationnelles. En particulier, ils auront développé leur capacité à
|
La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».
Contenu
- Bases en linguistique : morphologie, partie du discours, structures de phrase, sémantique et pragmatique
- Rappels mathématiques : langages formels et éléments de la théorie de l'information
- Analyse de corpus : formatage, tokenization, morphologie, marquage des données
- N-grams : estimation par maximum de vraisemblance et lissage
- Modèles de Markov Cachés : définitions, algorithmes de Baum-Welch et de Viterbi
- Etiquetage en parties du discours
- Grammaires hors-contexte probabilistes : estimation des paramètres et algorithmes d'analyse, utilisation de treebanks
- Traduction automatique: méthodes classiques et statistiques (modèles IBM, modèles basés sur des segments de phrases), évaluation
-
Applications : prédicteur de mots pour SMS, marquage de parties de texte, outils d'extraction d'information
http://moodleucl.uclouvain.be/course/view.php?id=7865
Méthodes d'enseignement
- 12 cours magistraux
- 3 miniprojets
- séance de discussion sur les corrections des miniprojets
Modes d'évaluation
des acquis des étudiants
des acquis des étudiants
25 % pour les travaux pratiques + 75 % examen final (livre fermé)
Pas de possibilité de refaire les travaux en seconde session
Pas de possibilité de refaire les travaux en seconde session
Ressources
en ligne
en ligne
Bibliographie
Slides obligatoires disponibles sur le site :
http://moodleucl.uclouvain.be/course/view.php?id=7865 1 textbook conseillé :
http://moodleucl.uclouvain.be/course/view.php?id=7865 1 textbook conseillé :
Faculté ou entité
en charge
en charge
INFO
Programmes / formations proposant cette unité d'enseignement (UE)
Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
d'apprentissage
Master [120] : ingénieur civil en science des données
Master [120] : ingénieur civil en informatique
Master [120] en linguistique
Master [120] en sciences informatiques
Master [120] en science des données, orientation statistique
Master [120] en science des données, orientation technologies de l'information