5 crédits
30.0 h + 15.0 h
Q1
Enseignants
Dupont Pierre; Fairon Cédrick;
Langue
d'enseignement
d'enseignement
Anglais
Thèmes abordés
- Concepts de base en phonologie, morphologie, syntaxe et sémantique
- Ressources linguistiques
- Etiquetage en partie du discours
- Modélisation statistique de la langue (N-grams et modèles de Markov cachés)
- Algorithmes d'analyse robuste, grammaires hors-contexte probabilistes
- Applications de l'ingénierie linguistique telles que les logiciels de correction orthographique ou grammaticale, l'étiquetage en partie du discours ,l'indexation automatique de documents ou la catégorisation de textes
Acquis
d'apprentissage
d'apprentissage
A la fin de cette unité d’enseignement, l’étudiant est capable de : | |
1 | Eu égard au référentiel AA du programme « Master ingénieur civil en informatique », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants :
Eu égard au référentiel AA du programme « Master [120] en sciences informatiques », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants :
Les étudiants ayant suivi avec fruit ce cours seront capables de
Les étudiants auront développé des compétences méthodologiques et opérationnelles. En particulier, ils auront développé leur capacité à
|
La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».
Contenu
- Bases en linguistique : morphologie, partie du discours, structures de phrase, sémantique et pragmatique
- Rappels mathématiques : langages formels et éléments de la théorie de l'information
- Analyse de corpus : formatage, tokenization, morphologie, marquage des données
- N-grams : estimation par maximum de vraisemblance et lissage
- Modèles de Markov Cachés : définitions, algorithmes de Baum-Welch et de Viterbi
- Etiquetage en parties du discours
- Grammaires hors-contexte probabilistes : estimation des paramètres et algorithmes d'analyse, utilisation de treebanks
- Traduction automatique: méthodes classiques et statistiques (modèles IBM, modèles basés sur des segments de phrases), évaluation
-
Applications : prédicteur de mots pour SMS, marquage de parties de texte, outils d'extraction d'information
http://moodleucl.uclouvain.be/course/view.php?id=7865
Méthodes d'enseignement
- 12 cours magistraux
- 3 miniprojets
- séance de discussion sur les corrections des miniprojets
Modes d'évaluation
des acquis des étudiants
des acquis des étudiants
25 % pour les travaux pratiques + 75 % examen final (livre fermé)
Pas de possibilité de refaire les travaux en seconde session
Pas de possibilité de refaire les travaux en seconde session
Autres infos
Préalables:
LSINF1121 Algorithmique et structures de données https://uclouvain.be/cours-lsinf1121.html
LSINF1121 Algorithmique et structures de données https://uclouvain.be/cours-lsinf1121.html
Ressources
en ligne
en ligne
Bibliographie
Slides obligatoires disponibles sur le site :
http://moodleucl.uclouvain.be/course/view.php?id=7865 1 textbook conseillé :
http://moodleucl.uclouvain.be/course/view.php?id=7865 1 textbook conseillé :
Faculté ou entité
en charge
en charge
INFO
Programmes / formations proposant cette unité d'enseignement (UE)
Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
d'apprentissage
Master [120] : ingénieur civil en science des données
Master [120] en linguistique
Master [120] : ingénieur civil en informatique
Master [120] en sciences informatiques
Master [120] en science des données, orientation statistique
Master [120] en science des données, orientation technologie de l'information