5.00 crédits
30.0 h + 15.0 h
Q1
Enseignants
Dupont Pierre; Tack Anaïs (supplée Dupont Pierre);
Langue
d'enseignement
d'enseignement
Thèmes abordés
- Différents niveaux d’analyses linguistiques
- Traitements de corpus
- Etiquettage en parties du discours
- Modélisation probabiliste du langage (Ngrams et Modèles de Markov Cachés)
- Grammaires formelles et algorithmes d’analyse syntaxique
- Traduction automatique, apprentissage profond
- Applications en ingénierie linguistique telles que les logiciels de complétion automatique, d’étiquettage automatique, d’analyse ou de traduction automatique
Acquis
d'apprentissage
d'apprentissage
A la fin de cette unité d’enseignement, l’étudiant est capable de : | |
1 | Eu égard au référentiel AA du programme « Master ingénieur civil en informatique », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants : INFO1.1-3 INFO2.3-4 INFO5.3-5 INFO6.1, INFO6.4 Eu égard au référentiel AA du programme « Master [120] en sciences informatiques », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants : SINF1.M4 SINF2.3-4 SINF5.3-5 SINF6.1, SINF6.4 Les étudiants ayant suivi avec fruit ce cours seront capables de
|
Contenu
- Différents niveaux d'analyse linguistique
- Traitement (automatisé) de corpus : formatage, tokenization, marquage des données
- Modélisation probabilistes du langage : N-grams, HMMs
- Etiquetage en parties du discours
- Grammaires hors-contexte (probabilistes) : estimation des paramètres et algorithmes d'analyse
- Introduction à la traduction automatique
- Introduction à l'apprentissage profond
- Applications représentatives telles que la complétion automatique, le marquage automatique de parties de texte, l'analyse syntaxique ou la traduction automatique.
Méthodes d'enseignement
- Cours magistraux
- Projets pratiques implémentés en Python sur le serveur Inginious
Modes d'évaluation
des acquis des étudiants
des acquis des étudiants
Les projets valent pour 30 % de la note finale, 70 % pour l'examen final (à livre fermé).
Les projets ne peuvent pas être refaits en seconde session. Les notes des projets sont donc déjà fixées à la fin du quadrimestre et reprises tels quels dans la note finale en seconde session.
L'examen final est, par défaut, un écrit (sur papier ou, le cas échéant, sur un ordinateur).
Les projets ne peuvent pas être refaits en seconde session. Les notes des projets sont donc déjà fixées à la fin du quadrimestre et reprises tels quels dans la note finale en seconde session.
L'examen final est, par défaut, un écrit (sur papier ou, le cas échéant, sur un ordinateur).
Ressources
en ligne
en ligne
Bibliographie
One recommended textbook - un ouvrage conseillé :
- Speech and Language Processing, D. Jurafsky and J.H. Martin, Prentice Hall.
Support de cours
- Les supports obligatoires sont constitués de l'ensemble des documents (transparents des cours magistraux, énoncés des travaux pratiques, compléments, ...) disponibles depuis le site Moodle du cours.
- Required teaching material include all documents (lecture slides, project assignments, complements, ...) available from the Moodle website for this course.
Faculté ou entité
en charge
en charge
INFO
Programmes / formations proposant cette unité d'enseignement (UE)
Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
d'apprentissage
Master [120] en science des données, orientation statistique
Master [120] en linguistique
Master [120] : ingénieur civil en informatique
Master [120] en sciences informatiques
Master [120] : ingénieur civil en science des données
Master [120] en science des données, orientation technologies de l'information