Technologies linguistiques

bmhcg1283  2023-2024  Bruxelles Saint-Louis

Technologies linguistiques
3.00 crédits
30.0 h
Q2
Enseignants
Pizarro Pedraza Andrea;
Langue
d'enseignement
Français
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

Au terme de l'apprentissage, les étudiant·es seront en mesure de :
- comprendre les concepts de base des technologies du langage
- connaître quelques fonctionnalités importantes de ces technologies (recherche, communication personne-machine, traduction automatique,…)
- comprendre les techniques fondamentales du traitement automatique du langage
- être capable de faire des requêtes avancées sur plusieurs plateformes et corpora (ex. Sketch Engine)
- construire une base de données linguistiques sur Excel
 
Contenu
Cette activité d'enseignement vise à introduire les notions de base et la terminologie en relation avec les technologies du langage (IA génératives, corpus, concordanciers...), afin d'établir les piliers pour une utilisation critique et éthique.
Les explications théoriques seront illustrées par des exemples concrets. Dans la partie pratique, les exercices seront démontrés sur plusieurs logiciels et plateformes pour que les étudiants et étudiantes puissent les pratiquer de façon autonome.
Méthodes d'enseignement
Ce cours se donne en présentiel.
- Cours magistral
- Séances d'exercices pratiques
Sur décision du professeur 15 % du cours en présentiel peut être remplacé par des travaux dirigés et/ou autonomes en distanciel.
Modes d'évaluation
des acquis des étudiants
1. Épreuve écrite avec des questions théoriques et exercices pratiques (75%)
L'étudiant⸱e:
  • comprend les concepts de base des technologies du langage
  • connaît les fonctionnalités importantes de ces technologies (recherche, communication personne-machine, traduction automatique,…)
  • comprend les techniques fondamentales du traitement automatique du langage
2. Dossier d'exercices à rendre sur Excel (date et instructions à confirmer en début de quadrimestre). (25%)
L'étudiant⸱e:
  • est capable de faire des requêtes avancées sur plusieurs plateformes et corpora (ex. Sketch Engine)
  • peut construire une base de données linguistiques sur Excel
  • sait faire des tests et analyser des IA génératives
NB: L'utilisation des IA génératives fait partie de certaines activités de ce cours. Ceci sera clairement spécifié dans les instructions de l'activité. Dans tous les cas, l'utilisation de toute technologie se fera de manière responsable et conformément aux pratiques de l’intégrité académique et scientifique et sera donc indiquée systématiquement par l'étudiant⸱e.
Ressources
en ligne
Supports de cours sur Moodle
Après chaque thème: syllabus et instructions des activités à rendre dans le dossier
Bibliographie
Supports de cours sur Moodle après chaque thème.
Références de base du syllabus :
BOUCHER Philip Nicholas (2020), Artificial intelligence: How does it work, why does it matter, and what can we do about it? https://www.europarl.europa.eu/RegData/etudes/STUD/2020/641547/EPRS_STU(2020)641547_EN.pdf
JURAFSKY,D. et J. H. MARTIN (2022): Speech and Language Processing (3ème éd.) https://web.stanford.edu/~jurafsky/slp3/
LÉON, Jacqueline. Histoire de l'automatisation des sciences du langage. Lyon: ENS Éditions, 2015 <http://books.openedition.org/enseditions/3733>. ISBN: 9782847886801. DOI: https://doi.org/10.4000/books.enseditions.3733.
MANNING, C. et SCHÜTZE, H. (1999) Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA.
SINCLAIR, J. (2004): “Corpus and Text: Basic Principles”, in Wynne, M. (ed) Developing Linguistic Corpora: a Guide to Good Practice. Produced by AHDS, at https://users.ox.ac.uk/~martinw/dlc/chapter1.htm.
Support de cours
  • Syllabus sur Moodle après chaque thème
  • Course materials on Moodle after each topic
Faculté ou entité
en charge
TIMB


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Bachelier en traduction et interprétation