d'enseignement
/
Le cours est une introduction aux principes qui sous-tendent la linguistique de corpus et aux méthodes et techniques utilisées pour analyser de vastes corpus de textes électroniques écrits ou oraux.
Il comprend les cinq sections suivantes :
- constitution des corpus : collecte des données, archivage et balisage.
- typologie des corpus : écrits et oraux ; monolingues et multilingues ; corpus natifs et corpus d'apprenants ; diachroniques et synchroniques.
- corpus principaux : British National Corpus, International Corpus of English, International Corpus of Learner English, MICASE, Louvain International Database of Spoken English Interlanguage, etc.
- annotation de corpus: étiquetage grammatical, lemmatisation, étiquetage syntaxique, sémantique et prosodique, étiquetage des erreurs.
- analyse automatisée des aspects lexicaux, grammaticaux et discursifs.
On s'attachera plus particulièrement aux liens qui unissent la linguistique de corpus et l'apprentissage des langues étrangères, la linguistique contrastive et la traductologie et le traitement automatique des langues (TAL).
d'apprentissage
Au terme du cours, les étudiants maîtriseront les concepts principaux de la linguistique de corpus et seront à même d'explorer les corpus électroniques à l'aide de logiciels d'analyse automatique des données linguistiques. Ils seront capables de lire et de rédiger des travaux scientifiques dans le domaine.
La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».
des acquis des étudiants
Durant le quadrimestre : un ou plusieurs exercices écrits d'analyse de corpus comptant pour 20% de la note globale.
En janvier ou en septembre: examen écrit comptant pour 80% de la note globale.
ATTENTION : l'inscription à l'examen écrit est soumise à condition : l'étufdiant doit obligatoirement avoir remis les travaux écrits dans les délais fixés afin de pouvoir s'inscrire.
Le cours repose en partie sur des lectures imposées que les étudiants doivent avoir faites avant le cours et qui donneront lieu à des discussions (en classe ou en ligne) auxquelles les étudiants doivent être prêts à participer activement. Plusieurs séances pratiques seront prévues afin que les étudiants aient l'occasion de se familiariser avec les logiciels d'analyse automatique de textes.
Le cours apporte une introduction tant théorique que pratique à la linguistique de corpus. Il présente les concepts principaux liés à la linguistique de corpus, ainsi que ses applications possibles dans divers domaines.
- Kennedy, G. (1998) An Introduction to Corpus Linguistics. Longman: Harlow.
- McEnery, T., Xiao, R. & Tono, Y. (2006) Corpus-based Language Studies. An advanced resource book, Routledge.
- Sélection d'articles scientifiques
/
en charge
Programmes / formations proposant cette unité d'enseignement (UE)
d'apprentissage