Machine Learning : classification and evaluation

lingi2262  2019-2020  Louvain-la-Neuve

Machine Learning : classification and evaluation
Note du 29 juin 2020
Sans connaitre encore le temps que dureront les mesures de distances sociales liées à la pandémie de Covid-19, et quels que soient les changements qui ont dû être opérés dans l’évaluation de la session de juin 2020 par rapport à ce que prévoit la présente fiche descriptive, de nouvelles modalités d’évaluation des unités d’enseignement peuvent encore être adoptées par l’enseignant ; des précisions sur ces modalités ont été -ou seront-communiquées par les enseignant·es aux étudiant·es dans les plus brefs délais.
5 crédits
30.0 h + 30.0 h
Q2
Enseignants
Dupont Pierre;
Langue
d'enseignement
Anglais
Préalables
Thèmes abordés
  • Apprentissage par recherche, par biais inductif
  • Combinaisons de décisions
  • Minimisation d'une fonction de perte, descente de gradient
  • Evaluation des performances
  • Apprentissage par mémorisation de prototypes
  • Apprentissage probabiliste
  • Classification non supervisée
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Eu égard au référentiel AA du programme « Master ingénieur civil en informatique », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants :
  • INFO1.1-3
  • INFO2.3-4
  • INFO5.3-5
  • INFO6.1, INFO6.4
Eu égard au référentiel AA du programme « Master [120] en sciences informatiques », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants :
  • SINF1.M4
  • SINF2.3-4
  • SINF5.3-5
  • SINF6.1, SINF6.4
Les étudiants ayant suivi avec fruit ce cours seront capables de
  • comprendre et appliquer des techniques standard pour construire des programmes informatiques qui s'améliorent automatiquement avec l'expérience, en particulier pour les problèmes de classification
  • évaluer la qualité d'un modèle appris pour une tâche donnée
  • évaluer les performances relatives de plusieurs algorithmes d'apprentissage
  • justifier de l'utilisation d'un algorithme d'apprentissage particulier en prennant en compte la nature des données, le problème d'apprentissage et une mesure de performance pertinente
  • utiliser, adapter et étendre des  logiciels d'apprentissage
Les étudiants auront développé des compétences méthodologiques et opérationnelles.  En particulier, ils auront développé leur capacité à :
  • exploiter la documentation technique pour faire un usage efficace d'un package préexistant,
  • communiquer des résultats de test sous forme synthétique en utilisant par exemple des graphiques.
 

La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».
Contenu
  • Apprentissage d'arbres de décision: ID3, C4.5, CART, Forêts aléatoires
  • Discriminants linéaires: perceptrons, descente de gradient et minimisation des moindres carrés
  • Hyperplans de marge maximale et séparateurs à vaste marge
  • Probabilités et statistiques en apprentissage automatique
  • Évaluation des performances: tests d'hypothèses, comparaisons d'algorithmes d'apprentissage, analyse ROC
  • Classificateurs gaussiens, discriminants de Fisher
  • Apprentissage bayésien: maximum de vraisemblance, maximum a posteriori, classifieur optimal, classifieur bayésien naïf
  • Apprentissage par mémorisation de prototypes: k plus proches voisins, algorithme LVQ
  • Algorithmes de classification non supervisée
Méthodes d'enseignement
  • Cours magistraux
  • Plusieurs mini-projets (de 1 à 3 semaines) incluant quelques questions théoriques et principalement des applications pratiques
  • Les mini-projets sont, par défaut, implémentés en R et évalués semi-automatiquement via un serveur de calcul (INGInious).
  • Un tutoriel sur R est inclus.
Modes d'évaluation
des acquis des étudiants
Les mini-projets valent pour 20 % de la note finale, 80 % pour l'examen final (à livre fermé).
Les mini-projets NE peuvent PAS être refaits en seconde session, les 20 % sont donc déjà fixés à la fin du quadrimestre et repris tels quels dans la note finale en seconde session.
L'examen final est, par défaut, un écrit (sur papier ou, le cas échéant, sur un ordinateur de l'UCLouvain).
Bibliographie
Des ouvrages complémentaires sont recommandés sur le site Moodle du cours.
Additional textbooks are recommended on the Moodle site for this course.
Support de cours
  • Les supports obligatoires sont constitués de l'ensemble des documents (transparents des cours magistraux, énoncés des travaux pratiques, compléments, ...) disponibles sur le site Moodle du cours.
  • Required teaching material include all documents (lecture slides, project assignments, complements, ...) available on the Moodle website for this course.
Faculté ou entité
en charge
INFO


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] : ingénieur civil biomédical

Master [120] : ingénieur civil en mathématiques appliquées

Master [120] en science des données, orientation statistique

Master [120] : ingénieur civil en informatique

Master [120] : ingénieur civil électricien

Master [120] en sciences informatiques

Master [120] : ingénieur civil en science des données

Master [120] en statistique, orientation biostatistiques

Certificat d'université : Statistique et sciences des données (15/30 crédits)

Master [120] en science des données, orientation technologies de l'information

Master [120] en statistique, orientation générale