Algorithms in data science

linma2472  2021-2022  Louvain-la-Neuve

Algorithms in data science
5.00 crédits
30.0 h + 22.5 h
Q1
Enseignants
Blondel Vincent; Delvenne Jean-Charles (coordinateur(trice)); Krings Gautier (supplée Blondel Vincent);
Langue
d'enseignement
Anglais
Préalables
Une certaine familiarité avec l'algèbre linéaire (par ex LFSAB1101 et LFSAB1102) et les mathématiques discrètes (par ex LINMA 1691) est requise.
Thèmes abordés
L'objet du cours est d'explorer des questions principalement algorithmiques relatives aux défis posés par les données massives (Big Data).
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Eu égard au référentiel AA, ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants :
  • AA1 : 1,2,3
  • AA3 : 1,2,3
  • AA4 : 1, 2, 4
  • AA5 : 1,2,3,5,6
Plus précisément, au terme du cours, l'étudiant sera capable de :
  • consulter une littérature généraliste ou spécialisée sur un thème précis couvert par le cours, en forger une synthèse qui contienne les messages et résultats importants
  • expliquer à ses pairs ces messages et résultats de façon claire et précise
  • résoudre des problèmes mathématiques en application à ces résultats
  • mener une réflexion critique sur les limites des résultats ou la façon dont ils sont présentés
  • relier les concepts vus dans la littérature aux concepts vus dans d'autres cours, malgré des notations ou interprétations variées
  • implémenter des algorithmes sur des données réelles et poser un regard critique sur les résultats
Les objectifs mathématiques ou d'implémentation peuvent varier d'année en année.

Acquis d'apprentissage transversaux :
  • Recherche critique d'information dans des ouvrages plus ou moins spécialisés, MOOCs, Internet, etc.
 
Contenu
Le contenu du cours pourra varier d'année en année et toucher diverses questions algorithmiques  reliées à l'analyse, le stockage, ou la diffusion des données massives (Big Data). Par exemple, l'anonymisation des données, la détection de plagiat, l'analyse des réseaux sociaux, les principes des réseaux pair-à-pair, etc.
Méthodes d'enseignement
Cours ex cathedra en partie qui présentent les concepts et algorithmes avec leur fondements théoriques, et projets avec rapports écrits et/ou présentation orale. Ces projets contiennent une bonne part d'implémentation d'algorithmes (en Python) et d'analyse de données. Il convient donc d'apprendre ce langage (notamment via les tutoriels proposés) si on ne le maîtrise pas déjà.
Modes d'évaluation
des acquis des étudiants
Les projets réalisés et présentés sont jugés sur base des rapports écrits et présentations orales, et entrent pour 12/20 de la note finale (en janvier comme en août). L'examen (écrit ou oral selon les circonstances) compte pour 8/20 de la note finale.
Ressources
en ligne
La page Moodle du cours.
Bibliographie
Variable.
Support de cours
  • Documents sur la page Moodle / Documents on the Moodle page
Faculté ou entité
en charge
MAP


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en statistique, orientation générale

Master [120] : bioingénieur en sciences agronomiques

Master [120] : ingénieur civil en science des données

Master [120] en sciences mathématiques

Master [120] : bioingénieur en sciences et technologies de l'environnement

Master [120] : ingénieur civil en informatique

Master [120] en science des données, orientation technologies de l'information

Master [120] : bioingénieur en chimie et bioindustries

Master [120] en sciences informatiques

Master [120] : ingénieur civil en mathématiques appliquées

Master [120] en science des données, orientation statistique