Statistiques et sciences des données

lepl1109  2019-2020  Louvain-la-Neuve

Statistiques et sciences des données
Note du 29 juin 2020
Sans connaitre encore le temps que dureront les mesures de distances sociales liées à la pandémie de Covid-19, et quels que soient les changements qui ont dû être opérés dans l’évaluation de la session de juin 2020 par rapport à ce que prévoit la présente fiche descriptive, de nouvelles modalités d’évaluation des unités d’enseignement peuvent encore être adoptées par l’enseignant ; des précisions sur ces modalités ont été -ou seront-communiquées par les enseignant·es aux étudiant·es dans les plus brefs délais.
5 crédits
30.0 h + 30.0 h
Q1

  Cette unité d'enseignement n'est pas dispensée en 2019-2020

Langue
d'enseignement
Français
Préalables
Ce cours suppose acquises des notions de base en probabilités telles qu'enseignées dans les cours LEPL1108 ou LBIR1212.

Le(s) prérequis de cette Unité d’enseignement (UE) sont précisés à la fin de cette fiche, en regard des programmes/formations qui proposent cette UE.
Thèmes abordés
Le cours présente les concepts fondamentaux des statistiques dans un contexte d'ingénierie (analyse exploratoire, inférence, simulation) ainsi que les méthodes de base d'analyse de données multivariées (comme la régression linéaire, l'analyse en composantes principales ou la classification).
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 A l'issue de ce cours, l'étudiant sera à même d' :
- Explorer des données en petit et grand nombre, et en petite et grande dimension ;
- Induire des caractéristiques d'une population de données à partir d'un échantillon en utilisant des techniques d'inférence, d'estimation, de calcul d'intervalles de confiance, et de tests statistiques ;
- Relier l'approche déductive de la théorie des probabilités et l'approche inductive de la statistique, en identifiant clairement les modèles probabilistes qui seront soumis à l'inférence statistique ;
- Reformuler l'énoncé textuel d'un problème d'inférence statistique dans un formalisme mathématique et statistique précis, en identifiant les modèles adéquats et les méthodes d'estimation correspondantes ;
- Résoudre un problème appliqué en suivant une approche logique basée sur l'utilisation correcte des modèles et de l'inférence statistique ;
- Utiliser des techniques de simulation Monte-Carlo, de validation croisée et de bootstrap à des fins d'estimation et de validation de résultats ;
- Analyser des données multivariées avec des techniques fondamentales de régression linéaire, d'analyse en composantes principales et de classification/clustering
- Utiliser des outils d'analyse statistique pour valider les conclusions de modèles (par exemple la régression linéaire)
- Faire le lien entre les objectifs mathématiques d'une méthode d'analyse de données et ses objectifs applicatifs
 

La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».
Contenu
- Analyse exploratoire
- Distributions des échantillonnages, dérivées par transformation des v.a. multivariées 'exploration via simulation sur ordinateur
- Différentes méthodes de l'estimation ponctuelle (méthodes des moments et de maximum de vraisemblance) et leurs propriétés (biais, variance, mean-squared error)
- Inférence statistique (intervalles de confiance et tests d'hypothèses) : méthode pivotale exacte (small sample) et asymptotique (large sample), comparaison de moyennes de deux et plusieurs populations normales, proportions, tests sur les variances
- Régression linéaire (simple et multiple), y compris l'analyse des coefficients et les tests d'hypothèses
- Validation des modèles à l'aide des méthodes de Monte-Carlo (simulation, et concept du rééchantillonnage) ; principe de la validation croisée
- Introduction à l'analyse de données multivariées et à l'apprentissage: réduction de dimension (par l'analyse en composantes principales) et méthodes de classification/clustering.
- Lien entre les objectifs des méthodes d'analyse de données et leur formulation mathématique
Méthodes d'enseignement
Le cours sera principalement constitué
- de problèmes (APP) d'analyse de données liées aux disciplines de l'ingénieur que les étudiants seront amenés à étudier, individuellement ou en groupe, et à résoudre y compris par des simulations sur
ordinateur, afin de découvrir les concepts des méthodes et leurs objectifs, y compris un ou des projets d'ampleur significative ;
- de cours de restructuration permettant aux étudiants de formaliser et structurer les concepts déjà appréhendés à travers les APP.
Modes d'évaluation
des acquis des étudiants
Examen écrit individuel pour évaluer la compréhension des concepts et techniques (théorie et exercices, sous forme d'exercices à choix multiples et de questions ouvertes).
Faculté ou entité
en charge
EPL


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Bachelier en sciences de l'ingénieur, orientation ingénieur civil

Bachelier en sciences informatiques