Statistique et data sciences avec R: Programmation avancée

lstat2030  2020-2021  Louvain-la-Neuve

Statistique et data sciences avec R: Programmation avancée
En raison de la crise du COVID-19, les informations ci-dessous sont susceptibles d’être modifiées, notamment celles qui concernent le mode d’enseignement (en présentiel, en distanciel ou sous un format comodal ou hybride).
4 crédits
15.0 h + 15.0 h
Q2
Enseignants
El Ghouch Anouar;
Langue
d'enseignement
Français
Préalables
L'étudiant devrait avoir suivi un cours sur les bases de R/Rstudio (Data.frame, Factor, boucles, indexation, fonctions et scripts, répertoire de travail ') ainsi qu'une formation en statistique méthodologique, comprenant un cours d'introduction en probabilité (distributions classiques, lois des grands nombres, théorème central limite ') et statistique (tests et intervalles de confiances, maximum de vraisemblance, régression (non-)linéaire '). De préférence, l'étudiant aura également suivi un cours sur l'analyse multivariée.
Thèmes abordés
Ce cours propose une formation intermédiaire à R/Rstudio et aux techniques de calcul statistique les plus fréquemment utilisées en pratique. Il s'adresse aux étudiants qui ont déjà acquis les bases du calcul statistique et manipulation de données en R et souhaites développer leurs compétences dans ce domaine. Le cours s'articule autour de deux axes: 1- développer des compétences de programmation R plus avancées et 2- apprendre des méthodes statistiques modernes qui nécessitent des calculs intensifs. Ce cours présentera ces concepts de manière pratique en évitant, le plus possible, les développements techniques et en utilisant des ensembles de données du monde réel et des problèmes statistiques courants. À la fin du cours, l'étudiant devrait être capable de mettre en 'uvre ces compétences de programmation en R pour effectuer des simulations et résoudre numériquement des problèmes d'inférence ou d'optimisation dont il est difficile ou impossible de trouver une solution sous forme fermée. L'étudiant devrait aussi être capable d'écrire un rapport automatisé et dynamique en utilisant R Markdown, de diffuser ces analyses et de partager son code R sous forme d'un Package.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Eu égard au référentiel AA du programme « Le master en statistique, orientation biostatistique», , cette activité permet aux étudiants de maîtriser
  • De manière prioritaire les AA suivants: 1.3, 2.2, 2.5, 3.3, 4.3
  • De manière secondaire les AA suivants: 3.2, 3.4, 3.5
Eu égard au référentiel AA du programme de « Le master en statistique, orientation générale», cette activité permet aux étudiants de maîtriser
  • De manière prioritaire les AA suivants : 1.3, 2.2, 2.5, 3.3, 4.4, 5.3
  • De manière secondaire les AA suivants : 3.2, 3.4, 4.1, 4.2
 
Contenu
R – Avancé
  • Visualisation avec ggplot
  • Rmarkdown
  • git/github avec Rstudio
  • Débogage (Debugging), Vectorisation et calcul parallèle
  • Développement d’un package R sous Windows
  • Introduction à Shiny
Calculs Statistique
  • Monte-Carlo, MCMC et applications
  • Évaluation des méthodes statistique par simulation
  • Optimisation numérique
  • Inférence via calcul intensif (Permutation et Bootstrap)
Méthodes d'enseignement

En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.

Le cours sera constitué - d'exposés qui présenteront la matière sur base d'exemples, - de séances d'exercices visant à mettre systématiquement en pratique les différentes notions vues au cours sur des cas bien ciblés, - d'études de cas (projets) qui donneront l'occasion à l'étudiant d'appliquer les outils de programmation et d'analyse statistique. L'approche pédagogique utilisée privilégiera l'apprentissage actif des étudiants et tentera de respecter les orientations pédagogiques proposées par la Faculté.
Modes d'évaluation
des acquis des étudiants

En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.

  • Pendant les TPs : Un ou deux devoirs sous forme de mini projets (études de cas) à résoudre en groupe de 2 étudiants à l’aide de R.
  • Pendant la session des examens : Examen écrit assisté par ordinateur
Faculté ou entité
en charge
LSBA
Force majeure
Modes d'évaluation
des acquis des étudiants
La crise sanitaire implique des incertitudes quant aux modalités d’évaluation en particulier pour la session de juin. Deux options sont envisagées selon la sévérité des contraintes liées à la crise sanitaire.
Un plan A en présentiel :
  • Examen écrit
Un plan B en distanciel :
  • Examen écrit sur Moodle


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en science des données, orientation statistique

Master [120] en sciences mathématiques

Certificat d'université : Statistique et sciences des données (15/30 crédits)

Mineure en statistique, sciences actuarielles et science des données

Master [120] en sciences actuarielles

Master [120] en statistique, orientation générale

Master [120] en statistique, orientation biostatistiques