Statistique et data sciences avec R: Programmation avancée

lstat2030  2019-2020  Louvain-la-Neuve

Statistique et data sciences avec R: Programmation avancée
Note du 29 juin 2020
Sans connaitre encore le temps que dureront les mesures de distances sociales liées à la pandémie de Covid-19, et quels que soient les changements qui ont dû être opérés dans l’évaluation de la session de juin 2020 par rapport à ce que prévoit la présente fiche descriptive, de nouvelles modalités d’évaluation des unités d’enseignement peuvent encore être adoptées par l’enseignant ; des précisions sur ces modalités ont été -ou seront-communiquées par les enseignant·es aux étudiant·es dans les plus brefs délais.
4 crédits
15.0 h + 15.0 h
Q2
Enseignants
El Ghouch Anouar;
Langue
d'enseignement
Français
Préalables
L'étudiant devrait avoir suivi un cours sur les bases de R/Rstudio (Data.frame, Factor, boucles, indexation, fonctions et scripts, répertoire de travail ') ainsi qu'une formation en statistique méthodologique, comprenant un cours d'introduction en probabilité (distributions classiques, lois des grands nombres, théorème central limite ') et statistique (tests et intervalles de confiances, maximum de vraisemblance, régression (non-)linéaire '). De préférence, l'étudiant aura également suivi un cours sur l'analyse multivariée.
Thèmes abordés
Ce cours propose une formation intermédiaire à R/Rstudio et aux techniques de calcul statistique les plus fréquemment utilisées en pratique. Il s'adresse aux étudiants qui ont déjà acquis les bases du calcul statistique et manipulation de données en R et souhaites développer leurs compétences dans ce domaine. Le cours s'articule autour de deux axes: 1- développer des compétences de programmation R plus avancées et 2- apprendre des méthodes statistiques modernes qui nécessitent des calculs intensifs. Ce cours présentera ces concepts de manière pratique en évitant, le plus possible, les développements techniques et en utilisant des ensembles de données du monde réel et des problèmes statistiques courants. À la fin du cours, l'étudiant devrait être capable de mettre en 'uvre ces compétences de programmation en R pour effectuer des simulations et résoudre numériquement des problèmes d'inférence ou d'optimisation dont il est difficile ou impossible de trouver une solution sous forme fermée. L'étudiant devrait aussi être capable d'écrire un rapport automatisé et dynamique en utilisant R Markdown, de diffuser ces analyses et de partager son code R sous forme d'un Package.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Eu égard au référentiel AA du programme « Le master en statistique, orientation biostatistique», , cette activité permet aux étudiants de maîtriser
  • De manière prioritaire les AA suivants: 1.3, 2.2, 2.5, 3.3, 4.3
  • De manière secondaire les AA suivants: 3.2, 3.4, 3.5
Eu égard au référentiel AA du programme de « Le master en statistique, orientation générale», cette activité permet aux étudiants de maîtriser
  • De manière prioritaire les AA suivants : 1.3, 2.2, 2.5, 3.3, 4.4, 5.3
  • De manière secondaire les AA suivants : 3.2, 3.4, 4.1, 4.2
 

La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».
Contenu
R – Avancé
  • Visualisation avec ggplot
  • Rmarkdown
  • git/github avec Rstudio
  • Débogage (Debugging), Vectorisation et calcul parallèle
  • Développement d’un package R sous Windows
  • Introduction à Shiny
Calculs Statistique
  • Monte-Carlo, MCMC et applications
  • Évaluation des méthodes statistique par simulation
  • Optimisation numérique
  • Inférence via calcul intensif (Permutation et Bootstrap)
Méthodes d'enseignement
Le cours sera constitué - d'exposés qui présenteront la matière sur base d'exemples, - de séances d'exercices visant à mettre systématiquement en pratique les différentes notions vues au cours sur des cas bien ciblés, - d'études de cas (projets) qui donneront l'occasion à l'étudiant d'appliquer les outils de programmation et d'analyse statistique. L'approche pédagogique utilisée privilégiera l'apprentissage actif des étudiants et tentera de respecter les orientations pédagogiques proposées par la Faculté.
Modes d'évaluation
des acquis des étudiants
  • Pendant les TPs : Un ou deux devoirs sous forme de mini projets (études de cas) à résoudre en groupe de 2 étudiants à l’aide de R.
  • Pendant la session des examens : Examen écrit assisté par ordinateur
Faculté ou entité
en charge
LSBA


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en sciences mathématiques

Master [120] en sciences actuarielles

Master [120] en statistique, orientation biostatistiques

Certificat d'université : Statistique et sciences des données (15/30 crédits)

Master [120] en statistique, orientation générale

Master [120] en science des données, orientation statistique