Statistique et data sciences avec R: Programmation avancée

ldats2030  2022-2023  Louvain-la-Neuve

Statistique et data sciences avec R: Programmation avancée
4.00 crédits
15.0 h + 15.0 h
Q2
Enseignants
El Ghouch Anouar; Guillet Alain (supplée El Ghouch Anouar);
Langue
d'enseignement
Français
Préalables
Concepts et outils équivalents à ceux enseignés dans l'UE LSTAT2020 : Logiciels et programmation statistique de base
L'étudiant devrait avoir suivi un cours sur les bases de R/Rstudio (Data.frame, Factor, boucles, indexation, fonctions et scripts, répertoire de travail) ainsi qu'une formation en statistique méthodologique, comprenant un cours d'introduction en probabilité (distributions classiques, lois des grands nombres, théorème central limite) et statistique (tests et intervalles de confiances, maximum de vraisemblance, régression (non-)linéaire). De préférence, l'étudiant aura également suivi un cours sur l'analyse multivariée.
Thèmes abordés
Ce cours propose une formation intermédiaire à R/Rstudio et aux techniques de calcul statistique les plus fréquemment utilisées en pratique. Il s'adresse aux étudiants qui ont déjà acquis les bases du calcul statistique et manipulation de données en R et souhaites développer leurs compétences dans ce domaine. Le cours s'articule autour de deux axes: 1- développer des compétences de programmation R plus avancées et 2- apprendre des méthodes statistiques modernes qui nécessitent des calculs intensifs. Ce cours présentera ces concepts de manière pratique en évitant, le plus possible, les développements techniques et en utilisant des ensembles de données du monde réel et des problèmes statistiques courants. À la fin du cours, l'étudiant devrait être capable de mettre en 'uvre ces compétences de programmation en R pour effectuer des simulations et résoudre numériquement des problèmes d'inférence ou d'optimisation dont il est difficile ou impossible de trouver une solution sous forme fermée. L'étudiant devrait aussi être capable d'écrire un rapport automatisé et dynamique en utilisant R Markdown, de diffuser ces analyses et de partager son code R sous forme d'un Package.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Eu égard au référentiel AA du programme « Le master en statistique, orientation biostatistique», , cette activité permet aux étudiants de maîtriser
  • De manière prioritaire les AA suivants: 1.3, 2.2, 2.5, 3.3, 4.3
  • De manière secondaire les AA suivants: 3.2, 3.4, 3.5
Eu égard au référentiel AA du programme de « Le master en statistique, orientation générale», cette activité permet aux étudiants de maîtriser
  • De manière prioritaire les AA suivants : 1.3, 2.2, 2.5, 3.3, 4.4, 5.3
  • De manière secondaire les AA suivants : 3.2, 3.4, 4.1, 4.2
 
Contenu
  • Visualisation avec ggplot
  • Rmarkdown
  • Développement d’un package R sous Windows
  • Introduction à Shiny
Méthodes d'enseignement
Le cours sera constitué - d'exposés qui présenteront la matière sur base d'exemples, - de séances d'exercices visant à mettre systématiquement en pratique les différentes notions vues au cours sur des cas bien ciblés. L'approche pédagogique utilisée privilégiera l'apprentissage actif des étudiants et tentera de respecter les orientations pédagogiques proposées par la Faculté.
Modes d'évaluation
des acquis des étudiants
  • Pendant la session des examens : Examen écrit assisté par ordinateur
Faculté ou entité
en charge
LSBA


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en science des données, orientation statistique

Master [120] en statistique, orientation biostatistiques

Master de spécialisation en méthodes quantitatives en sciences sociales

Master [120] en sciences mathématiques

Master [120] en sciences actuarielles

Master [120] en statistique, orientation générale

Master [120] : bioingénieur en chimie et bioindustries

Mineure en statistique, sciences actuarielles et science des données

Certificat d'université : Statistique et science des données (15/30 crédits)