Traitement statistique des données -omiques

lstat2340  2019-2020  Louvain-la-Neuve

Traitement statistique des données -omiques
Note du 29 juin 2020
Sans connaitre encore le temps que dureront les mesures de distances sociales liées à la pandémie de Covid-19, et quels que soient les changements qui ont dû être opérés dans l’évaluation de la session de juin 2020 par rapport à ce que prévoit la présente fiche descriptive, de nouvelles modalités d’évaluation des unités d’enseignement peuvent encore être adoptées par l’enseignant ; des précisions sur ces modalités ont été -ou seront-communiquées par les enseignant·es aux étudiant·es dans les plus brefs délais.
3 crédits
15.0 h
Q2
Enseignants
Bugli Céline; Govaerts Bernadette;
Langue
d'enseignement
Français
Préalables
Les cours LSTAT2020 Calcul statistique sur ordinateur, LSTAT2110 Analyse des données et LSTAT2120 Modèles linéaires doivent être acquis.
Thèmes abordés
  • La normalisation de données omics (que ce soit génomiques ou métabolomique)
  • Les méthodes mathématiques et statistiques pour le prétraitement de données spectrales (ex : modèles semi-paramétrique de lissage pour correction de ligne de base, alignement de pics)
  • L'organisation d'expériences pour analyser la qualité informatique de données omics et leur analyse par modèles à composantes de variance, méthodes de classification et méthodes multivariées telles
  • ASCA,ANOVA-PCA
  • La modélisation de données de grande dimension dans un but de recherche de biomarqueurs ou de prédiction par modèle PLS, O-PLS, ICA, arbres de décision
  • Les méthodes pour tests multiples (FDR)
  • Les méthodes d'intégration de données (analyse de données multitableaux)
  • Revue et utilisation des packages R les plus courants dans le domaine (ex : bioconductor)
  • Application sur des bases de données réelles.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Eu égard au référentiel AA du programme « Le master en statistique, orientation biostatistique», cette activité permet aux étudiants de maîtriser
  • De manière prioritaire les AA suivants: 1.4, 2.2, 2.5, 2.6, 3.1, 3.2, 3.3, 3.4, 3.5, 4.5, 5.1, 5.2, 5.6
  • De manière secondaire les AA suivants: 4.1, 5.7
Eu égard au référentiel AA du programme de « Le master en statistique, orientation générale», cette activité permet aux étudiants de maîtriser
  • De manière prioritaire les AA suivants : 1.3, 1.4, 2.2, 2.4, 2.5, 2.6, 3.1, 3.2, 3.3, 3.4, 5.1, 5.5, 5.6
  • De manière secondaire les AA suivants : 1.2, 1.5, 4.1
 

La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».
Contenu
Après avoir revu les bases de la biologie moléculaire, le cours présente une série de méthodes -omiques et surtout les méthodes de traitement de données liées:
  • Bases de biologie moléculaire.
  • Révision de méthodes multivariées utiles en méthodes -omiques (PCA, Clustering...) et appllication en R + RMarkdown.
  • Méthode d'acquisition de données de transcriptomique (micro-damiers, q-PCR...).
  • Prétraitement et analyse de données transcriptomiques (correction de background, normalisation,... + tests d'hypothèses avec correction de multiplicité).
  • Utilisation de modèle de prédiction et classification émanant de la chimiomtrie et du machine learning pour l'analyse de données omique (PLS, O-PLS, arbres...).
  • Acquisition et traitement de données protéomiques. 
  • Acquisition et traitement de données métabolomiques (dont prétraitement détaillé de données 1H-NMR). 
  • Traitement de données métagénomiques.  
Méthodes d'enseignement
Le cours est composé d'une série d'activité qui amènent l'étudiant à se plonger activement dans le monde des données -omiques.  Il propose:
  • des exposées par des spécialistes actifs dans le domaine,
  • des mini-projets de traitement de données à réaliser chaque semaine,
  • un travail interactif sur ordinateur durant le cours, 
  • une visite de laboratoire,
  • un projet final sur des données proposées par les différents intervenants du cours ou de data repositories.
Modes d'évaluation
des acquis des étudiants
Le cours est évalué sur base
  • De mini-projets à rendre chaque semaine durant l'année.
  • D'un projet final et d'une présentation orale liée.
  • D'un examen oral (à documents ouverts).
Ressources
en ligne
Site Moodle: https://moodleucl.uclouvain.be/course/view.php?id=10846
Faculté ou entité
en charge
LSBA


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en statistique, orientation biostatistiques

Certificat d'université : Statistique et sciences des données (15/30 crédits)

Master [120] en statistique, orientation générale

Master [120] en science des données, orientation statistique