4.00 crédits
25.0 h + 25.0 h
Q2
Cette unité d'enseignement n'est pas dispensée en 2021-2022
Langue
d'enseignement
d'enseignement
Français
Préalables
LBIO1282 et LBIO1283
Thèmes abordés
Modèle linéaire (LM) + notion d'interaction;
Modèle linéaire généralisé (GLM Poisson & Binomial);
Modèle mixte et notions de facteurs fixe et aléatoire;
Sélection de modèle (AIC);
Comparaisons multiples;
Puissance statistique et "overfitting"
Modèle linéaire généralisé (GLM Poisson & Binomial);
Modèle mixte et notions de facteurs fixe et aléatoire;
Sélection de modèle (AIC);
Comparaisons multiples;
Puissance statistique et "overfitting"
Acquis
d'apprentissage
d'apprentissage
A la fin de cette unité d’enseignement, l’étudiant est capable de : | |
1 | L'étudiant comprend et devient capable d'utiliser correctement et de manière critique les principales méthodes d'analyse statistique des données biologiques et environnementales univariées. Il perçoit la relation entre le modèle de conception et d'analyse expérimentale et la nécessité de planifier les expériences, et se familiarise avec l'analyse des données assistée par ordinateur. A l'issue de ce cours, l'étudiant doit maîtriser les méthodes de base de l'analyse des données univariées, être capable de choisir le modèle et la méthode d'analyse adaptés au plan d'expériences factorielles simples, d'analyser et d'interpréter correctement les résultats de ces expériences. Il doit être capable de progresser par lui-même et de suivre avec profit des cours avancés sur les plans d'expériences et l'analyse des données. Au terme de cet apprentissage, l'étudiant sera capable de : En ce qui concerne la compréhension des statistiques : - Réaliser un choix d'analyse critique selon la question posée et le type de données à disposition, et justifier ce choix - Expliquer en français le principe général d'un test d'hypothèse, et la signification d'une p-valeur - Interpréter en français les résultats d'un test statistique - Ecrire et interpréter l'équation d'un modèle statistique - Interpréter des intervalles de confiance de paramètres, de modèles* (moyenne conditionnelle), de prédictions - Enoncer les conditions d'application d'un test statistique et démontrer sa capacité à les vérifier - Choisir le type de graphique approprié pour résumer un jeu de données / modèle statistique En ce qui concerne l'emploi du logiciel R : A partir d'une liste détaillée de fonctions et/ou d'exemples résolus : - Réaliser une analyse de type (G)LM(M), obtenir les coefficients associés au modèle, et tester la significativité de chacune des variables - Vérifier les conditions d'application d'un modèle statistique - Réaliser un graphique résumé d'un jeu de données et/ou d'un modèle statistique - Obtenir un intervalle de confiance pour la moyenne conditionnelle / un intervalle de prédiction |
Contenu
Avec ce cours, l'étudiant acquirt les notions et principes de base des probablilités et de l'inférence statistiques nécessaires à la démarche scientifique. En fin d'apprentissage, il est à même de déterminer les caractéristiques importantes d'un plan expérimental, de choisir et réaliser l'analyse statistique appropriée à l'analyse des données, et d'interpréter les résultats et les éventuelles limitations aux conclusions à en tirer.
Le cours commence par les bases de la théorie des probabilités. Il détaille ensuite les principes de l'inférence statistique (population vs échantillon; variables et distributions; sources de variations dans les données; test d'hypothèse, p-valeur et erreur de type I et II; intervalle de confiance...). Les principaux types d'analyse statistiques de base sont détaillés et illustrés: test de t, ANOVA (1, 2 et 3), corrélation et régression linéaire simple, données de comptage (X²). Les principes des tests par permutation sont aussi abordés.
Le cours est complété par des travaux pratiques sur ordinateur au moyen du logiciel R qui permettent à l'étudiant de réaliser en pratique toutes les analyses statistiques abordées.
Le cours commence par les bases de la théorie des probabilités. Il détaille ensuite les principes de l'inférence statistique (population vs échantillon; variables et distributions; sources de variations dans les données; test d'hypothèse, p-valeur et erreur de type I et II; intervalle de confiance...). Les principaux types d'analyse statistiques de base sont détaillés et illustrés: test de t, ANOVA (1, 2 et 3), corrélation et régression linéaire simple, données de comptage (X²). Les principes des tests par permutation sont aussi abordés.
Le cours est complété par des travaux pratiques sur ordinateur au moyen du logiciel R qui permettent à l'étudiant de réaliser en pratique toutes les analyses statistiques abordées.
Méthodes d'enseignement
Cours en auditoire et travaux pratiques en salle informatique. L'étudiant est encouragé à l'interactivité pour toutes ces activités.
Modes d'évaluation
des acquis des étudiants
des acquis des étudiants
Examen écrit à livre ouvert pour la compréhension théorique des concepts, et examen pratique à livre ouvert avec logiciel R sur ordinateur pour la réalisation et l'interprétation d'analyses statistiques sur jeux de données réels.
Autres infos
Une connaissance de base du logiciel R est nécessaire: l'étudiant est supposé être capable de créer et modifier des jeux de données en R de manière autonome. Le cours LBIO1282 vise spécifiquement à donner à l'étudiant ces connaissances; s'il ne l'a pas suivi au préalable, l'étudiant doit se former de manière autonome à ces compétences, p.ex. au moyen des nombreuses ressources disponibles en ligne gratuitement.
Ressources
en ligne
en ligne
Les diapositives du cours et le matériel en support aux travaux pratiques sont disponibles sur Moodle.
Support de cours
- Transparents sur Moodle
Faculté ou entité
en charge
en charge
BIOL