Statistique: Analyse descriptive et modélisation GLM de données multivariées

lpsp1306  2021-2022  Louvain-la-Neuve

Statistique: Analyse descriptive et modélisation GLM de données multivariées
4.00 crédits
30.0 h + 15.0 h
Q2
Enseignants
Lefèvre Nathalie; Taverne Cédric;
Langue
d'enseignement
Français
Préalables

Le(s) prérequis de cette Unité d’enseignement (UE) sont précisés à la fin de cette fiche, en regard des programmes/formations qui proposent cette UE.
Thèmes abordés

Le cours abordera les thèmes suivants :
* Concept et structure d'un modèle statistique (linéaire ou non linéaire) et exemples de questions de recherche typiques liées ;
* Régression  linéaire simple : critère des moindres carrés, estimation, inférence sur les paramètres, prédiction ;
* Analyse de la variance à un critère de classification : construction de tableaux d'ANOVA, logique sous-jacente au test F, facteur fixe et aléatoire, comparaison multiple de moyennes ;
* Analyse de la variance à 2 critères de classification : interaction, plans croisés, hiérarchisés, et balancés, anova fixe, aléatoire et mixte ;
* Modèles d'ANOVA pour mesures répétées à un ou deux facteurs (beween ou within) ;
* Anova non paramétrique pour données indépendantes et répétées : tests de Kruskall Wallis et de Friedman ;
* Régression linéaire multiple : notation matricielle des modèles GLM, multicolinéarité, sélection de variables ;
* Modèle GLM général avec application à l'analyse de covariance à un facteur quantitatif et un facteur qualitatif. Relation entre l'anova et la régression, codage de facteurs catégoriel dans une régression ;
* Validation des modèles GLM : mesures de la qualité de l'ajustement, analyse des résidus, test d'homogénéité de variance et de sphéricité, détection d'outliers ou de points influents, transformation de variable ;
* Analyse en composantes principales et analyse factorielle ;
* Construction d'un référentiel reliant outils statistiques, types de questions de recherche et domaines d'application de la psychologie.
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Au terme du cours, l'étudiant sera capable d'appliquer l'ensemble les méthodes de description, d'inférence et modélisation statistique vues en BAC1, 2 et 3 pour répondre aux besoins d'analyse de données émanant d'études intégrées de recherche psychologique.

Plus précisément il pourra :
* Traduire une problématique de recherche en question. statistiques, choisir les méthodes adaptées, les appliquer et présenter l'ensemble des résultats dans un rapport.
* Formaliser le modèle statistique GLM à appliquer dans une situation expérimentale donnée.
* Estimer un modèle GLM à l'aide du logiciel SPSS, en valider la qualité et en interpréter les résultats dans le contexte de l'étude.
* Identifier et expliquer les concepts statistiques transversaux aux trois cours de statistique.
* Extraire, à l'aide de méthodes factorielles, des variables latentes pertinentes et repérer des similitudes entre individus dans des tableaux de données multivariées.

Eu égard au référentiel des acquis d'apprentissage, le cours vise prioritairement à amener les étudiants à :
* A2. analyser, critiquer de manière argumentée et modéliser une situation (individu, groupe ou organisation) en référence à des théories, résultats de recherche, méthodes et outils relevant de la psychologie.
* C2. structurer et présenter des données recueillies.
* E1. maîtriser les étapes, les méthodologies et les outils de la recherche scientifique en psychologie et en sciences de l'éducation;
* E2. identifier l'apport et la plus-value de la recherche scientifique en psychologie et en sciences de l'éducation sur sa compréhension de situations données.
Secondairement, le cours vise à amener les étudiants à :
* B1. maîtriser les connaissances à propos des interventions visant à améliorer une situation donnée (individu, groupe ou organisation).
* B3. mettre en oeuvre un plan d'intervention, en tout ou en partie, et en évaluer l'efficacité.
 
Contenu
Après une introduction sur le rôle central des méthodes statistiques et en particulier des méthodes descriptives, inférentielles et de modélisation dans la pratique professionnelle du psychologue et du logopède, le cours abordera divers thèmes :
  • Inférence statistique – Démarche et objectifs
  • ANOVA I - Analyse de la variance à un critère de classification : Modèle classique, comparaisons post-hoc et ANOVA de Kruskal-Wallis
  • ANOVA II - Analyse de la variance à deux critères de classification
  • ANOVA pour mesures répétées : Modèle classique et ANOVA de Friedman
  • Modèles de régression simple et multiple et analyse des résidus
  • GLM - Modèle linéaire général
  • Analyses statistiques multivariées exploratoires - Introduction et calcul matriciel
  • Analyses statistiques multivariées exploratoires - ACP - Analyse en composantes principales
  • Analyses statistiques multivariées exploratoires - Clustering - Classification
Méthodes d'enseignement

Cours magistral

  • Le cours comprend des exposés magistraux guidés par des études de cas dans le domaine de la psychologie, de la logopédie et des sciences de l'éducation. Les étudiants sont encouragés à interagir durant les cours.

Travaux Pratiques

  • ± 7 séances de TPs sont programmées pour vous aider à comprendre les concepts du cours. Il est extrêmement important d’y participer activement pour une bonne intégration de la matière.

Travaux individuels obligatoires

  • Les travaux individuels sont obligatoires. Ils consistent à visionner des vidéos, répondre aux questions du syllabus SPSS et valider les réponses via des QCM.
  • Il est nécessaire que chaque étudiant travaille entre les cours afin d’intégrer les concepts vus lors des exposés magistraux et appliqués en TPs. Il pourra ainsi utiliser ces concepts de façon appliquée avec SPSS. Des screencasts montrant les manipulations à effectuer en SPSS seront à visionner pour aider à la réalisation des exercices proposés dans le « syllabus d’exercices d’analyse de données avec SPSS ». Les réponses de ces exercices pourront ensuite être validées par des QCMs.

Permanences et séances de Questions-Réponses

  • Les permanences permettent d’avoir une explication détaillée de questions liées aux exercices à réaliser chaque semaine sur SPSS. Pour que ces permanences soient utiles, vous devez y venir de façon active et vous devez donc vous poser des questions. Postez vos questions sur le Forum. Selon la nature et le nombre de questions, vous aurez soit directement une réponse via le Forum, soit l’ouverture d’une permanence.
  • Des séances de questions-réponses seront organisées en fonction des besoins.

Forums sur Moodle

  • Les échanges, questions des uns et réponses des autres sont encouragés via les Forum Moodle du cours. Les exercices sont en partie corrigés par les étudiants, via les commentaires qu'ils postent et la validation est ensuite opérée par l'équipe éducative.

Autres activités

  • Les suggestions des étudiants sont les bienvenues sur des activités liées à la modélisation statistique et qui peuvent aider à intégrer la matière et à mieux comprendre des concepts statistiques vus dans d'autres cours.
Modes d'évaluation
des acquis des étudiants
L'évaluation du cours consiste en une évaluation globale fondée sur 3 activités obligatoires : l'examen écrit, le travail et les exercices à réaliser chez soi. La note finale ne sera délivrée que si l’étudiant·e s’est engagé·e dans l’ensemble des dispositifs pédagogiques ; l’étudiant·e sera considéré·e comme absent·e tant qu’il ou elle n’aura pas participé aux 3 parties.

Examen écrit – 15 points

  • Des questions de type QCM à une seule réponse possible par question ou QRM et des questions ouvertes
    • Questions générales, questions de compréhension, d'applications, de choix de méthodes, d'interprétation, de calcul, de maitrise d'SPSS...
    • Exemples fournis sur Moodle

Travail obligatoire – 5 points

  • Rapport scientifique présentant une étude et ses analyses. En cas de non réalisation du travail ou de remise tardive, une note d'absence "A" sera la note finale du cours en session de juin ou de septembre

Exercices obligatoires à réaliser chez soi

  • En cas de non réalisation des exercices obligatoires ou de remises tardives, une note d'absence "A" sera la note finale du cours en session de juin et de la même façon en septembre si les exercices ne sont toujours pas réalisés
Autres infos
Ce cours suppose que l'étudiant maîtrise le contenu des cours de statistique de Bac1 et Bac2, ou son équivalent.
Ressources
en ligne
Via l'espace Moodle, mise à disposition de documents divers (vidéos, didactitiels, ...), d'explications de concepts et d'exercices sous forme de questions ouvertes et de questions type QCM à réaliser au fur et à mesure de l'avancement du cours.
Bibliographie
Transparents du cours disponible à La DUC et à compléter durant le cours. Certains supports sont également mis à disposition sur Moodle.
Ouvrage de référence pour les 3 années de BAC pouvant aider à la compréhension de la matière (disponible à la bibliothèque - achat non indispensable) : Howell D.C. (2008). Méthodes statistiques en sciences humaines. Traduction de la 6ème édition américaine par Marylène Rogier, Vincent Yzerbyt et Yves Bestgen. Editions de Boeck.
Support de cours
  • Transparents du cours disponible à La DUC et à compléter durant le cours. Certains supports sont également mis à disposition sur Moodle.
Faculté ou entité
en charge
EPSY


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Bachelier en sciences psychologiques et de l'éducation, orientation logopédie

Mineure en statistique et science des données

Bachelier en sciences psychologiques et de l'éducation, orientation générale

Certificat d'université : Statistique et sciences des données (15/30 crédits)

Master [120] en science des données, orientation statistique