STAT2411 | Analyse des données |
|
[22.5h+7.5h]1q
|
Enseignant(s) :
Léopold Simar
|
Objectifs
Le cours présente les techniques modernes de l'analyse de grands ensemble de données et développe les outils de base du " data mining ". A l'issue de ce cours, l'étudiant sera capable de :
- Traiter et décrire l'information contenue dans des grands ensemble de données ;
- Comprendre les mécanismes qui justifient l'emploi de telle ou telle méthode ;
- Interpréter correctement les graphiques et résultats fournis par les logiciels ;
- Résoudre des problèmes avec données réelles.
Cahier des charges
- Rappels d'algèbre et de géométrie.
- Principes de base des méthodes factorielles.
- Analyse en composantes principales.
- Corrélations canoniques.
- Analyse discriminante factorielle.
- Analyse factorielle des correspondances.
- Introduction aux méthodes de classification.
- L'analyse des données, en pratique.
Résumé
Méthodes
Le cours comprend des exposés magistraux et un travail sur ordinateur à faire individuellement.
Autres informations du cahier des charges
Pré-requis
- manipuler et lire les expressions algébriques (calcul matriciel) ;
- comprendre et dominer les éléments de base de l'analyse statistique.
Evaluation
L'évaluation se fait (50%--50%) :
1) par un travail sur données réelles selon les modalités qui seront précisées au cours. Il s'agit de mettre en oeuvre certaines des méthodes vues au cours dans un domaine d'application choisi par l'étudiant. Pour permettre aux étudiants de réaliser ce travail dans les meilleures conditions, le cours magistral sera concentré sur 8 semaines. Les étudiant travaillent, en principe, par paire. Un assistant de l'Institut de Statistique (Eric Lecoutre) encadrera les étudiants pour ce travail (mise au courant du logiciel, conseils, etc). Ce travail devrait prendre environ 12 heures de travail PAR étudiant (soit 24 h. pour la paire).
2) Par un examen oral, ou la paire d'étudiants répondra aux questions du professeur concernant d'abord le travail, mais également concernant d'autres aspects de la matière du cours non évoqués dans le travail. L'évaluation est individuelle.
Support
Syllabus de L.SIMAR (1998) : " Multivariate Data Analysis, Part I : Reference Manual and Part II : Applications ", Institut de Statistique, UCL.
Encadrement
Titulaire : Léopold Simar, tél : 010/47 43 08, simar@stat.ucl.ac.be
Ouvrages de référence
Lebart, L., Morineau, A. et J.P. Fenelon (1982) : Traitement des données statistiques. Dunod, Paris.
Saporta, G. (1990) : Probabilités, analyse des données et statistiques. Ed. Tecnip, Paris.
Romeder, J.M. (1973) : Méthodes et programmes d'analyse discriminante. Dunod, Paris
Autres informations du cahier des charges
Support
Syllabus de L.SIMAR (1998) : " Multivariate Data Analysis, Part I : Reference Manual and Part II : Applications ", Institut de Statistique, UCL.
Professor : Léopold Simar, tél : 010/47 43 08, simar@stat.ucl.ac.be
Assistant : Eric Lecoutre, tél : 010/47 30 50, lecoutre@stat.ucl.ac.be
References :
Lebart, L., Morineau, A. et J.P. Fenelon (1982) : Traitement des données statistiques. Dunod, Paris.
Saporta, G. (1990) : Probabilités, analyse des données et statistiques. Ed. Tecnip, Paris.
Romeder, J.M. (1973) : Méthodes et programmes d'analyse discriminante. Dunod, Paris
Pour plus d'informations, cliquez ci-dessous
http://www.stat.ucl.ac.be/cours/stat2411/index.html
http://www.stat.ucl.ac.be/cours/stat2411/index.html
Le cours STAT2411 est mentionné dans les programmes suivants :
ACTU2DC
|
Diplôme d'études complémentaires en sciences actuarielles
|
| |
ESP2DC
|
Diplôme d'études complémentaires en méthodes quantitatives en sciences de la santé
|
| |
ESP3DS/EP
|
Diplôme d'études spécialisées en santé publique (recherche clinique)
|
| |
MAP2
|
Ingénieur civil en mathématiques appliquées
|
| |
MATH2
|
Licence en sciences mathématiques
|
| |
STAT2DC
|
Diplôme d'études complémentaires en statistique
|
| |
STAT3DA
|
Diplôme d'études approfondies en statistique
|
| |
Valeurs ECTS de l'activité
ACTU2DC
|
Diplôme d'études complémentaires en sciences actuarielles
|
(5 ECTS)
| |
ESP3DS/EP
|
Diplôme d'études spécialisées en santé publique (recherche clinique)
|
(5 ECTS)
| |
FSA3DA
|
Diplôme d'études approfondies en sciences appliquées
|
(5 ECTS)
| |
MATH21/S
|
Première licence en sciences mathématiques (Statistique)
|
|
Obligatoire
|
MATH22/G
|
Deuxième licence en sciences mathématiques
|
(5 ECTS)
| |
MATH22/I
|
Deuxième licence en sciences mathématiques (Informatique)
|
(5 ECTS)
| |
STAT2DC
|
Diplôme d'études complémentaires en statistique
|
(5 ECTS)
| |
STAT3DA/B
|
diplôme d'études approfondies en statistique (biostatistique et épidémiologie)
|
(5 ECTS)
| |
STAT3DA/E
|
diplôme d'études approfondies en statistique (statistique et économétrie)
|
(5 ECTS)
| |
STAT3DA/P
|
diplôme d'études approfondies en statistique (pratique de la statistique)
|
(5 ECTS)
| |
Valeur ECTS par défaut
|
(5 ECTS)
| |
|