STAT2550 | Data Mining |
|
[15h+15h]2q
|
Enseignant(s) :
Libei Chen
|
Objectifs
Au terme du cours l'étudiant aura acquis des connaissances de base sur la méthodologie et les outils du data mining pour le traitement de grandes bases de données d'entreprises. Il aura conscience des spécificités et de l'apport du data mining par rapport à la statistique classique et sera capable de traiter des études de cas avec un logiciel dédicacé.
Cahier des charges
- Domaines d'application du data mining.
- Etapes types de la méthodologie du data mining.
- Echantillonnage et partitionnement de la base de données.
- Prétraitement et validation des données.
- Exploration, réduction et transformation des variables.
- Outils de modélisation et de classification du data mining (présentation générale).
- Arbres de décision.
- Réseaux de neurones.
- Outils de validation du modèle.
- Etudes de cas.
Autres informations du cahier des charges
Ouvrages de référence
Berry M. and G. Linoff (1997), Data Mining Techniques, For Marketing, Sales and Customer Support. John Wiley.
Bishop, C.M. (1995). Neural Networks for Pattern Recognition, Oxford: Oxford University Press.
Breiman, L., Friedman, J.H., Olshen, R.A., and Stone, C.J. (1984), Classification and Regression Trees, Belmont, California: Wadsworth, Inc.
Le cours STAT2550 est mentionné dans les programmes suivants :
STAT2DC
|
Diplôme d'études complémentaires en statistique
|
| |
Valeurs ECTS de l'activité
ESP3DS/EP
|
Diplôme d'études spécialisées en santé publique (recherche clinique)
|
(5 ECTS)
| |
MAP22
|
Deuxième année du programme conduisant au grade d'ingénieur civil en mathématiques appliquées
|
(5 ECTS)
| |
STAT2DC
|
Diplôme d'études complémentaires en statistique
|
(5 ECTS)
| |
Valeur ECTS par défaut
|
(5 ECTS)
| |
|