5.0 crédits
30.0 h
2q
Enseignants
Saerens Marco;
Langue
d'enseignement
d'enseignement
Anglais
Thèmes abordés
Développer de manière critique les fondements théoriques des méthodes d analyses des données (également appelées méthodes de data mining , de machine learning et de reconnaissance des formes chez les ingénieurs et les informaticiens) quantitatives, dans le cadre de la prise de décision, et confronter la diversité de leurs champs d application.
Acquis
d'apprentissage
d'apprentissage
Eu égard au référentiel des acquis d'apprentissage AA du programme, cette activité contribue au développement et à l'acquisition des AA suivants:
- 2. Maîtrise des savoirs 2.1. Maîtriser un socle de savoirs ' 2.2. Maîtriser des savoirs hautement spécialisés ' 2.4. Activer et appliquer des savoirs' 3. Appliquer une démarche scientifique 3.1. Mener un raisonnement analytique' 3.2. Collecter, sélectionner et analyser les informations, ' 3.3. Penser le problème selon une approche systémique et globale, ' 3.4. Synthétiser avec discernement ' faire preuve d'abstraction conceptuelle ' 3.5. Dégager' des solutions implémentables' 6. Travailler en équipe et en exercer le leadership 6.1. Travailler en équipe... 7. Gérer un projet 7.1. Cadrer un projet ' et en définir les résultats attendus' 8. Communiquer 8.1. Exprimer un message de façon claire et structurée' 8.2. Interagir et dialoguer de façon efficace' 9. Se développer 9.1. Gérer de façon autonome son travail ' 9.4. Apprendre rapidement et de manière autonome'
La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».
Contenu
- Présentation des méthodes d analyse de données quantitatives, en particulier la méthodologie du scoring et de la classification ;
- Présentation de méthodes de prise de décision ;
- Lecture de textes présentant les fondements des méthodes d analyse de données et de prise de décision ;
- Exercices d appropriation des méthodes par un travail en groupe d analyse de matériaux quantitatifs recueillis personnellement ou mis à disposition ;
- Initiation aux logiciels professionnels d analyse de données quantitatives : SAS/JMP et R ;
- Discussion sur les choix de méthodes pertinentes en fonction du problème posé et des données disponibles.
Méthode
- Combinaison de cours magistraux, travaux pratiques, lectures + projet sur données réelles.
- Enseignement de la matière en modules.
Contenu
Etude de méthodes d analyse de données et de prise de décision, et interprétation des résultats:
Méthodes projectives et d extraction de caractéristiques :
- Données catégorielles: méthodes projectives, modèles log-linéaires, arbres de décision,'
- Données quantitatives: méthodes factorielles et projectives, arbres de décision, analyse discriminante,'
Méthodes de classification supervisée et non-supervisée: Classifieur Bayesien naïf, réseaux de neurones artificiels, combinaison de classifieurs, clustering agglomératif, hiérarchique et spectral,'
Prise de décision à partir des données et des modèles : théorie the la décision Bayesienne, réseaux Bayesiens, processus de décision markoviens, reinforcement learning , décision multicritère.
Application a l information retrieval et au web mining (PageRank, Hits, recommandation collaborative, etc).
Discussion sur les choix de méthodes pertinentes en fonction du problème posé et des données disponibles.
Etude de cas réelle concernant un problème de scoring et de prise de décision.
Méthodes
Activités en présentiel
0 Exposés magistraux
0 Apprentissage par projet
Activités hors présentiel
0 Lectures préparatoires
0 Rédaction de travaux
Bibliographie
: Pas de syllabus. et disponible en ligne . OUVRAGE proposé : Alpaydin (2004), 'Introduction to machine learning'. MIT Press.
Bardos (2001), Analyse discriminante. Application au risque et scoring financier. Dunod.
Bishop (1995), Neural networks for pattern recognition . Clarendon Press.
Bishop (2006), 'Pattern recognition and machine learning'. Springer-Verlag.
Bouroche & Saporta (1983), L analyse des données . Que Sais-je.
Cornuéjols & Miclet (2002), Apprentissage artificiel. Concepts et algorithmes . Eyrolles.
Duda, Hart & Stork (2001), Pattern classification, 2nd ed . John Wiley & Sons.
Dunham (2003), Data mining. Introductory and advanced topics . Prentice-Hall.
Greenacre (1984), Theory and applications of correspondence analysis . Academic Press.
Han & Kamber (2006), Data mining: Concepts and techniques, 2nd ed . Morgan Kaufmann.
Hand (1981), Discrimination and classification . John Wiley & Sons.
Hardle & Simar (2003), Applied multivariate statistical analysis . Springer-Verlag. Disponible à http://www.quantlet.com/mdstat/scripts/mva/htmlbook/mvahtml.html
Hastie, Tibshirani & Friedman (2001), The elements of statistical learning . Springer-Verlag.
Johnson & Wichern (2002), Applied multivariate statistical analysis, 5th ed . Prentice-Hall.
Lebart, Morineau & Piron (2006), Statistique exploratoire multidimensionnelle, 4e ed . Dunod.
Mitchell (1997), Machine learning . McGraw-Hill.
Naim, Wuillemin, Leray, Pourret & Becker (2004), 'Réseaux bayesiens'. Editions Eyrolles.
Nilsson (1998), 'Artificial intelligence: A new synthesis'. Morgan Kaufmann.
Ripley (1996), Pattern recognition and neural networks . Cambridge University Press.
Rosner (1995), Fundamentals of biostatistics, 4th ed .Wadsworth Publishing Company.
Saporta (2006), Probabilités, analyse des données et statistique, 2nd ed . Editions Technip.
Tan, Steinbach & Kumar (2005), 'Introduction to data mining'. Addison Wesley.
Theodoridis & Koutroumbas (2006), Pattern recognition, 3nd ed . Academic Press.
Therrien (1989), Decision, estimation and classification . Wiley & Sons.
Venables & Ripley (2002), Modern applied statistics with S. Springer-Verlag.
Vincke (1989), L aide multicritere a la decision . Editions Ellipses.
Wasserman (2004), 'All of statistics'. Springer.
Webb (2002), Statistical pattern recognition, 2nd ed . John Wiley and Sons. non obligatoire et disponible en ligne . DOSSIER DE LECTURE non obligatoire . Les supports disponibles en ligne sont sur ICAMPUS.
Autres infos
Pré-requis (idéalement en termes de compétences) : cours de Statistiques multivariées, de calcul des probabilités, de statistique mathématique, d analyse multivariable et de calcul matriciel
Evaluation : Rédaction de deux articles basés sur les projets
Références :
- Duda, Hart & Stork (2001), Pattern classification, 2nd ed . John Wiley & Sons.
- Bardos (2001), Analyse discriminante. Application au risque et scoring financier. Dunod.
- Lebart, Morineau & Piron (1995), Statistique exploratoire multidimensionnelle . Dunod.
- Webb (2002), Statistical pattern recognition, 2nd ed . John Wiley and Sons.
- Theodoridis & Koutroumbas (2003), Pattern recognition . Academic Press.
- Alpaydin (2004), Introduction to machine learning . MIT Press.
- Han & Kamber (2000), Data mining: Concepts and techniques . Morgan Kaufmann.
- etc.
Faculté ou entité
en charge
en charge
Programmes / formations proposant cette unité d'enseignement (UE)
Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
d'apprentissage
Approfondissement en sciences informatiques
Master [120] en sciences de la population et du développement
Master [120] en ingénieur de gestion
Master [120] en sciences de gestion
Master [120] en sciences de gestion