Data mining and decision making [ LSINF2275 ]
5.0 crédits ECTS
30.0 h + 30.0 h
2q
Enseignant(s) |
Saerens Marco ;
|
Langue d'enseignement: |
Anglais
|
Lieu de l'activité |
Louvain-la-Neuve
|
Ressources en ligne |
> https://icampus.uclouvain.be/claroline/course/index.php?cid=sinf2275
|
Préalables |
Ce cours présuppose que l'étudiant a suivi
- un cours de calcul des probabilités,
- un cours de statistique mathématique,
- un cours d'analyse statistique multivariée et
- un cours de calcul matriciel.
|
Thèmes abordés |
Le cours est articulé autour de quatre thèmes,
- Compléments de fouille de données
- Prise de décision,
- Recherche d'information,
- Analyse de liens et l'exploration du web / graphique.
|
Acquis d'apprentissage |
- Comprendre et appliquer des méthodes de fouille de données (data mining), tant qualitatives que quantitatives, dans le cadre de la prise de décision.
- Avoir un jugement critique sur les méthodes de fouilles de données en fonction de leur champ d'application.
- Maîtriser des méthodes d'extraction et recherche d'informations (information retrieval) dans de très larges collections de données, éventuellement enrichies d'une structure de liens (WEB, réseaux sociaux...).
- Comprendre l'application de ces méthodes dans les moteurs de recherche et les systèmes de recommandation automatisée.
- Mettre en oeuvre les algorithmes de fouille de données et d'extraction d'informations dans des logiciels de data mining ou de traitement statistique tels que S-Plus, R, SAS, Weka ou Matlab.
|
Modes d'évaluation des acquis des étudiants |
-
Deux projets/cas d'études comptant chacun pour 3 points sur 20.
-
Un examen oral organisé en session comptant pour 14 points sur 20.
|
Méthodes d'enseignement |
-
30 heures de cours magistraux.
-
Deux projets/cas d'études portant sur la résolution de deux problèmes.
|
Contenu |
Compléments de fouille de données
-
Analyse des corrélations canoniques
-
Analyse des correspondances
-
Régression partielle des moindres carrés
-
Modèles log-linéaires
-
Règles de l'Association
Prise de décision
-
Processus de décision de Markov et l'apprentissage par renforcement
-
Exploration / exploitation et les problèmes hostiles
-
Théorie de l'utilité
-
Modélisation des préférences multi-critères - la méthode Prométhée
-
Raisonnement probabiliste avec des réseaux bayésiens
-
Théorie des possibilités
-
Théorie des jeux à deux joueurs
-
Décisions collectives
Recherche d'information
-
Modèle de base d'espace vectoriel
-
Modèle probabiliste
-
Pages Web Ranking: PageRank, HITS, etc.
-
Modèles collaboratifs par recommandations (systèmes de recommandation).
Analyse de liens et l'exploration du web / graphique
-
Détection de la communauté réseau
-
Mesures de similarité entre les n'uds
-
Partitionnement de graphe spectral et cartographie
-
Modèles de réputation
|
Bibliographie |
-
Alpaydin (2004), "Introduction to machine learning". MIT Press.
-
Bardos (2001), "Analyse discriminante. Application au risque et scoring financier. Dunod.
-
Bishop (1995), "Neural networks for pattern recognition". Clarendon Press.
-
Bishop (2006), "Pattern recognition and machine learning". Springer-Verlag.
-
Bouroche & Saporta (1983), "L'analyse des données". Que Sais-je.
-
Cornuéjols & Miclet (2002), "Apprentissage artificiel. Concepts et algorithmes". Eyrolles.
-
Duda, Hart & Stork (2001), "Pattern classification, 2nd ed". John Wiley & Sons.
-
Dunham (2003), "Data mining. Introductory and advanced topics". Prentice-Hall.
-
Greenacre (1984), "Theory and applications of correspondence analysis". Academic Press.
-
Han & Kamber (2005), "Data mining: Concepts and techniques, 2nd ed.". Morgan Kaufmann.
-
Hand (1981), "Discrimination and classification". John Wiley & Sons.
-
Hardle & Simar (2003), "Applied multivariate statistical analysis". Springer-Verlag. Disponible à http://www.quantlet.com/mdstat/scripts/mva/htmlbook/mvahtml.html
-
Hastie, Tibshirani & Friedman (2001), "The elements of statistical learning". Springer-Verlag.
-
Johnson & Wichern (2002), "Applied multivariate statistical analysis, 5th ed". Prentice-Hall.
-
Lebart, Morineau & Piron (1995), "Statistique exploratoire multidimensionnelle". Dunod.
-
Mitchell (1997), "Machine learning". McGraw-Hill.
-
Naim, Wuillemin, Leray, Pourret & Becker (2004), "Réseaux bayesiens". Editions Eyrolles.
-
Nilsson (1998), "Artificial intelligence: A new synthesis". Morgan Kaufmann.
-
Ripley (1996), "Pattern recognition and neural networks". Cambridge University Press.
-
Rosner (1995), "Fundamentals of biostatistics, 4th ed".Wadsworth Publishing Company.
-
Saporta (1990), "Probabilités, analyse des données et statistique". Editions Technip.
-
Tan, Steinbach & Kumer (2005), "Introduction to data mining". Pearson.
-
Theodoridis & Koutroumbas (2003), "Pattern recognition, 3th ed". Academic Press.
-
Therrien (1989), "Decision, estimation and classification". Wiley & Sons.
-
Venables & Ripley (2002), "Modern applied statistics with S. Springer-Verlag.
-
Webb (2002), "Statistical pattern recognition, 2nd ed". John Wiley and Sons.
|
Cycle et année d'étude |
> Certificat universitaire en statistique
> Master [120] en ingénieur de gestion
> Master [120] en ingénieur de gestion
> Master [120] bioingénieur : sciences et technologies de l'environnement
> Master [120] : ingénieur civil en informatique
> Master [120] en sciences informatiques
> Master [120] bioingénieur : chimie et bio-industries
> Master [120] en statistiques, orientation générale
> Master [120] bioingénieur : sciences agronomiques
> Master [120] bioingénieur : gestion des forêts et des espaces naturels
|
Faculté ou entité en charge |
> INFO
|
<<< Page précédente
|