Data mining and decision making [ LSINF2275 ]
5.0 crédits ECTS
30.0 h + 30.0 h
2q
Enseignant(s) |
Saerens Marco ;
|
Langue d'enseignement: |
Anglais
|
Lieu de l'activité |
Louvain-la-Neuve
|
Préalables |
Ce cours présuppose que l'étudiant a suivi
- un cours de calcul des probabilités,
- un cours de statistique mathématique,
- un cours d'analyse statistique multivariée et
- un cours de calcul matriciel.
|
Thèmes abordés |
Le cours est articulé autour de quatre thèmes,
- Compléments de fouille de données
- Prise de décision,
- Recherche d'information,
- Analyse de liens et l'exploration du web / graphique.
|
Acquis d'apprentissage |
- Comprendre et appliquer des méthodes de fouille de données (data mining), tant qualitatives que quantitatives, dans le cadre de la prise de décision.
- Avoir un jugement critique sur les méthodes de fouilles de données en fonction de leur champ d'application.
- Maîtriser des méthodes d'extraction et recherche d'informations (information retrieval) dans de très larges collections de données, éventuellement enrichies d'une structure de liens (WEB, réseaux sociaux...).
- Comprendre l'application de ces méthodes dans les moteurs de recherche et les systèmes de recommandation automatisée.
- Mettre en oeuvre les algorithmes de fouille de données et d'extraction d'informations dans des logiciels de data mining ou de traitement statistique tels que S-Plus, R, SAS, Weka ou Matlab.
|
Contenu |
Compléments de fouille de données
- Analyse des corrélations canoniques
- Analyse des correspondances
- Régression partielle des moindres carrés
- Modèles log-linéaires
- Règles de l'Association
Prise de décision
- Processus de décision de Markov et l'apprentissage par renforcement
- Exploration / exploitation et les problèmes hostiles
- Théorie de l'utilité
- Modélisation des préférences multi-critères - la méthode Prométhée
- Raisonnement probabiliste avec des réseaux bayésiens
- Théorie des possibilités
- Théorie des jeux à deux joueurs
- Décisions collectives
Recherche d'information
- Modèle de base d'espace vectoriel
- Modèle probabiliste
- Pages Web Ranking: PageRank, HITS, etc.
- Modèles collaboratifs par recommandations (systèmes de recommandation).
Analyse de liens et l'exploration du web / graphique
- Détection de la communauté réseau
- Mesures de similarité entre les n'uds
- Partitionnement de graphe spectral et cartographie
- Modèles de réputation
|
Bibliographie |
- Alpaydin (2004), "Introduction to machine learning". MIT Press.
- Bardos (2001), "Analyse discriminante. Application au risque et scoring financier. Dunod.
- Bishop (1995), "Neural networks for pattern recognition". Clarendon Press.
- Bishop (2006), "Pattern recognition and machine learning". Springer-Verlag.
- Bouroche & Saporta (1983), "L'analyse des données". Que Sais-je.
- Cornuéjols & Miclet (2002), "Apprentissage artificiel. Concepts et algorithmes". Eyrolles.
- Duda, Hart & Stork (2001), "Pattern classification, 2nd ed". John Wiley & Sons.
- Dunham (2003), "Data mining. Introductory and advanced topics". Prentice-Hall.
- Greenacre (1984), "Theory and applications of correspondence analysis". Academic Press.
- Han & Kamber (2005), "Data mining: Concepts and techniques, 2nd ed.". Morgan Kaufmann.
- Hand (1981), "Discrimination and classification". John Wiley & Sons.
- Hardle & Simar (2003), "Applied multivariate statistical analysis". Springer-Verlag. Disponible à http://www.quantlet.com/mdstat/scripts/mva/htmlbook/mvahtml.html
- Hastie, Tibshirani & Friedman (2001), "The elements of statistical learning". Springer-Verlag.
- Johnson & Wichern (2002), "Applied multivariate statistical analysis, 5th ed". Prentice-Hall.
- Lebart, Morineau & Piron (1995), "Statistique exploratoire multidimensionnelle". Dunod.
- Mitchell (1997), "Machine learning". McGraw-Hill.
- Naim, Wuillemin, Leray, Pourret & Becker (2004), "Réseaux bayesiens". Editions Eyrolles.
- Nilsson (1998), "Artificial intelligence: A new synthesis". Morgan Kaufmann.
- Ripley (1996), "Pattern recognition and neural networks". Cambridge University Press.
- Rosner (1995), "Fundamentals of biostatistics, 4th ed".Wadsworth Publishing Company.
- Saporta (1990), "Probabilités, analyse des données et statistique". Editions Technip.
- Tan, Steinbach & Kumer (2005), "Introduction to data mining". Pearson.
- Theodoridis & Koutroumbas (2003), "Pattern recognition, 3th ed". Academic Press.
- Therrien (1989), "Decision, estimation and classification". Wiley & Sons.
- Venables & Ripley (2002), "Modern applied statistics with S. Springer-Verlag.
- Webb (2002), "Statistical pattern recognition, 2nd ed". John Wiley and Sons.
|
Cycle et année d'étude |
> Master [120] en sciences informatiques
> Master [120] : ingénieur civil en informatique
> Master [120] en statistiques, orientation générale
> Certificat universitaire en statistique
> Master 120 en ingénieur de gestion
|
Faculté ou entité en charge |
> INFO
|
<<< Page précédente
|