<- Archives UCL - Programme d'études ->



Data mining and decision making [ LSINF2275 ]


5.0 crédits ECTS  30.0 h + 30.0 h   2q 

Enseignant(s) Saerens Marco ;
Langue
d'enseignement:
Anglais
Lieu de l'activité Louvain-la-Neuve
Ressources
en ligne

> https://icampus.uclouvain.be/claroline/course/index.php?cid=sinf2275

Préalables

Ce cours présuppose que l'étudiant a suivi

  • un cours de calcul des probabilités,
  • un cours de statistique mathématique,
  • un cours d'analyse statistique multivariée et
  • un cours de calcul matriciel.
Thèmes abordés

Le cours est articulé autour de quatre thèmes,

  1. Compléments de fouille de données
  2. Prise de décision,
  3. Recherche d'information,
  4. Analyse de liens et l'exploration du web / graphique.
Acquis
d'apprentissage
  • Comprendre et appliquer des méthodes de fouille de données (data mining), tant qualitatives que quantitatives, dans le cadre de la prise de décision.
  • Avoir un jugement critique sur les méthodes de fouilles de données en fonction de leur champ d'application.
  • Maîtriser des méthodes d'extraction et recherche d'informations (information retrieval) dans de très larges collections de données, éventuellement enrichies d'une structure de liens (WEB, réseaux sociaux...).
  • Comprendre l'application de ces méthodes dans les moteurs de recherche et les systèmes de recommandation automatisée.
  • Mettre en oeuvre les algorithmes de fouille de données et d'extraction d'informations dans des logiciels de data mining ou de traitement statistique tels que S-Plus, R, SAS, Weka ou Matlab.
Modes d'évaluation
des acquis des étudiants
  • Deux projets/cas d'études comptant chacun pour 3 points sur 20.
  • Un examen oral organisé en session comptant pour 14 points sur 20.
Méthodes d'enseignement
  • 30 heures de cours magistraux.
  • Deux projets/cas d'études portant sur la résolution de deux problèmes.
Contenu

Compléments de fouille de données

  • Analyse des corrélations canoniques
  • Analyse des correspondances
  • Régression partielle des moindres carrés
  • Modèles log-linéaires
  • Règles de l'Association

Prise de décision

  • Processus de décision de Markov et l'apprentissage par renforcement
  • Exploration / exploitation et les problèmes hostiles
  • Théorie de l'utilité
  • Modélisation des préférences multi-critères - la méthode Prométhée
  • Raisonnement probabiliste avec des réseaux bayésiens
  • Théorie des possibilités
  • Théorie des jeux à deux joueurs
  • Décisions collectives

Recherche d'information

  • Modèle de base d'espace vectoriel
  • Modèle probabiliste
  • Pages Web Ranking: PageRank, HITS, etc.
  • Modèles collaboratifs par recommandations (systèmes de recommandation).

Analyse de liens et l'exploration du web / graphique

  • Détection de la communauté réseau
  • Mesures de similarité entre les n'uds
  • Partitionnement de graphe spectral et cartographie
  • Modèles de réputation
Bibliographie
  • Alpaydin (2004), "Introduction to machine learning". MIT Press.
  • Bardos (2001), "Analyse discriminante. Application au risque et scoring financier. Dunod.
  • Bishop (1995), "Neural networks for pattern recognition". Clarendon Press.
  • Bishop (2006), "Pattern recognition and machine learning". Springer-Verlag.
  • Bouroche & Saporta (1983), "L'analyse des données". Que Sais-je.
  • Cornuéjols & Miclet (2002), "Apprentissage artificiel. Concepts et algorithmes". Eyrolles.
  • Duda, Hart & Stork (2001), "Pattern classification, 2nd ed". John Wiley & Sons.
  • Dunham (2003), "Data mining. Introductory and advanced topics". Prentice-Hall.
  • Greenacre (1984), "Theory and applications of correspondence analysis". Academic Press.
  • Han & Kamber (2005), "Data mining: Concepts and techniques, 2nd ed.". Morgan Kaufmann.
  • Hand (1981), "Discrimination and classification". John Wiley & Sons.
  • Hardle & Simar (2003), "Applied multivariate statistical analysis". Springer-Verlag. Disponible à http://www.quantlet.com/mdstat/scripts/mva/htmlbook/mvahtml.html
  • Hastie, Tibshirani & Friedman (2001), "The elements of statistical learning". Springer-Verlag.
  • Johnson & Wichern (2002), "Applied multivariate statistical analysis, 5th ed". Prentice-Hall.
  • Lebart, Morineau & Piron (1995), "Statistique exploratoire multidimensionnelle". Dunod.
  • Mitchell (1997), "Machine learning". McGraw-Hill.
  • Naim, Wuillemin, Leray, Pourret & Becker (2004), "Réseaux bayesiens". Editions Eyrolles.
  • Nilsson (1998), "Artificial intelligence: A new synthesis". Morgan Kaufmann.
  • Ripley (1996), "Pattern recognition and neural networks". Cambridge University Press.
  • Rosner (1995), "Fundamentals of biostatistics, 4th ed".Wadsworth Publishing Company.
  • Saporta (1990), "Probabilités, analyse des données et statistique". Editions Technip.
  • Tan, Steinbach & Kumer (2005), "Introduction to data mining". Pearson.
  • Theodoridis & Koutroumbas (2003), "Pattern recognition, 3th ed". Academic Press.
  • Therrien (1989), "Decision, estimation and classification". Wiley & Sons.
  • Venables & Ripley (2002), "Modern applied statistics with S. Springer-Verlag.
  • Webb (2002), "Statistical pattern recognition, 2nd ed". John Wiley and Sons.
Cycle et année
d'étude
> Certificat universitaire en statistique
> Master [120] en ingénieur de gestion
> Master [120] en ingénieur de gestion
> Master [120] bioingénieur : sciences et technologies de l'environnement
> Master [120] : ingénieur civil en informatique
> Master [120] en sciences informatiques
> Master [120] bioingénieur : chimie et bio-industries
> Master [120] en statistiques, orientation générale
> Master [120] bioingénieur : sciences agronomiques
> Master [120] bioingénieur : gestion des forêts et des espaces naturels
Faculté ou entité
en charge
> INFO


<<< Page précédente