d'enseignement
en ligne
Le cours est articulé autour de quatre thèmes,
- Compléments de fouille de données
- Prise de décision,
- Recherche d'information,
- Analyse de liens et l'exploration du web / graphique.
d'apprentissage
Eu égard au référentiel AA du programme « Master ingénieur civil en informatique », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants :
- INFO1.1-3
- INFO2.2-3
- INFO5.2
Eu égard au référentiel AA du programme « Master [120] en sciences informatiques », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants :
- SINF1.M4
- SINF2.2-3
- SINF5.2
Les étudiants ayant suivi avec fruit ce cours seront capables de
- expliquer et appliquer des méthodes de fouille de données (data mining), tant qualitatives que quantitatives, dans le cadre de la prise de décision.
- avoir un jugement critique sur les méthodes de fouilles de données en fonction de leur champ d'application.
- maîtriser des méthodes d'extraction et recherche d'informations (information retrieval) dans de très larges collections de données, éventuellement enrichies d'une structure de liens (WEB, réseaux sociaux...).
- expliquer l'application de ces méthodes dans les moteurs de recherche et les systèmes de recommandation automatisée.
- mettre en oeuvre les algorithmes de fouille de données et d'extraction d'informations dans des logiciels de data mining ou de traitement statistique tels que S-Plus, R, SAS, Weka ou Matlab.
La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».
des acquis des étudiants
- Deux projets en cours d'annee: chacun compte pour 3/20
- Examen oral: 14/20
Compléments de fouille de données (méthodes statistiques multivariées)
- Analyse des corrélations canoniques
- Analyse des correspondances
- Modèles log-linéaires
- Analyse discriminante
- Multidimensional scaling
- Modèles de Markov et modèles de Markov cachés
- etc
Prise de décision
- Processus de décision de Markov et l'apprentissage par renforcement
- Exploration / exploitation
- Théorie de l'utilité
- Modélisation des préférences multi-critères - la méthode Prométhée
- Raisonnement probabiliste avec des réseaux bayésiens
- Théorie des possibilités
- Théorie des jeux à deux joueurs
- Décisions collectives
Recherche d'information
- Modèle de base d'espace vectoriel
- Modèle probabiliste
- Pages Web Ranking: PageRank, HITS, etc.
- Modèles collaboratifs par recommandations (systèmes de recommandation).
Analyse de liens et l'exploration du web / réseaux
- Détection de la communauté réseau
- Mesures de similarité entre les noeuds
- Partitionnement de graphe spectral et cartographie
Modèles de réputation
Support de cours : transparents de l'enseignant et lectures recommandées :
- Alpaydin (2004), "Introduction to machine learning". MIT Press.
- Bardos (2001), "Analyse discriminante. Application au risque et scoring financier. Dunod.
- Bishop (1995), "Neural networks for pattern recognition". Clarendon Press.
- Bishop (2006), "Pattern recognition and machine learning". Springer-Verlag.
- Bouroche & Saporta (1983), "L'analyse des données". Que Sais-je.
- Cornuéjols & Miclet (2002), "Apprentissage artificiel. Concepts et algorithmes". Eyrolles.
- Duda, Hart & Stork (2001), "Pattern classification, 2nd ed". John Wiley & Sons.
- Dunham (2003), "Data mining. Introductory and advanced topics". Prentice-Hall.
- Greenacre (1984), "Theory and applications of correspondence analysis". Academic Press.
- Han & Kamber (2005), "Data mining: Concepts and techniques, 2nd ed.". Morgan Kaufmann.
- Hand (1981), "Discrimination and classification". John Wiley & Sons.
- Hardle & Simar (2003), "Applied multivariate statistical analysis". Springer-Verlag. Disponible à http://www.quantlet.com/mdstat/scripts/mva/htmlbook/mvahtml.html
- Hastie, Tibshirani & Friedman (2001), "The elements of statistical learning". Springer-Verlag.
- Johnson & Wichern (2002), "Applied multivariate statistical analysis, 5th ed". Prentice-Hall.
- Lebart, Morineau & Piron (1995), "Statistique exploratoire multidimensionnelle". Dunod.
- Mitchell (1997), "Machine learning". McGraw-Hill.
- Naim, Wuillemin, Leray, Pourret & Becker (2004), "Réseaux bayesiens". Editions Eyrolles.
- Nilsson (1998), "Artificial intelligence: A new synthesis". Morgan Kaufmann.
- Ripley (1996), "Pattern recognition and neural networks". Cambridge University Press.
- Rosner (1995), "Fundamentals of biostatistics, 4th ed".Wadsworth Publishing Company.
- Saporta (1990), "Probabilités, analyse des données et statistique". Editions Technip.
- Tan, Steinbach & Kumer (2005), "Introduction to data mining". Pearson.
- Theodoridis & Koutroumbas (2003), "Pattern recognition, 3th ed". Academic Press.
- Therrien (1989), "Decision, estimation and classification". Wiley & Sons.
- Venables & Ripley (2002), "Modern applied statistics with S. Springer-Verlag.
- Webb (2002), "Statistical pattern recognition, 2nd ed". John Wiley and Sons.
Préalables :
- LBIR1304 ou LFSAB1105 : un cours de calcul des probabilités et de statistique mathématique,
- LBIR1200 ou LFSAB1101 : un cours de calcul matriciel,
- LFSAB1402 : un cours de base de programmation.
en charge
Programmes / formations proposant cette unité d'enseignement (UE)
d'apprentissage