Web Mining

mlsmm2153  2018-2019  Mons

Web Mining
5 crédits
30.0 h
Q1
Enseignants
Fouss François; Francq Pascal;
Langue
d'enseignement
Anglais
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1

A la fin du cours l¿étudiant sera capable de :

- Définir une politique de référencement d¿un site Web ;

- Comprendre le fonctionnement des principaux outils de recherche disponibles sur le Web ¿ et utiliser ces outils ;

- Comprendre le fonctionnement des principaux algorithmes permettant de classer, d¿analyser et d¿exploiter les informations issues du Web ¿ et utiliser ces algorithmes ;

- Prendre les bonnes décisions dans des processus de recherche d¿information sur le Web et/ou d¿analyse de ces informations.

 

La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».
Contenu
Le Web Mining est l’application de techniques et modèles permettant de rechercher, récolter, nettoyer, analyser, classer et recommander des informations/données issues du Web. Ces techniques sont notamment utilisées dans les moteurs de recherche, qui jouent un rôle central dans la société de l’information connectée, ainsi que les réseaux sociaux. Ce cours a pour objectif d’apprendre à maîtriser ces techniques et modèles, afin notamment de pouvoir les utiliser/appliquer dans des situations réelles.
Les thèmes principaux de ce cours sont:
  • Recherche d’information sur le Web
    • Concepts de base (indexation, de compression, de recherche, de classification et de catégorisation)
    • Modèles de recherche d’information
  • Ingénierie du Web
    • Référencement
    • Collecter, nettoyer et analyser les données issues du Web
    • Outils d’analyse d’audience de sites Web
  • Link Analysis : recommander/analyser du contenu relevant sur base de la structure en hyperliens, formant un réseau/graphe
    • Eléments fondamentaux de la structure d'un réseau/graphe
    • Méthodologie d'analyse d'un réseau/graphe
      • Identification de sous-groupes cohésifs
      • Notions de similarité et de distance
      • Identification de nœuds prestigieux
      • Identification de nœuds centraux
      • Prédiction de nouveaux liens
      • Identification des nœuds maximisant la diffusion d’information dans le réseau
      • etc.
Méthodes d'enseignement
  • Exposés magistraux
  • Exercices intégrés au cours
  • Projet par groupe
Modes d'évaluation
des acquis des étudiants
Défense de projet et examen oral.
!!! Le projet ne pouvant pas être reproduit, le cours est un cours à évaluation unique (i.e., une fois la note obtenue pour le cours, elle est définitive pour toute l'année académique, et ne peut donc plus être améliorée par la suite) !!!
Bibliographie
  • MCILWRAITH D., MARMANIS H., BABENKO D. 2nd ed, Algorithms of the Intelligent Web, Manning Publications, 2016.
  • LANGVILLE A., MEYER C., Google’s PageRank and Beyond : The Science of Search Engine Rankings, Princeton University Press, 2012.
  • FOUSS F., SAERENS M., SHIMBO M., Algorithms and Models for Network Data and Link Analysis, Cambridge University Press, 2016.
  • AMINI M.-R., GAUSSIER E., Recherche d’information : Applications, modèles et algorithmes, Eyrolles, 2013.
  • MANNING C. D., RAGHAVAN P., SCHÜTZE H., Introduction to Information Retrieval, Cambridge University Press, 2008.
  • MARTIN A., CHARTIER M., ANDRIEU O., Techniques de référencement web : Audit et suivi SEO, Eyrolles, 2016.
Faculté ou entité
en charge
CLSM


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en ingénieur de gestion

Master [120] en ingénieur de gestion

Master [120] en science des données, orientation statistique