En raison de la crise du COVID-19, les informations ci-dessous sont susceptibles d’être modifiées,
notamment celles qui concernent le mode d’enseignement (en présentiel, en distanciel ou sous un format comodal ou hybride).
5 crédits
30.0 h + 10.0 h
Q2
Enseignants
Fouss François; Francq Pascal;
Langue
d'enseignement
d'enseignement
Français
Thèmes abordés
L'objectif de cet enseignement est d'initier les étudiants à la collecte, au nettoyage et à l'analyse des données du web. Le cours abordera les éléments suivants :
- Une introduction, pour rappeler la nécessité de comprendre et donner du sens aux données issues du web
- Les explications sur les différents types de données qu'on trouve sur le web, en incluant les métadonnées, et une sensibilisation aux différentes manières de les extraires.
- Introduire ici les notions de code et sensibiliser aux différents langages existants.
- Le cours introduira ensuite deux types d'analyses de données :
- L'analyse lexicométrique en lien avec la linguistique
- L'analyse des graphes en lien avec la théorie des réseaux sociaux
Acquis
d'apprentissage
d'apprentissage
A la fin de cette unité d’enseignement, l’étudiant est capable de : | |
1 |
Au terme de cet enseignement, l'étudiant sera capable :
|
Contenu
Ce cours a pour objectif d’apprendre à appliquer une méthodologie adéquate d'analyse de données numériques issues du web, et d'apprendre à maîtriser les techniques et modèles ad-hoc, afin notamment de pouvoir les utiliser/appliquer dans des situations réelles.
Les thèmes principaux de ce cours sont:
Les thèmes principaux de ce cours sont:
- Recherche d’information sur le Web
- Concepts de base (indexation, de compression, de recherche, de classification et de catégorisation)
- Modèles de recherche d’information
- Ingénierie du Web
- Référencement
- Collecter, nettoyer et analyser les données issues du Web
- Outils d’analyse d’audience de sites Web
- Link Analysis : recommander/analyser du contenu relevant sur base de la structure en hyperliens, formant un réseau/graphe
- Eléments fondamentaux de la structure d'un réseau/graphe
- Méthodologie d'analyse d'un réseau/graphe
- Identification de sous-groupes cohésifs
- Notions de similarité et de distance
- Identification de nœuds prestigieux
- Identification de nœuds centraux
- Prédiction de nouveaux liens
- etc.
Méthodes d'enseignement
En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.
- Exposés magistraux
- Exercices intégrés au cours
- Projet par groupe
Modes d'évaluation
des acquis des étudiants
des acquis des étudiants
En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.
L’évaluation (unique) a une composante pratique et une composante théorique:- Evaluation continue (travaux pratiques cotés);
- Réalisation d'un projet de groupe;
- Défense du projet et examen oral.
Ressources
en ligne
en ligne
Voir Student Corner / Teams
Bibliographie
- MCILWRAITH D., MARMANIS H., BABENKO D. 2nd ed, Algorithms of the Intelligent Web, Manning Publications, 2016.
- LANGVILLE A., MEYER C., Google’s PageRank and Beyond : The Science of Search Engine Rankings, Princeton University Press, 2012.
- FOUSS F., SAERENS M., SHIMBO M., Algorithms and Models for Network Data and Link Analysis, Cambridge University Press, 2016.
- AMINI M.-R., GAUSSIER E., Recherche d’information : Applications, modèles et algorithmes, Eyrolles, 2013.
- MANNING C. D., RAGHAVAN P., SCHÜTZE H., Introduction to Information Retrieval, Cambridge University Press, 2008.
- MARTIN A., CHARTIER M., ANDRIEU O., Techniques de référencement web : Audit et suivi SEO, Eyrolles, 2016.
Faculté ou entité
en charge
en charge
COMU