Analyse des données numériques

mcomu1311  2019-2020  Mons

Analyse des données numériques
Note du 29 juin 2020
Sans connaitre encore le temps que dureront les mesures de distances sociales liées à la pandémie de Covid-19, et quels que soient les changements qui ont dû être opérés dans l’évaluation de la session de juin 2020 par rapport à ce que prévoit la présente fiche descriptive, de nouvelles modalités d’évaluation des unités d’enseignement peuvent encore être adoptées par l’enseignant ; des précisions sur ces modalités ont été -ou seront-communiquées par les enseignant·es aux étudiant·es dans les plus brefs délais.
5 crédits
30.0 h + 10.0 h
Q2
Enseignants
Fouss François; Francq Pascal;
Langue
d'enseignement
Français
Préalables
/
Thèmes abordés
L'objectif de cet enseignement est d'initier les étudiants à la collecte, au nettoyage et à l'analyse des données du web. Le cours abordera les éléments suivants :
  • Une introduction, pour rappeler la nécessité de comprendre et donner du sens aux données issues du web
  • Les explications sur les différents types de données qu'on trouve sur le web, en incluant les métadonnées, et une sensibilisation aux différentes manières de les extraires.
  • Introduire ici les notions de code et sensibiliser aux différents langages existants.
  • Le cours introduira ensuite deux types d'analyses de données :
  • L'analyse lexicométrique en lien avec la linguistique
  • L'analyse des graphes en lien avec la théorie des réseaux sociaux
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1
  • De comprendre la structures des données numériques
  • De comprendre les grandes étapes de collecte, de nettoyage et d'exploitation des données
  • De réaliser une analyse lexicométrique et une analyse de graphes de base
 

La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».
Contenu
Ce cours a pour objectif d’apprendre à appliquer une méthodologie adéquate d'analyse de données numériques issues du web, et d'apprendre à maîtriser les techniques et modèles ad-hoc, afin notamment de pouvoir les utiliser/appliquer dans des situations réelles.
Les thèmes principaux de ce cours sont:
  • Recherche d’information sur le Web
    • Concepts de base (indexation, de compression, de recherche, de classification et de catégorisation)
    • Modèles de recherche d’information
  • Ingénierie du Web
    • Référencement
    • Collecter, nettoyer et analyser les données issues du Web
    • Outils d’analyse d’audience de sites Web
  • Link Analysis : recommander/analyser du contenu relevant sur base de la structure en hyperliens, formant un réseau/graphe
    • Eléments fondamentaux de la structure d'un réseau/graphe
    • Méthodologie d'analyse d'un réseau/graphe
      • Identification de sous-groupes cohésifs
      • Notions de similarité et de distance
      • Identification de nœuds prestigieux
      • Identification de nœuds centraux
      • Prédiction de nouveaux liens
      • etc.
Méthodes d'enseignement
  • Exposés magistraux
  • Exercices intégrés au cours
  • Projet par groupe
Modes d'évaluation
des acquis des étudiants
    L’évaluation (unique) a une composante pratique et une composante théorique:
    • Evaluation continue (travaux pratiques cotés);
    • Réalisation d'un projet de groupe;
    • Défense du projet et examen oral.
    !!! La note obtenue est unique et ne peut donc pas être améliorée durant l'année académique en cours !!!
    Bibliographie
    • MCILWRAITH D., MARMANIS H., BABENKO D. 2nd ed, Algorithms of the Intelligent Web, Manning Publications, 2016.
    • LANGVILLE A., MEYER C., Google’s PageRank and Beyond : The Science of Search Engine Rankings, Princeton University Press, 2012.
    • FOUSS F., SAERENS M., SHIMBO M., Algorithms and Models for Network Data and Link Analysis, Cambridge University Press, 2016.
    • AMINI M.-R., GAUSSIER E., Recherche d’information : Applications, modèles et algorithmes, Eyrolles, 2013.
    • MANNING C. D., RAGHAVAN P., SCHÜTZE H., Introduction to Information Retrieval, Cambridge University Press, 2008.
    • MARTIN A., CHARTIER M., ANDRIEU O., Techniques de référencement web : Audit et suivi SEO, Eyrolles, 2016.
    Faculté ou entité
    en charge
    COMU


    Programmes / formations proposant cette unité d'enseignement (UE)

    Intitulé du programme
    Sigle
    Crédits
    Prérequis
    Acquis
    d'apprentissage
    Master [120] en communication

    Bachelier en information et communication

    Master [60] en information et communication

    Bachelier en sciences humaines et sociales

    Master [120] en communication (horaire décalé)