Logo smcs Bandeau smcs
UCLouvain > Plate-forme SMCS
NEWSLETTER
connexion
EN | FR

Text mining en Python

[5 jours] - [Français]

Vous avez déjà de bonnes notions de programmation ? Vous avez envie de réaliser un projet en text mining ? Vous comptez ensuite utiliser ces techniques de traitement automatique du langage dans un domaine spécifique ?


Le Text Mining (fouille de textes) consiste à analyser des données textuelles à l’aide de techniques quantitatives. A la frontière entre la linguistique, l’informatique et les statistiques, le Text Mining recouvre des techniques variées qui permettent, par exemple, d’automatiser la veille stratégique, d’analyser le style d’un auteur ou d’identifier les sentiments exprimés sur Internet à propos d'un événement, d'un produit, etc… Leur point commun est de permettre une analyse rapide de grandes quantités de données textuelles.
Le traitement automatique de la langue (TAL) et plus particulièrement le « Text Mining » font aujourd’hui partie intégrante de notre quotidien. Le moteur de recherche de Google, l’application Siri d’Apple ou l’assistant personnel intelligent Alexa d’Amazon sont autant d’exemples illustrant cette omniprésence. Au cœur de chacune de ces applications, la structuration de l’information est essentielle. Qu’il s’agisse d’extraire des dates ou des horaires dans des courriels pour planifier un événement ou d’identifier les actions à effectuer à la suite d’une commande vocale, l’analyse du contenu est au cœur de ce type d’applications.


Objectifs de la formation
Notre formation a pour objectif de vous initier à cette analyse de contenu au travers d’exemples concrets, dans un cadre de veille économique. Ces exemples seront réalisés à l'aide du langage de programmation Python, qui devient la référence en data science. Pratiquement, nous avons divisé la formation en cinq modules distincts : prétraitement des données textuelles, étiquetage automatisé d’informations linguistiques, calculs de similarité entre documents, techniques de classification et extraction d’événements. Chacun de ces modules sera composé d’une partie théorique et d’une partie pratique ; l’ensemble offrira une chaîne de traitement complète de text mining.

Prérequis
Les participants devront posséder une bonne connaissance de la programmation en général. Des connaissances de base en Python peuvent être utiles. Une mise à niveau en Python est proposée en amont de la formation afin de la rendre accessible au plus grand nombre :

Initiation au langage Python

Contenu

Tarif
Cette formation est reconnue par l'IABE et permet de ce fait aux participant·es d'obtenir des points CPD.
(Ceci est d'ailleurs vrai pour l'entièreté de l'offre de formations du SMCS.)
IABE logo

Outils utilisés durant la formation
Python

Méthodes et familles de méthodes abordées
Statistique descriptive
   Text Mining


Veuillez vous identifier pour vous inscrire à cette formation.

Il est nécessaire de créer un compte pour une première utilisation de nos services.