Acquérir de solides bases méthodologiques en analyse et traitement de données et les appliquer dans des domaines variés tel que sciences humaines, ingénierie, marketing, finance, assurance ou sciences du vivant...
Au terme de la formation, l’étudiant maîtrisera les concepts fondamentaux en statistique, algorithmique, data mining, machine learning nécessaires à l’exercice du métier de « data scientist ». Il développera des compétences en communication et sera capable d’analyser un problème complexe, de collaborer à un projet de recherche. Selon les objectifs visés par l'étudiant, plusieurs modules au choix sont proposés : données appliquées, algorithmique et informatique, statistique et échantillonnage, data sciences en linguistique, data sciences appliquées à la gestion.
Au terme de ce programme, le diplômé est capable de :
Démontrer la maîtrise d’un solide corpus de connaissances en sciences des données, lui permettant de résoudre les problèmes qui relèvent de sa discipline
Les structures de données et algorithmes pour l'analyse de données.
Les théories de l'apprentissage, la fouille de données et la visualisation de données de grande dimension.
L'inférence statistique, la modélisation et l'informatique statistique. L'étudiant dans l'orientation technologies de l'information se spécialise via des cours obligatoires ou au choix.
Les aspects industriels et entrepreneuriaux de la science des données. L'étudiant dans l'orientation en technologies de l'information se spécialise via une option.
Les systèmes informatiques, y compris le calcul distribué, le calcul embarqué, les réseaux et la sécurité.
Les méthodes numériques et l'optimisation, y compris la programmation par contraintes, la recherche opérationnelle, l'identification et les mathématiques appliquées.
Organiser et de mener à son terme une démarche de développement d’un système d'exploitation des données répondant aux besoins généralement complexes d’un client.
Analyser le problème à résoudre ou les besoins fonctionnels à rencontrer et formuler le cahier des charges correspondant.
Formaliser et modéliser le problème et concevoir une ou plusieurs solutions techniques originales répondant à ce cahier des charges.
Evaluer, justifier et classer les solutions au regard de l’ensemble des critères figurant dans le cahier de charges : efficacité, faisabilité, qualité, pertinence et sécurité.
Implémenter, tester et valider la solution retenue et en interpréter les résultats.
Formuler des recommandations pour améliorer le caractère opérationnel de la solution.
Organiser et de mener à son terme un travail de recherche pour appréhender une problématique inédite liée à l'exploitation de données selon une méthodologie ou dans un environnement nouveau.
Se documenter et résumer l’état des connaissances actuelles dans le domaine considéré.
Proposer une modélisation et/ou un dispositif expérimental permettant de simuler et de tester des hypothèses relatives au problème étudié.
Mettre en forme un rapport de synthèse visant à décrire la méthodologie avec rigueur et expliciter les potentialités d’innovation théoriques et/ou techniques résultant de ce travail de recherche.
Contribuer en équipe à la conduite d’un projet d'exploitation de données et le mener à son terme en tenant compte des objectifs, des ressources allouées et des contraintes qui le caractérisent.
Cadrer et expliciter les objectifs d’un projet (en y associant des indicateurs de performance) compte tenu des enjeux et des contraintes qui caractérisent l’environnement du projet.
S’engager collectivement sur un plan de travail, un échéancier et des rôles à tenir.
Fonctionner dans un environnement pluridisciplinaire, conjointement avec d’autres acteurs porteurs de différents points de vue : gérer des points de désaccord ou des conflits.
Prendre des décisions en équipe lorsqu’il y a des choix à faire : que ce soit sur les solutions techniques ou sur l’organisation du travail pour faire aboutir le projet.
Communiquer efficacement oralement et par écrit en vue de mener à bien les projets qui lui sont confiés dans son environnement de travail (en particulier en anglais).
Identifier clairement les besoins du « client » ou de l’usager : questionner, écouter et comprendre toutes les dimensions de sa demande et pas seulement les aspects techniques.
Argumenter et convaincre en s’adaptant au langage de ses interlocuteurs : techniciens, collègues, clients, supérieurs hiérarchiques.
Communiquer sous forme graphique et schématique ; interpréter un schéma, présenter les résultats d’un travail, structurer des informations.
Lire, analyser et exploiter des documents techniques (diagrammes, manuels, cahiers de charge…).
Rédiger des documents écrits en tenant compte des exigences contextuelles et des conventions sociales en la matière.
Faire un exposé oral convaincant en utilisant les techniques modernes de communication.
Faire preuve à la fois de rigueur, d'ouverture, d'esprit critique et d'éthique dans son travail.
Appliquer les normes en vigueur dans les disciplines de la science des données (terminologie, mesures de qualité, …).
Trouver des solutions qui vont au-delà des enjeux strictement techniques, en intégrant les enjeux de dimension éthique d’un projet (y compris la confidentialité des données et la protection de la vie privée) et de développement durable.
Faire preuve d’esprit critique vis-à-vis d’une solution technique pour en vérifier la robustesse et minimiser les risques qu’elle présente au regard du contexte de sa mise en œuvre.
S’autoévaluer et développer de manière autonome les connaissances nécessaires pour rester compétent dans son domaine.