Data science for insurance and finance

3.00 crédits

15.0 h

Enseignants

Hainaut Donatien;

Langue
d'enseignement

Anglais

Préalables

Concepts et outils équivalents à ceux enseignés dans les UEs

LSTAT2020	Logiciels et programmation statistique de base
LSTAT2120	Linear models
LSTAT2100	Modèles linéaires généralisés et données discrêtes

A first course in probability and statistics is required e.g. : LBIR1203 Probabilités et statistiques I and LBIR1304 Probabilités et statistiques II (or equivalent modules).

Thèmes abordés

This module aims to introduce recent developments in the field of statistical learning, applied to the insurance and financial sectors. Statistical methods are used in the insurance industry to assess the risk profile of an insured. This profile presents two sides: one is the frequency of claims and the other is the size of the claim caused by the insured. Both aspects are studied carefully by insurers so as to propose the best price for an insurance coverage. In the financial industry, advanced statistical methods are needed to evaluate the credit risk of a lender. As for an insurance contract, this risk has two sides. The first one is the probability that the lender will not repay is debt (the default risk). The second aspect is the size of the loss when the lender do not redeem is loan. This module present the common tools to study these risks: generalized linear models, additive models, Regression/classification trees. Some new aspects will also be developed among them we quote shrinkage methods (Lasso, Ridge) and random forests that reveals to be powerful tools to explore massive data.

Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :
1	At the end of this course, students will be able: To explain and motivate the choice of a statistical method to analyze insurance or financial data To use Generalized Linear and Additive models to propose a grid of insurance premium or to propose a model to evaluate the default risk of a counterparty To use Regression Tree and random forest on insurance or credit datasets. To adapt the previous cited methods to include constraints of sparsity in the calibration (Lasso Ridge) To understand the interests of bootstrapping methods and to implement them.

Contenu

Ce cours a pour sujet les applications du deep learning à l'assurance et la finance. La première partie introduit les réseaux de neurones en tant qu'outils de régression. Nous parcourons les algorithmes de calibration et les différentes functions de perte, adaptés aux applications actuarielles et financières. Nous présentons également les techniques de gestion de base de données en haute dimension (pénalisation, embedding, randomisation) ainsi que les méthodes de régularisation du biais. Nous voyons ensuite les outils d'interprétation des résultats d'un réseau neurones, globaux (PDP, ICE) et locaux (LIME, SHAP). La seconde partie du cours est consacrée à l'apprentissage non supervisé et en particulier aux auto-encodeurs neuronaux pour le calcul d'indicateurs d'analyse. La dernière section introduit les techniques de prévision des séries temporelles à l'aide des réseaux récurrents, "long short-term" et convolutionels.

Méthodes d'enseignement

Lecture avec diapositives
Programmation en Python (keras & tensorflow)
Etudes de cas

Modes d'évaluation
des acquis des étudiants

L'évaluation est basée sur un rapport individuel dans lequel les méthodes vues pendant les lectures sont appliquées à un jeu de données réelles. Notez que le professeur se réserve le droit d'interroger oralement les étudiants sur le contenu de leur travail.

Ressources
en ligne

Moodle website

Bibliographie

Slides available on moodle are based on the following reference:
Denuit M., Trufin J. , Hainaut D. 2019. Effective statistical learning III : neural networks and extensions. Springer actuarial lectures notes.

Faculté ou entité
en charge

LSBA

Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme

Sigle

Crédits

Prérequis

Acquis
d'apprentissage

Master [120] en science des données, orientation statistique

DATS2M

Master [120] en sciences actuarielles

ACTU2M

Master [120] en statistique, orientation générale

STAT2M

Certificat d'université : Statistique et science des données (15/30 crédits)

STAT2FC