Titre : | Prédire le passage en invalidité : les méthodes d’apprentissage automatique appliquées aux données de santé françaises (2024) |
Auteurs : | Corinne Mette, Auteur ; Dorian Verboux, Auteur ; Antoine Rachas, Auteur ; Gonzague Debeugny, Auteur |
Type de document : | Article : texte imprimé |
Dans : | Santé publique (Vol. 35 n°6, Décembre 2023) |
Article en page(s) : | pp. 65-85 |
Langues: | Français |
Catégories : | |
Résumé : |
"Introduction : Le recours à la pension d’invalidité a des implications morbides (physiques ou psychiques) et sociales (baisse du revenu). Il a aussi des conséquences économiques pour la société, avec des dépenses croissantes depuis 2011 (+4,9 % en moyenne par année). Prévenir la perte de la capacité à travailler devrait permettre de limiter ces conséquences, mais nécessite de cibler les personnes à risque. Le développement des méthodes d’intelligence artificielle ouvre des perspectives en ce sens.
But de l’étude : Cibler les personnes ayant une « forte » probabilité de devenir bénéficiaires d’une pension d’invalidité dans l’année au regard de leurs caractéristiques sociodémographiques et médicales (pathologies, arrêts de travail, médicaments et actes médicaux) à partir de méthodes d’apprentissage automatique supervisé. Méthodes : Parmi les bénéficiaires du régime général âgés de 21 à 64 ans en 2017, comparaison des caractéristiques de 2014 à 2016 entre les nouveaux bénéficiaires d’une pension d’invalidité en 2017 et ceux n’en bénéficiant pas. La détermination de la frontière entre ces deux groupes a été testée à l’aide de la régression logistique, des arbres de décision, des forêts aléatoires, de la classification naïve bayésienne et des séparateurs à vaste marge. Les performances des modèles ont été comparées au regard de la justesse, la précision, la sensibilité, la spécificité et l’AUC (Area Under the Curve). Le pouvoir prédictif de chaque facteur est estimé à partir de l’AUC. Résultats : La régression logistique boostée avait les meilleures performances sur trois des cinq critères retenus, mais une faible sensibilité. La meilleure sensibilité était obtenue avec les séparateurs à vaste marge, avec une justesse proche de la régression logistique boostée mais une précision et une spécificité inférieures. Les forêts aléatoires offraient la meilleure capacité discriminatoire. Les facteurs les plus prédictifs du risque de passer en invalidité étaient le bénéfice d’au moins 30 jours d’indemnités journalières pour maladie en 2014, 2015 et 2016 et le fait d’être âgé de 55 à 64 ans. Conclusion : Les méthodes d’apprentissage supervisé sont apparues pertinentes pour le ciblage des personnes les plus à risque de recourir à la pension d’invalidité et, plus largement, pour le pilotage d’autres prestations sociales." |
Catalogueur : | RESOdoc |
Exemplaires (1)
Cote | Code-barres | Support | Localisation | Disponibilité |
---|---|---|---|---|
RESO S.18 | RE65682634 | Bulletin | RESOdoc | Consultation sur place Disponible |