Télécharger la proposition de stage
Type de stage
Dernière année d’école d’ingénieur ou stage de M2, spécialité Informatique
Date ou durée du stage
Date de début du stage février/mars 2026 pour une durée de 5-6 mois (date modifiable au besoin).
Contexte
Les traumatismes crâniens représentent un enjeu majeur de santé publique, avec un fort impact en termes de morbidité, de qualité de vie et de coûts socio-économiques. Ils sont très nombreux (180 000 nouveaux cas par an, soit plus que d’AVC) et touchent tous les âges. Les bases médico-administratives, comme celles issues du Système National de Données de Santé (SNDS), offrent une opportunité unique pour analyser de grands volumes de données cliniques, démographiques et contextuelles, dans cette problématique majeure (car le traumatisme crânien est une pathologie oubliée, qui ne bénéficie pas de centre de référence, de plan de santé publique dédié etc.).
Cependant, ces données complexes nécessitent des méthodes avancées d’analyse et de modélisation pour identifier les facteurs pronostiques et développer des outils d’aide à la décision clinique.
Objectif
L’objectif du stage est de développer et d’évaluer des modèles d’intelligence artificielle permettant de mieux prédire la récupération fonctionnelle des patients traumatisés crâniens à partir des données sur les parcours de soins des bases médico-administratives disponibles (antécédents du patient, gravité de l’accident, parcours de soins hospitaliers, …).
Missions
Ce travail est réalisé en lien étroit avec Léa MEYER (en 3ème année de thèse de sciences sur le sujet), et sous la supervision du Pr Eleonore BAYEN (qui a déjà travaillé sur une autre base de données similaire, Medicare) et qui est formée en machine learning (apprentissage supervisé et non supervisé).
Le travail inclut :
- Prendre en main les bases de données médico-administratives (nettoyage, gestion des valeurs manquantes, préparation des variables prédictives et de sortie).
- Clusterisation des patients par patterns de soins (K-means, hierarchisating clustering, …)
- Mettre en œuvre différents modèles de prédiction (régressions, random forests, etc.).
- Comparer les performances des modèles selon des critères adaptés (AUC, calibration, sensibilité/spécificité, etc.).
- Interpréter les modèles (méthodes SHAP, LIME, feature importance) afin d’identifier les facteurs les plus influents.
- Développer un pipeline reproductible et documenté pour l’analyse et la prédiction.
Compétences
- Expérience en développement informatique (Python, R, …).
- Bonnes connaissances en apprentissage automatique (machine learning) et si possible en deep learning.
- Connaissances en statistiques appliquées et en méthodes d’évaluation de modèles prédictifs.
Rémunération
Gratifications de stage (selon la réglementation en vigueur) + remboursement partiel du titre de transport mensuel.
Contact
Les encadrants du stage seront Léa Meyer (étudiante en thèse en neurosciences, lea.meyer[at]aphp.fr) et Pr Eleonore Bayen (PU-PH en Médecine Physique et de Réadaptation, eleonore.bayen[at]aphp.fr).