Proposition de thèse Cifre : anonymisation et contrôle qualité des images médicales par intelligence artificielle

Télécharger le sujet de thèse


L’imagerie médicale a pris un essor inédit ces dernières années tant elle offre une investigation non invasive de plusieurs organes à des fins de diagnostic, de suivi voire de pronostic. Elle se positionne comme un outil central dans de nombreuses études d’envergure impliquant plusieurs centres d’inclusion. Ces études multicentriques génèrent cependant des jeux de données hétérogènes car : a) les images proviennent de différents constructeurs, b) elles sont acquises avec des réglages parfois variables, c) elles proviennent de centres avec différents degrés d’expertise et d) elles sont acquises sur des patients plus ou moins difficiles à scanner (mouvements liés à une pathologie, impossibilité de tenir une apnée, …). Cette grande variabilité impose une bonne standardisation de l’acquisition mais également du traitement de données afin de fournir des biomarqueurs de qualité aux centres d’investigation clinique. Cette analyse inclut l’étape d’extraction de biomarqueurs de diagnostic ou de pronostic mais également des étapes préliminaires qui sont néanmoins d’une importance majeure : a) la pseudonymisation des images afin de pouvoir les transférer vers le centre d’analyse en accord avec la législation en vigueur et b) le contrôle qualité des images qui doit accompagner les biomarqueurs quantitatifs afin de garantir leur pertinence.

Objectifs

Dans ce contexte, l’objectif de cette thèse est de proposer un pipeline d’analyse d’images d’IRM cérébrales basé sur l’apprentissage machine et qui comprend :

  1. Une étape d’anonymisation des métadonnées DICOM et des tags affichés sur les images
  2. Une étape de contrôle qualité (QC) qui sera effectuée en préambule des analyses quantitatives et des lectures radiologiques expertes pour permettre un pré-tri et un gain de temps pour les cliniciens

Tâches du candidat

  • Désidentification d’images d’IRM neurovasculaires au travers des deux tâches suivantes :
  1. Désidentification rigoureuse des métadonnées DICOM (identifiants patients, médecin référent, centre d’inclusion, …)
  2. Masquage des informations patient superposées sur les images grâce à un algorithme de deep learning. En effet, certaines images échocardiographiques, IRM ou scanner possèdent des informations du patient affichées en haut à droite ou à gauche de l’image. Ces informations devraient être masquées en prenant le soin d’épargner les informations anatomiques pertinentes. Des techniques comme la reconnaissance optique de caractères (OCR), l’alpha-matting ou la génération d’images par réseau antagoniste ou de diffusion seront explorées dans cette partie
  • Proposer des algorithmes de deep learning pour l’aide au contrôle de la qualité des acquisitions en tenant compte : de l’exhaustivité de l’examen acquis, du ratio signal à bruit, de la quantité de tissu et ou vaisseaux en bordure de l’image, de l’intensité au centre et en bordure des structures anatomiques présentes sur l’image, l’asymétrie de la structure imagée

Compétences requises

  • Niveau Master Recherche
  • Expérience en IA appliquée à l’imagerie
  • Développements sous python, C, C++
  • Capacité de travailler dans une équipe pluridisciplinaire
  • Autonomie de travail
  • Maîtrise du français et de l’anglais

Environnement de travail

Le Doctorant sera dans l’entreprise ClinSearch où les données cliniques sont archivées, 4 jours par semaine, et au Laboratoire d’imagerie biomédicale à Sorbonne Université un jour par semaine. Il peut ainsi interagir avec ses collègues spécialisés dans le traitement d’images et IA au laboratoire et dans le service et la gestion des données multicentriques dans l’entreprise.

ClinSearch est une société sise en région parisienne, à Malakoff, qui emploie actuellement approximativement 52 salariés (en équivalent temps plein), pratiquement tous diplômés de l’enseignement supérieur, au niveau Docteur, Master et Ingénieur, dans des disciplines scientifiques tels que médecine, pharmacie, biologie et informatique. La société est spécialisée dans le Conseil en R&D ainsi que dans la prestation de services pour la gestion tant des essais cliniques de médicaments ou de dispositifs médicaux que des études épidémiologiques cliniques ou populationnelles. Depuis 25 ans, la société a développé une réelle expertise dans les traitements des données à mettre en œuvre aux fins de la réalisation de ces études. La nature des études dans lesquelles ClinSearch est impliquée, est hétérogène. Aussi sommes-nous régulièrement engagés dans des essais dits précoces, de type « proof of concept » ou « First in Human », ainsi que dans des études de fin de cycle de développement qui peuvent mettre en jeu de gros volumes de données, comme c’est souvent le cas lorsque nous exploitons les données du SNDS via le HDH.

En raison du contexte dans lequel nous évoluons, qui met la donnée au centre de nos préoccupations, ClinSearch a développé ses propres outils pour collecter, structurer, analyser et valoriser les données produites au cours des études.

Au surplus, il convient de préciser que l’activité de ClinSearch ne se limite pas à agir pour le compte de tiers. La plupart des salariés de l’entreprise qui sont titulaires d’un doctorat ou qui disposent d’un titre d’ingénieur participe à des travaux de recherche, propres à l’entreprise, à hauteur de 20 à 50 % de leur temps. Parmi les axes de recherche, ceux en lien avec le développement d’applications sont privilégiés. En particulier, le projet de recherche dit « Désidentification et Contrôle Qualité de l’image », qui justifie aujourd’hui l’offre que nous proposons de réaliser une Thèse de doctorat, entrant dans le champ du dispositif CIFRE, s’inscrit dans un projet de recherche initié, il y a à peu près 3 ans, à partir du constat que nous avions fait d’une absence de solution satisfaisante pour garantir, comme le règlement sur la protection des données et de la vie privée l’exige, la non-identification, lors du téléchargement et du stockage des images, des personnes qui acceptent de se prêter aux expérimentations cliniques ou de participer à tout type d’études nécessitant le recours aux données personnelles dont la plupart sont critiques comme peuvent l’être les données médicales. En définitive, ClinSearch peut se définir comme une société de recherche sous contrat qui se libère de temps à autres de la tutelle de ses donneurs d’ordre pour lancer ses propres projets de recherche, motivés par les problématiques rencontrées dans son cœur de métier.

Le Laboratoire d’Imagerie Biomédicale (LIB) est spécialisé dans la recherche fondamentale et appliquée de méthodes d’imagerie biomédicale morphologique, fonctionnelle et moléculaire sur le petit animal et l’homme. Les thématiques de recherche sont ciblées sur les principales priorités de santé publique du XXIe siècle : os, cancer, maladies cardiovasculaires et neurologiques. Nous travaillons sur de nouvelles méthodologies de diagnostic et de traitement dans notre domaine principal d’investigation autour des modalités microscopiques en lumière blanche, ultrasonores, IRM, CT et SPECT-PET. Le LIB est organisé en six équipes :

  1. Ultrasons et imagerie pour la caractérisation de la qualité osseuse (BQ)
  2. Développement d’imagerie et de thérapie ciblée pour le cancer et l’inflammation (IT2D)
  3. Imagerie Cardiovasculaire (iCV)
  4. Connectivité neurale et plasticité (NCP)
  5. Physiologie et pathologie de la microcirculation (PPM)
  6. Ondes mécaniques 3D pour l’imagerie cardiovasculaire (OM3D), ATIP-Avenir

Le LIB et est intégré dans un environnement lui assurant : une expertise dans la modélisation, l’instrumentation, le traitement et l’analyse du signal et de l’image, un accès local aisé à des installations et des plateformes d’imagerie (scanners de lames, US, IRM, CT et SPECT-PET), une équipe multidisciplinaire permanente de chercheurs et de techniciens, des collaborations étroites avec des biologistes et des cliniciens permettant la recherche translationnelle de l’animal à l’homme, des équipes de recherche clinique, de nombreuses collaborations nationales et internationales et un engagement fort pour le transfert technologique.
La thèse se déroulera dans l’équipe iCV du LIB.

Contacts

jerome.seymour[at]clinsearch.net
thibault.bogniaho[at]clinsearch.net
nadjia.kachenoura[at]inserm.fr
thomas.dietenbeck[at]sorbonne-universite.fr