Apprentissage machine et réseaux de convolution pour une expertise augmentée en dosimétrie biologiques

Thèse en cours
La recherche
Recherche
Santé

02/05/2022

Laboratoire d'accueil : Laboratoire de radiobiologie des expositions accidentelles (LRAcc)

Date de début : octobre 2020

Nom du doctorant : Antonin DESCHEMPS

Descriptif du sujet

Suite à une irradiation, il est possible d’évaluer la dose reçue à partir du dénombrement d’aberrations chromosomiques dans des métaphases acquises par cytogénétique conventionnelle.

Cependant, le dénombrement des aberrations est pour le moment manuel (ou semi-automatisé), ce qui est très couteux en temps d’expertise. Dans un contexte d’une exposition accidentelle d’un grand nombre de personnes, il pourrait être difficile d’offrir une dosimétrie rapide et fiable pour toutes les victimes.

Cette thèse vise donc à valoriser les avancées récentes en vision par ordinateur et en apprentissage machine pour automatiser ce dénombrement. Nous nous appuierons sur les réseaux de neurones convolutionnels profonds qui ont démontrés leur potentiel pour localiser ou classifier des objets dans des images.

Au cours de cette thèse, nous utiliserons ces modèles, tout en tenant compte des spécificités de la base de données du LRAcc : cette dernière ne contient pas d’annotation spatiale, uniquement un nombred’aberration. Il faudra par conséquent investiguer des méthodes capables d’exploiter de grands volumes de données qui ne sont pas annotées. Cette situation relève typiquement du contexte de l’apprentissage

semi-supervisé.

Nous chercherons donc à classer chaque chromosome présent sur une image de métaphase en deux classes : monocentrique (sain) ou dicentrique (aberrant). Au cours de cette thèse, nous proposerons une démarche pour quantifier le niveau de confiance à accorder au modèle dans sa tâche de classification.

Durant la première partie de thèse, une étude de la littérature permettra de sélectionner des approches relevant de l’apprentissage profond pour résoudre le problème posé. Plus particulièrement, la littérature récente traitant de la question de l’apprentissage semi-super visé, permettra de valoriser la base de données du LR Acc (~100k images), par tiellement annotée. Nous évaluerons et comparerons leurs performance, jusqu’à aboutir à une classification satisfaisante pour l’automatisation de la procédure.

Dans la deuxième partie de la thèse, nous nous intéresserons à la caractérisation du niveau confiance des modèles de prédiction. Nous envisageons de fournir des indicateurs permettant aux utilisateurs de porter leur attention sur des situations requérant une expertise humaine.
Enfin, un dernier objectif visera à quantifier l’impact de l’incer titude de classification sur celle de l’estimation de la dose reçue.

Laboratoire IRSN impliqué :

Laboratoire de radiobiologie des expositions accidentelles (LRAcc)

Contact

Mohamed amine BENADJAOUD