Développement par méthodes d'apprentissage profond d'un logiciel d'aide à la détection des lésions suspectes de cancer en IRM de prostate (Deep learning-based algorithm for prostate cancer detection on multi-vendor MRI scans, with focus on how annotator variability affects algorithm performance) | ||
Erhart, Nora - (2022-10-11) / Universite de Rennes 1 - Développement par méthodes d'apprentissage profond d'un logiciel d'aide à la détection des lésions suspectes de cancer en IRM de prostate Langue : Anglais Directeur de thèse: Beuzit, Luc Thématique : Médecine et santé | ||
Mots-clés : Cancer de la Prostate, Apprentissage profond, Imagerie par Résonnance Magnétique, Détection, Segmentation, Prostate--Cancer, Apprentissage profond, Imagerie par résonance magnétique, Traitement d'images--Techniques numériques Résumé : Objectifs : Développer un algorithme d'apprentissage profond pour détecter et segmenter les lésions à risque de cancer sur des IRM biparamétriques de prostate provenant de différents fabricants et avec différents champs magnétiques et évaluer l'impact de la variabilité des annotateurs sur la performance de l'algorithme. Méthodes : Une cohorte consécutive (n=1802) a été sélectionnée dans une base de données prospective de patients ayant réalisé une IRM de prostate pour une suspicion clinique ou biologique de cancer de la prostate, un bilan d'extension ou une surveillance active du cancer. Les IRM ont été divisées de manière aléatoire en base de données d'entraînement (n=1628) et de test (n=174). L’interprétation PI-RADS v2.1 a été effectuée par des radiologues expérimentés. L'algorithme a été conçu et entraîné sur la base de données d'entraînement pour détecter les lésions à risque de cancer à partir des IRM biparamétriques. Pour incorporer des connaissances anatomiques préalables dans le modèle de détection, un premier modèle de segmentation zonale sur les séquences T2W a été créé. La performance de l'algorithme a été évaluée sur la base de données de test en utilisant les courbes ROC (receiver operating characteristics) et FROC (free-response ROC). Nous avons également évalué la congruence spatiale des lésions entre l'algorithme et les annotateurs. Enfin, la variabilité inter-opérateur a été analysée à la fois dans l'évaluation PI-RADS globale et dans la localisation et la segmentation des lésions. Résultats : Nous avons obtenu pour l’algorithme de détection une AUC de 0,87 (IC 95 % : 0,79-0,91) pour les lésions PI-RADS ≥ 4, une AUC de 0,87 (IC 95 % : 0,79-0,90) pour les lésions PI-RADS ≥ 3 et une AUC de 0,88 (IC 95 % : 0,83-0,92) pour les lésions uniquement consensuelles PI-RADS ≥ 4. L'analyse de la congruence spatiale était assez similaire à la variabilité inter-annotateur avec une erreur absolue de la mesure axiale maximale entre notre algorithme et deux lecteurs de respectivement 2,8mm et 3,7mm contre 2,1mm pour la variabilité inter-annotateur. Conclusions : Notre algorithme d'apprentissage profond obtient des performances similaires à celles de la littérature, même si les données proviennent d’examens à champs magnétiques différents et de fabricants différents. Résumé (anglais) : Objectives : To develop a deep-learning algorithm to detect and segment cancer-risk lesions on biparametric prostate MRI from different manufacturers and with different magnetic fields and evaluate the impact of annotator variability on algorithm performance. Methods : A consecutive cohort (n=1802) was selected from a prospective database of patients undergoing multiparametric prostate MRI for clinical or biological suspicion of prostate cancer, extension assessment or active surveillance of cancer. MRI scans were randomly divided into training (n=1628) and test (n=174) datasets. PI-RADS v2.1 assessment was reported by experienced radiologists. The deep-learning (DL) algorithm was designed and trained on the training set to predict cancer-risk lesions from biparametric MRI. To incorporate prior knowledge into the detection model, a first zonal segmentation model on the T2W sequences was created. The performance of the DL algorithm was assessed on the test set using receiver operating characteristics (ROC) analysis and free-response ROC. We also evaluated lesion spatial congruence variability between DL framework and annotators. Finally, inter-operator variability was analyzed both in the global PI-RADS assessment and in the location and segmentation of the lesions. Results : The lesion detection algorithm achieved an AUC of 0.87 (95% CI: 0.79-0.91) for PI-RADS ≥ 4 lesions, an AUC of 0.87 (95% CI:0.79-0.90) for PI-RADS ≥ 3 lesions and an AUC of 0.88 (95% CI: 0.83-0.92) for only consensual PI-RADS ≥ 4 lesions. The spatial congruence analysis was quite similar to the inter-annotator variability with an absolute error of maximum axial measurement between our algorithm and two readers of respectively 2.8mm and 3.7mm versus 2.1mm for the inter-annotator variability. Conclusions : Our deep learning algorithm achieves similar performances to the literature, even though the data came from different magnetic fields and different MRI manufacturers. Identifiant : rennes1-ori-wf-1-17121 |
Exporter au format XML |