Fouille de texte et extraction d'informations dans les données cliniques

Version imprimable

Fouille de texte et extraction d'informations dans les données cliniques
(Text mining and information extraction in clinical data)

Dalloux, Clément - (2020-12-07) / Universite de Rennes 1 - Fouille de texte et extraction d'informations dans les données cliniques

Langue : Français
Directeur de thèse: Claveau, Vincent
Laboratoire : IRISA
Ecole Doctorale : MATHSTIC

Thématique : Informatique

Accès à la ressource :

https://ged.univ-rennes1.fr/nuxeo/site/esupversion...

Mots-clés : TALN, étiquetage de séquence, négation, incertitude, classification multi-étiquette, textes cliniques, Exploration de données

Résumé : Avec la mise en place d'entrepôts de données cliniques, de plus en plus de données de santé sont disponibles pour la recherche. Si une partie importante de ces données existe sous forme structurée, une grande partie des informations contenues dans les dossiers patients informatisés est disponible sous la forme de texte libre qui peut être exploité pour de nombreuses tâches. Dans ce manuscrit, deux tâches sont explorées~: la classification multi-étiquette de textes cliniques et la détection de la négation et de l'incertitude. La première est étudiée en coopération avec le centre hospitalier universitaire de Rennes, propriétaire des textes cliniques que nous exploitons, tandis que, pour la seconde, nous exploitons des textes biomédicaux librement accessibles que nous annotons et diffusons gratuitement. Afin de résoudre ces tâches, nous proposons différentes approches reposant principalement sur des algorithmes d'apprentissage profond, utilisés en situations d'apprentissage supervisé et non-supervisé.

Résumé (anglais) : With the introduction of clinical data warehouses, more and more health data are available for research purposes. While a significant part of these data exist in structured form, much of the information contained in electronic health records is available in free text form that can be used for many tasks. In this manuscript, two tasks are explored: the multi-label classification of clinical texts and the detection of negation and uncertainty. The first is studied in cooperation with the Rennes University Hospital, owner of the clinical texts that we use, while, for the second, we use publicly available biomedical texts that we annotate and release free of charge. In order to solve these tasks, we propose several approaches based mainly on deep learning algorithms, used in supervised and unsupervised learning situations.

Identifiant : rennes1-ori-wf-1-14421

Exporter au format XML