Version imprimable |
Boolean algebra and random field theory applied to graph neural networks and natural language processing : application to argument mining in a low resource setting (Algèbre booléenne et théorie des champs aléatoires appliquées aux réseaux neuronaux graphiques et au traitement du langage naturel : application à l’extraction d’arguments dans un contexte à ressources limitées) | ||
Guilluy, Samuel - (2024-03-27) / Université de Rennes Boolean algebra and random field theory applied to graph neural networks and natural language processing : application to argument mining in a low resource setting Langue : Anglais Directeur de thèse: Mehats, Florian Laboratoire : IRMAR Ecole Doctorale : MATISSE Thématique : Mathématiques | ||
Mots-clés : Intelligence Artificielle, Algèbre Booléen, Traitement Automatique du Langage, Extraction d'arguents, Boole, Algèbre de, Champs aléatoires, Traitement automatique du langage naturel, Intelligence artificielle Résumé : Le sujet d'étude de cette thèse concerne l'analyse des arguments au sein des débats politiques. Nous avons utilisé des techniques d'intelligence artificielle pour identifier automatiquement les composants argumentaires au sein des débats politiques. Notre approche de ce sujet est pluridisciplinaire, englobant plusieurs domaines incluant : le traitement du langage naturel, l'extraction d'arguments, et l'analyse de graphes en utilisant les GNNs. Nous commençons par analyser les débats politiques des élections présidentielles françaises en construisant un corpus de débats français. Cela nous permet de mieux comprendre la complexité des tâches d'extraction d'arguments et les raisons pour lesquelles il est difficile de construire de très grands ensembles de données. Par la suite, nous nous sommes penchés sur les méthodes qui tirent parti des structures syntaxiques des phrases pour faciliter la formation de modèles d'IA sur de petits ensembles de données. Pour ce faire, nous avons exploré la théorie des graphes pour exploiter les arbres syntaxiques des phrases. Nous avons ensuite proposé une nouvelle méthode pour faciliter l'utilisation de divers jeu de données ayant des schéma d'annotation similaire lors de la formation d'un modèle pour l'identification des composants argumentaires. Enfin, nous avons développé une nouvelle approche basée sur l'algèbre de Boole pour construire une nouvelle architecture d'apprentissage machine mieux adaptée aux propriétés de dépendance des nœuds. Résumé (anglais) : The subject of study in this thesis pertains to the analysis of arguments within political debates. We have employed artificial intelligence techniques to automatically identify specific elements, which are presented later in the discourse. Our approach to this topic is multidisciplinary, encompassing a variety of fields including: natural language processing, argument mining, and graph analysis utilizing GNNs. We initially analyze political debates from the French presidential elections by constructing a corpus of French debates. This allows us to better understand the complexity of argument mining tasks and the reasons why it is difficult to construct very large datasets. Subsequently, we delved into methods that leverage the syntactic structures of sentences to facilitate the training of AI models on small datasets. To achieve this, we explored graph theory to exploit the syntactic trees of sentences. We then proposed a new method to facilitate the use of various argument mining datasets when training a model for identifying argumentative components. Finally, we developed a novel approach based on Boolean algebra to construct a new machine learning architecture based on the dependency properties of the nodes in the underlying graph. Identifiant : rennes1-ori-wf-1-19277 |
Exporter au format XML |