Version imprimable

10b - …des conférences enfin disons des causeries… Détection automatique de segments en relation de paraphrase dans les reformulations de corpus oraux (taln2015)





Description : Sessions orales TALN 2015 – Mardi 23 juin 2015Session Plénière…des conférences enfin disons des causeries… Détection automatique de segments en relation de paraphrase dans les reformulations de corpus oraux Natalia Grabar et Iris Eshkol Résumé : Notre travail porte sur la détection automatique des segments en relation de reformulation paraphrastique dans les corpus oraux. L’approche proposée est une approche syntagmatique qui tient compte des marqueurs de reformulation paraphrastique et des spécificités de l’oral. Les données de référence sont consensuelles. Une méthode automatique fondée sur l’apprentissage avec les CRF est proposée afin de détecter les segments paraphrasés. Différents descripteurs sont exploités dans une fenêtre de taille variable. Les tests effectués montrent que les segments en relation de paraphrase sont assez difficiles à détecter, surtout avec leurs frontières correctes. Les meilleures moyennes atteignent 0,65 de F-mesure, 0,75 de précision et 0,63 de rappel. Nous avons plusieurs perspectives à ce travail pour améliorer la détection des segments en relation de paraphrase et pour étudier les données d’autres points de vue.


Mots-clés libres : traitement automatique du langage naturel, taln2015
Classification générale : Linguistique

Accès à la ressource : http://www.canal-u.tv/video/centre_d_enseignement_...
rtmpt://fms2.cerimes.fr:80/vod/centre_d_enseigneme...
http://www.canal-u.tv/video/centre_d_enseignement_...
Conditions d'utilisation : Droits réservés à l'éditeur et aux auteurs

DONNEES PEDAGOGIQUES

Type pédagogique : cours / présentation
Niveau : enseignement supérieur

DONNEES TECHNIQUES

Format : video/x-flv
Taille : 122.02 Mo
Durée d'exécution : 28 minutes 34 secondes

Exporter au format XML