Version imprimable
Indexation d'images 2D. Vers une reconnaissance d'objets multi-critères 

Auteur(s) : ZLATOFF, Nicolas
Contributeurs : BASKURT, Atilla

Éditeur(s) : INSA de Lyon
Date de publication : 11-01-2007

Accès à la ressource : http://docinsa.insa-lyon.fr/these/pont.php?id=zlat...

Description : D'importants volumes d'images numériques, conduisent aujourd'hui à une forte demande d'outils permettant d'indexer puis de rechercher une image. Indexer une image consiste à en extraire une signature. Rechercher une image dans une base consiste alors à comparer plusieurs signatures entre elles. Une indexation est dite basée sur le contenu lorsqu'elle utilise les données de bas niveau (couleur, texture) de l'image pour construire la signature. De tels système sont faces à une limitation fondamentale : ils permettent aux utilisateurs de rechercher des images d'après leurs caractéristiques de bas niveaux (matière) alors ces derniers préfèreraient une recherche plus sémantique, relative à ce que l'image décrit (les objets présents, par exemple). Ainsi, l'indexation basée sur le contenu se doit de trouver des outils pour réduire le fossé entre les données de bas niveau et la sémantique. Même si un tel lien n'existe pas forcément, l'utilisation de données structurelles peut permettre une première avancée. En outre, les systèmes d'indexation doivent proposer des interfaces capables d'aider l'utilisateur à formuler des requêtes correspondant à ce qu'il recherche. Le paradigme classique consiste à fournir au système une image exemple. Néanmoins, cette approche reste limitée car il est difficile de pouvoir généraliser à partir de l'exemple ce que cherche réellement l'utilisateur. Dans cette thèse, nous proposons un système d'indexation qui permet de réduire le fossé entre les données de bas niveau et la sémantique. Tout d'abord, l'utilisateur formule, lors de la requête, un modèle (prototype) de l'objet recherché. Lors de la comparaison, entre ce modèle et les images de la base, plusieurs critères sont utilisés, comme la forme mais aussi l'organisation spatiale de différentes zones d'intérêt. Une étape cruciale consiste justement à extraire de telles zones d'intérêt. Les approches de segmentation sont souvent entachées d'erreur, notamment à cause de variation d'éclairage dans la scène. Nous proposons donc de ne pas décrire une image par une segmentation unique mais plutôt par une hiérarchie de segmentations. Celle-ci représente l'image à différents niveaux de détails et se construit à partir de regroupements successifs de régions (groupements perceptuels), basés à la fois sur des critères de bas niveaux mais aussi géométriques. Durant la comparaison entre un modèle et une image, nous considérons les correspondances entre chacune des parties au lieu d'utiliser seulement le modèle dans sa globalité. Plus précisément, la correspondance prend en compte les formes des parties, à travers les descripteurs ART (Angular Radial Transform) et CSS (Curvature Scale Space). En outre, l'organisation spatiale des parties entre elles est également prise en compte. Toutes ces caractéristiques sont combinées entre elles, par la théorie de l'évidence de Shafer afin d'en déduire une mesure unique de similarité.

Langue : Français

Exporter au format XML