Soutenance HDR de Mme Marie LUONG
Date : 10 Février 2025
Localisation : Site Villetaneuse, Université Sorbonne Paris Nord
Sujet de la soutenance : « Amélioration de la Qualité d’Image et Classification : Modèles et Applications » (Image quality enhancement and classification : Models and Applications)
Jury :
- M. Mouloud ADEL, Professeur à l’Université d’Aix-Marseille, Rapporteur
- M. Azeddine BEGHDADI, Professeur à l’Université Sorbonne Paris Nord, Garant
- M. Frédéric DUFAUX, Directeur de recherche CNRS, L2S Paris-Saclay, Président du Jury
- Mme Hoai An LE THI, Professeure à l’Université de Lorraine, et Institut Universitaire France, Examinatrice
- M. Amine NAIT-ALI, Professeur à l’Université Paris-Est Créteil (UPEC), Rapporteur
- Mme Su RUAN, Professeure à l’Université de Rouen Normandie, Rapporteure
- M. Hatem ZAAG, Directeur de Recherche au CNRS, LAGA USPN, Examinateur
- M. Habib ZAIDI, Professeur à Geneva University Hospital, Examinateur
Résumé de la HDR :
Mon dossier d’HDR présente une synthèse de mes activités de recherche depuis ma reconversion en 2004 dans le domaine du traitement et de l’analyse d’images, en mettant en lumière deux axes majeurs : les méthodes d’amélioration de la qualité d’image, inspirées par des mécanismes du Système Visuel Humain, et la classification d’images. Ce travail analyse les défis spécifiques à ces domaines et met en avant le rôle central des techniques d’optimisation et des approches d’apprentissage automatique. Les méthodes d’amélioration de la qualité d’image poursuivent un double objectif : d’une part, elles rehaussent la qualité visuelle des données d’image et, d’autre part, elles mettent en exergue des caractéristiques essentielles, permettant une exécution plus performante et plus précise de tâches avancées de vision, telles que la classification et la reconnaissance d’objets.
Dans le cadre de mes travaux sur l’amélioration de la qualité des images, je me suis focalisée sur les artefacts de codage, tels que les effets de bloc et de bruits de contour, résultant de la compression avec perte des images et des vidéos, ainsi que sur le bruit et la faible résolution des images. Une contribution majeure de cette recherche réside dans l’intégration des mécanismes du Système Visuel Humain (SVH) dans un problème de la restauration d’image, permettant la réduction simultanée des artefacts de codage tout en préservant les détails essentiels de l’image. Ce travail inclut le développement de quatre méthodes innovantes et la proposition d’une mesure de visibilité des blocs. Concernant la débruitage, le principal défi était de traiter les bruits complexes tout en tenant compte des caractéristiques spécifiques des images. Pour y parvenir, six méthodes innovantes ont été proposées, classées en deux approches principales : le filtrage anisotrope et l’apprentissage automatique. Concernant l’amélioration de la résolution spatiale, mes travaux ont porté sur les méthodes de super-résolution, bien connues pour leur capacité à augmenter la résolution des images. Toutefois, les méthodes existantes montrent souvent des limites importantes face à des images bruitées. Pour remédier à ce problème, nous avons conçu trois méthodes innovantes de super-résolution basées sur des exemples, spécifiquement élaborées pour traiter de manière optimale les images bruitées et non bruitées. Deux de ces approches intègrent de manière cohérente la super-résolution et le débruitage dans un cadre unifié d’optimisation sous contrainte de parcimonie, offrant ainsi des solutions à la fois robustes et performantes.
Pour aborder les complexités de la classification d’images, quatre méthodes ont été développées, s’appuyant sur la représentation parcimonieuse (ainsi que sur la représentation parcimonieuse intégrant des réseaux de neurones) dans des domaines transformés. Ces approches tirent parti de la parcimonie ainsi que des domaines d’ondelettes ou d’ondelettes quaternioniques pour accroître la parcimonie des caractéristiques, apprendre une représentation à la fois simple et compacte des images, renforcer leur pouvoir discriminant et améliorer la précision de la classification, notamment pour les ensembles de données complexes.
Enfin, j’ai mis en avant plusieurs applications pratiques de mes recherches, notamment des contributions significatives au cinéma numérique et au diagnostic médical assisté par l’image. Ces applications reflètent l’impact plus large de mes travaux, réalisés en collaboration avec sept thèses de doctorat co-encadrées et deux thèses en cours.
HDR Summary :
This HDR memoir presents a summary of my research activities since my reconversion to the field of image processing and analysis in 2004, with a primary focus on two key areas: image quality enhancement techniques inspired by human visual perception and image classification. It explores the challenges in these fields and emphasizes the crucial role of optimization techniques in advancing machine learning approaches. Image quality enhancement methods serve a dual purpose: they not only improve the visual quality of image data but also emphasize meaningful features, enabling more effective and accurate execution of advanced vision tasks such as classification and object recognition.
In my work on quality improvement, I focused on modeling and addressing specific artifacts, including coding artifacts (notably blocking and ringing effects) from lossy image and video compression, noise, and image resolution, as these factors significantly affect image quality. A major contribution lies in the integration of Human Visual System (HVS) mechanisms into a restoration-based framework, enabling the joint reduction of blocking and ringing effects while preserving critical image information. This work includes the development of four methods and a proposed Blockiness Visibility Measure (BM). For denoising, the primary challenge was to address complex noise while accounting for the specific characteristics of images. To tackle this, six innovative methods were proposed, classified into two main approaches: anisotropic filtering and machine learning. These methods were thoughtfully designed to effectively handle various noise types, utilizing both traditional techniques and advanced data-driven approaches. Regarding spatial resolution, I focused on improving the performance of super-resolution methods, which are well-known for enhancing image resolution. Existing methods often face significant challenges with noisy images, as their performance tends to deteriorate under such conditions. To address this limitation, we developed three innovative example-based super-resolution methods specifically designed to handle both noisy and noiseless images effectively. Two of these methods integrate super-resolution and denoising into a unified sparsity-constrained optimization framework, providing robust and efficient solutions to this challenge.
To address the complexities of image classification, four methods were proposed based on sparse representation, along with neural network-based sparse representation, in transform domains. These approaches take advantages of sparse representation and wavelet or quaternion wavelet domain in order to enhance the sparsity level of features and learn a simple and compact representation of the images, enhancing discrimination, and improving classification accuracy, particularly for challenging datasets.
Finally, I highlighted several practical applications of my research, including contributions to digital cinema and image-guided medical diagnosis. These applications reflect the broader impact of my work, which has been carried out in collaboration with seven co-supervised PhD projects and two ongoing ones.