Universite Paris 13
Universite Paris 13
Universite Paris 13
Universite Paris 13
Universite Paris 13
Universite Paris 13

Titre : Prédiction d’images dans le domaine transformé en ondelettes via les réseaux de neurones : application à la compression d’images stéréoscopiques.

Compétences requises :

- Niveau de formation : 3ème année ingénieur ou Master 2 recherche

  • Bonnes connaissances en apprentissage automatique, apprentissage profond (différentes architectures des réseaux de neurones)

  • Notions en traitement d'image/vidéo, compression/codage, ondelettes

  • Bon niveau en programmation (python, C++, matlab)

Lieu : Laboratoire d’Informatique Paris Nord (LIPN) / Laboratoire de Traitement et Transport de l’Information (L2TI), Université Paris 13.

Durée du stage : 5-6 mois (à partir de mars/avril 2019) (+ possibilité de poursuite en thèse)

Candidature : Jusqu’au 04/03/2019, envoyer un CV, une lettre de motivation, deux lettres de recommandation et relevés de notes M1/M2 ou Ecole d’ingénieur à :

  • Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.

  • Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.

Description du stage :

L’apprentissage automatique et/ou profond permet la prédiction de données variées avec une grande précision. Pour cette raison, ces outils ont été très utilisés récemment pour prédire une image à partir d’une ou plusieurs images. Par exemple, dans le contexte de super résolution [1], l’étape de prédiction d’image est utilisée pour générer une image haute résolution à partir d’image(s) basse résolution. Dans celui de la compression d’images stéréoscopiques (respectivement séquences vidéos) [2,3], les performances des codeurs dépendent fortement de la qualité de prédiction des images résiduelles obtenues en calculant l’erreur de prédiction entre une image de référence et une image cible compensée en disparité (respectivement mouvement).

L’objectif de ce stage est de dresser l’état de l’art des méthodes d’apprentissage pour la prédiction d’image. Ensuite, les méthodes les plus répandues sont testées et évaluées dans le contexte de la compression d’images stéréoscopiques. Bien que l’étape de prédiction est souvent réalisée dans le domaine spatial, une nouvelle méthode sera développée dans le domaine transformé en ondelettes, en s’inspirant de certains travaux récents [4,5]. Différentes méthodes d’optimisation seront étudiées pour améliorer la qualité des images prédites et réduire l’énergie des images résiduelles générées.

Références:

[1] T. Guo, H. S. Mousavi, T. H. Vu, V. Monga, « Deep Wavelet Prediction for Image Super-Resolution », IEEE Conference on Computer Vision and Pattern Recognition Workshops, 2017.

[2] M. Mathieu, C. Couprie, Y. LaCun, « Deep Multi-scale video prediction beyond mean square error », International Conference on Learning Representation, 2016.

[3] W. Lotter, G. Kreiman, D. Cox, « Deep predictive coding networks for video prediction and unsupervised learning », International Conference on Learning Representation, 2017.

[4] H. Huang, R. He, Z. Sun, T. Tan, « Wavelet-SRNet: A Wavelet-Based CNN for Multi-scale Face Super Resolution », IEEE International Conference on Computer Vision, 2017.

[5] F. Cotter, N. Kingsbury, « Deep Learning in the Wavelet Domain », Computer Vision and Pattern Recognition, 2018.

Contact & Access

L2TI , Institut Galilée, UP 13
99, avenue Jean-Baptiste Clément
F-93430 Villetaneuse
ico telephone  +33 1 49 40 28 59
ico fax  +33 1 49 40 40 61
ico email  secretariat-l2ti[at]univ-paris13.fr


Copyright (C) 2013 L2TI. All Rights Reserved.