CONTACTS MENTIONS LÉGALES Zone privée
PERSEE
Appel à projets ANR - Programme BLANC édition 2009

Schémas perceptuels & codage vidéo 2D et 3D

Contexte :

Notre ère numérique a vu le déploiement à grande échelle des normes de codage vidéo, ainsi que l'émergence des nouveaux formats haute définition permettant l'immersion du spectateur, avec des affichages panoramiques, interactifs ou la 3DTV (vidéo omni-directionnelle, celle stéréoscopique ou la multi-vue).

Cependant nous remarquons que la dernière norme H.264/AVC suit un schéma très classique pour le codage vidéo, qui n’a pas été conçu pour ces nouveaux formats et services.

Un bond en avant pour une meilleure qualité subjective est alors nécessaire, afin que ces formats offrent une vraie expérience immersive pour le spectateur. Dans ce contexte le projet vise, à faire avancer les connaissances en modélisation de la perception, pour le traitement et le codage de la vidéo, et pour la vision par ordinateur. Le projet vise aussi à mettre au point une représentation de l'information-vidéo qui soit basée sur le contenu perçue, qui puisse donc servir de paradigme pour un codage basé qualité perceptuelle des contenus 2D et 3D.

Objectifs :

Les efforts de recherche actuels sont consacrés à la compression de séquences multi-vues, par exemple l' ISO/MPEG a défini le format MVC (« Multi-View Coding ») qui vise à exploiter les redondances entre les vues. En plus de gains de codage insuffisants, MVC souffre de limitations fonctionnelles lorsque qu'il s'agit de rendre avec qualité (coté récepteur) des points de vue virtuels. Il faut ici souligner que le rendu de la qualité visuelle est un problème plus crucial en vidéo 3D qu'en vidéo classique 2D. Notre objectif d'une représentation perceptuelle adaptée au 2D et à la 3D, et son exploitation pour piloter le codage, s'appuiera sur différents modèles prometteurs et sur des techniques émergentes, mais qui nécessitent encore des recherches plus approfondies.

Pour aller vers ce codage de la prochaine génération, nous nous proposons de travailler pour déterminer une représentation basée contenu perceptuel, déterminant et améliorant le codage. Une combinaison riche de modèles perceptuels, d'analyse/synthèse de textures, de codage par ondelettes géométriques, et d'optimisation débit/qualité-perceptuelle, sera mise en oeuvre. Un des premiers objectifs scientifiques du projet est donc de définir une représentation des contenus visuels 2D et 3D, dans le but de mieux prendre en compte les modèles perceptuels et la qualité visuelle, plutôt que d'utiliser par exemple l'omniprésente erreur quadratique moyenne pour mesurer la distorsion. Le cadre obtenu servira de base pour un système de codage perceptuel des contenus visuels 2D et 3D (multi-vues plus profondeur).

Programme :

Le projet implique une étroite collaboration entre 4 partenaires académiques complémentaires ayant chacun une expertise reconnue dans le domaine :

  • l' IRCCyN-Nantes, équipe Image et Vidéo-Communication (modélisation perceptuelle)
  • l' INRIA-Rennes, équipe TEMICS (analyse des textures spatio-temporelles)
  • l' IETR-Rennes, équipe IMAGE (représentation et compression des contenus 3D)
  • et le LTCI-TelecomParisTech, groupe Multimédia (représentation et compression des contenu 2D)
Le projet est structuré en 7 tâches principales :
  • 1. Coordination
  • 2. Modélisation perceptuelle 2D et 3D pour le codage vidéo
  • 3. Analyse/synthèse spatio-temporelle de textures
  • 4. Représentation et compression de contenus 2D
  • 5. Représentation et compression de contenus 3D
  • 6. Intégration dans une plate-forme logicielle commune
  • 7. Tests subjectifs et évaluation de la qualité perceptuelle

Exploitation :

Les résultats scientifiques seront diffusés au fur et à mesure qu'ils seront disponibles. L'objectif sera également de les exploiter via de futures collaborations avec nos autres partenaires de "pôles de compétitivité".

Le schéma de codage intégrant les outils les plus prometteurs, est destiné à servir de base pour la démonstration de technologies candidates à la normalisation internationale (par exemple, pour répondre à l'appel relatif à la norme ISO/UIT annonçant le prochain standard de codage vidéo H.265).

Référence :

ANR-09-BLAN-0170