COMPRESSION DES IMAGES :

Nouveaux besoins, nouvelles technologies


par Jacques WEISS

Professeur à SUPELEC, Campus de Rennes


L’utilisation de données multimédia ne cesse de croître, que ce soit en environnement informatique, internet ou télévisuel, et atteint de nouveaux marchés, telle que la téléphonie portable ; associée à cette croissance, il y a une demande de plus en plus forte en souplesse de manipulation des données afin d’offrir un meilleur service à l’utilisateur ; ainsi une image ne peut plus être considérée comme un simple objet (plan de pixels ou bitmap), mais elle doit pouvoir être adaptée à l’environnement d’utilisation (choix de la résolution, débit limité, …). Pour répondre à ces nouveaux besoins, il faut définir des nouvelles technologies de codage des images.

Les données multimédia (graphiques, audio et vidéo) non compressées réclament une capacité de stockage et une bande passante considérables. En dépit des progrès réalisés en capacité de stockage, en puissance de traitement des processeurs et en performance des systèmes de communications numériques, la demande en capacité de stockage et en bande passante de transmission reste toujours supérieure au potentiel des technologies disponibles. La demande récente en applications web utilisant de manière intensive des données multimédia a généré un besoin d’algorithmes de compression des signaux et des images plus performants et plus souples d’utilisation. Une application émergeante est l’utilisation de données multimédia avec la téléphonie portable, qu’elle soit de 2ème génération (GSM) avec le protocole WAP ou de 3ème génération (UMTS).

Un peu d’histoire

Une époque marquante pour le monde de l’image numérique a été le début des années 1990 qui a vu apparaître les premiers standards internationaux (ISO et IEC) concernant la compression des données audiovisuelles ; ces standards, JPEG et MPEG, ont rapidement réussi à s’imposer dans les domaines informatiques et télévisuels, ce qui a permis l’échange et la diffusion des images.

Pour les images fixes, le groupe JPEG a établi une norme internationale avec la contrainte de définir un format d’échange standard utilisable avec les technologies de l’époque ; les performances de l’algorithme mis en jeu , basé sur la transformée en cosinus discrète (DCT), si elles sont jugées correctes pour des taux de compression faibles à moyens, se révèlent médiocres pour des forts taux de compression.

Pour les séquences d’images (télévision), le groupe MPEG a défini une "boîte à outils" proposant un standard de compression pour les systèmes de télévision numérique ; les algorithmes mis en jeu pour la compression des images sont semblables à ceux de JPEG car cela permettait la réalisation de décodeurs à coût raisonnable, pour le marché grand public.

étudiés depuis une dizaine d’années, les algorithmes de compression exploitant la transformée par ondelettes se révèlent plus performants et plus souples d’exploitation que la DCT, c’est ainsi qu’ils sont intégrés dans la norme MPEG-4 et qu’ils vont apparaître dans la norme JPEG2000, futur standard de compression des images fixes.

L’état actuel des développements concernant le codage vectoriel, telle que l’utilisation de fractales, ne permet pas encore d’envisager des réalisations pratiques d’outils de compression des images ; les techniques utilisées semblent prometteuses mais leur mise en œuvre nécessite de gros moyens de calculs.

Comment compresser les images ?

Pour comprimer des images, il faut éliminer les redondances présentes dans le signal, celles-ci sont de 3 types :

La compression des images peut être effectuée avec ou sans perte d’information, seul le codage avec perte d’information sera présenté ici ; à partir du moment où l’on accepte de perdre des informations, il faut définir un niveau de qualité des images obtenues, le jugement étant effectué par le système visuel humain. Ce point introduit la notion de subjectivité de l’appréciation de la qualité, la validité du niveau obtenu dépendant de l’attente de l’observateur (l’observation d’une image d’un téléphone portable ne se fait pas avec les mêmes critères de jugement que celle d’un écran de télévision haute définition).

Quels sont le moyens de comprimer ?

Le traitement des images brutes (c’est à dire dans le domaine visuel) ne permet pas d’obtenir des résultats satisfaisants car on ne peut pas exploiter les redondances présentes dans l’image. Il faut donc réorganiser l’information contenue dans les images de manière à pouvoir éliminer les redondances présentées précédemment ; on parle alors de transformation des images par des fonctions mathématiques bidimensionnelles. Il est alors possible d’appliquer aux données ainsi organisées une quantification, opération visant à réduire le volume d’information par suppression d’éléments jugés non essentiels. Le traitement suivant consiste à compacter les données traitées en exploitant les redondances présentes, par codage entropique (sans pertes).

Le schéma de codage est alors composé de 3 entités :

La transformation des images repose sur le fait que, statistiquement parlant, il y a plus d’énergie dans les basses fréquences que dans les hautes fréquences, ainsi il s’avère intéressant de représenter l’image dans son domaine spectral ; pour réaliser cette opération, il serait possible d’utiliser la FFT (transformée de Fourier) mais sa mise en œuvre est lourde et l’exploitation des résultats est complexe ; parmi les algorithmes de transformation utilisés pour la compression d’images, on trouve principalement 2 approches, la DCT et les ondelettes.

Transformée en DCT

La transformée en DCT présente des ressemblances avec la transformée de Fourier mais sa mise en œuvre est plus simple et les données transformées peuvent être facilement compressées ; l’inconvénient majeur de la DCT provient de la décomposition de l’image en blocs de 8*8 pixels, la structure de ceux-ci devenant visible à très fort taux de compression.

Transformée par ondelettes

La transformée par ondelettes correspond à une an alyse multirésolution de l’image, utilisée sur plusieurs couc hes ; à chaque couche, les dimensions géométriques de l’image sont réduites dans un rapport 2 par un ensemble de filtres orthogonaux (dont les caractéristiques sont déterminées par la famille d’ondelettes utilisée), le résultat consiste alors en 4 petites images, l’une représentant la réduction de l’image source (on parlera d’image "smooth") et les 3 autres contenant les informations de hautes fréquences spatiales perdues lors de la réduction (on parlera d’images "detail") ; le passage d’une couche à une autre se fait en prenant l’image réduite (smooth), il y a alors 4 fois moins de points à traiter.

Analyse multirésolution de l’image sur 3 couches

Le traitement est effectué suivant chaque axe de l’image par filtrages successifs suivis d’une décimation (on ne garde qu’un point sur deux).

Traitement de 2 couches d’ondelettes

L’intérêt du traitement réside dans les caractéristiques des images "detail" qui permettent d’employer des algorithmes de quantification performants. L’analyse des ces images montre qu’elles sont constituées d’une grande quantité de points de faible valeur qui, une fois forcés à zéro par quantification, permettront un fort taux de compression. L’image "smooth" quant à elle ne subit aucune altération (il n’y a pas de quantification), il faudra donc limiter sa taille pour réduire le volume de données ; 5 couches de traitement donnent une image "smooth" 512 fois plus petite que l’image originale.

La quantification peut être scalaire, comme dans le système de compression des archives d’empreintes digitales du FBI ; dans ce cas, on ne profite pas des similitudes entre les couches (un motif se retrouve souvent d’une couche à une autre) ; ce type de quantification présente l’intérêt d’être très simple à mettre en œuvre.

Une approche plus performante est la quantification vectorielle qui tire profit des similitudes entre les couches (d’où la notion de vecteur) pour offrir de meilleures performances ; il existe plusieurs approches de réalisation, comme l’arbre de zéro ou le codage en treillis. Outre les bonnes performances obtenues en terme de taux de compression, ce sont des approches qui offrent de nouvelles possibilités d’exploitation des images compressées :

Ces notions de progressivité et d’accès sélectif sont particulièrement intéressantes pour la transmission des images sur des supports à bande passante limitée, tels que le web ou la téléphonie portable ; elles facilitent également la constitution de banques d’images, celles ci étant stockées à forte résolution et diffusées en tenant compte des conditions d’utilisation (par exemple, consulter une carte routière sur l’écran d’un téléphone portable).

Codage vectoriel

Le codage vectoriel, consistant à recréer les objets composant l’image à partir de fonctions mathématiques (fractales) ou de dictionnaires permet, dans le principe, d’obtenir des taux de compression très élevés et il autorise une grande souplesse de manipulation de l’image ; hélas, la complexité du codage reste encore rédhibitoire pour des applications courantes.

Quel avenir pour les algorithmes de compression d’images ?

Le présent article a présenté les avantages de l’utilisation des ondelettes pour la compression des images, mais cette approche ne présente cependant pas que des avantages ; aussi, la transformée en DCT n’est pas à mettre au rebut, elle conserve certains atouts à prendre en compte ; ainsi, une zone dite de texture (cheveux, par exemple) sera mieux traitée par la DCT, à contrario une zone type "bande dessinée" sera mieux codée par les ondelettes.

Ces considérations sont déjà prises en compte par les derniers standards (MPEG-4 et JPEG2000) qui décomposent les images en objets (personnage, arrière plan, mobilier, …) pour les traiter en fonction de leurs caractéristiques graphiques et spectrales avec la DCT ou les ondelettes.

Cette tendance vers les systèmes de compression composites (objets codés en DCT ou en ondelettes) devrait s’étendre à terme vers la compression par codage vectoriel (fractales).


Sites à visiter :
  • Electronique Rennes
  • Formation Continue en Electronique Rennes
  • Session de formation continue sur les Ondelettes
  • Session de formation continue sur MPEG
  • extérieurs (ondelettes) :