- Ne confondons pas échantillonnage et marchandage ! (2) V2- Le numérique, comment ça marche ? (4)

,  par Hervé BERNARD dit RVB , 1 commentaire

La numérisation implique de transformer un signal analogique continu en un signal discontinu ou discret. C’est ce processus d’échantillonnage qui fait passer le signal de l’état continu à l’état discontinu. En effet, numériser implique d’appliquer une valeur numérique à chacun des échantillons prélevés sur le signal. Ce prélèvement ne peut être que discontinu. Pour un son, par exemple, il serait impossible de faire cette mesure tous les 1/1000e de seconde, non seulement, il faudrait des instruments de mesure capable de travailler à cette cadence, mais la quantité d’informations à gérer deviendraitt rapidement pharamineuse.

Comme cette valeur numérique ne peut-être arbitraire, on va donc mesurer (quantifier) chacun de ces échantillons, cette mesure nous fournira leur valeur numérique. Dans le cas du champ de tomate, cette valeur correspondra à son prix au kilo, dans le cas d’un signal numérique, cette valeur correspondra à un nombre de bits.

Comme nous l’avons vu pour le champ de tomates, la première étape de la numérisation consiste à déterminer la distance entre chaque échantillon couramment appelé : pas d’échantillonnage. C’est ce pas qui va déterminer le nombre d’échantillon prélevé à la seconde pour un son, ou, pour une image, le nombre de pixels contenu sur la surface du capteur. Dans le cas d’un film cinématographique, nous sommes en présence de deux type d’échantillonnage :
- celui de chacun des photogrammes qui déterminera la définition de chacune des images de notre film ;
- celui du mouvement, qui est déterminé par le nombre d’images enregistrée à la seconde. Pour un film cinématographique dont la cadence est de 24 images à la seconde, le pas d’échantillonnage sera de 1/24è de seconde tandis que pour une vidéo il sera, en Europe de 25 images à la seconde (soit1/25é) et de 30 images à la seconde (soit1/30é) aux États-Unis d’Amérique du Nord.

Prélever des échantillons, c’est découper le signal analogique (continu) en un nombre x de tranches pour les mesurer à intervalles réguliers afin d’obtenir un certain nombre de valeurs. La distance entre chaque prise d’échantillon est le pas d’échantillonnage. Plus cette distance est petite, meilleur est la qualité de l’échantillonnage. Cependant, cette qualité dépend aussi de la régularité du pas1 ou intervalle d’échantillonnage.
- D’une part, la difficulté de cette opération est d’estimer le nombre d’échantillons nécessaire pour que leur succession puisse se substituer au signal original.
- D’autre part, il ne suffit donc pas seulement de travailler en numérique, il faut aussi avant tout bien échantillonner. Un son haché, une droite en escalier sont le résultat d’un trop grand pas d’échantillonnage. C’est-à-dire d’une distance trop importante entre chaque prélèvement. Le pas d’échantillonnage est donc déjà, à lui seul, une manière de discriminer l’information. De fait, si ce pas est trop important, comme aucune valeur ne correspond aux espaces situés entre deux échantillons, même si la mesure est précise, nous aurons une importante perte d’information.

Cette illustration représente un signal analogique et un signal numérique. Comme on peut le voir, entre chaque échantillon quantifié, il n’y a aucune information. Ici, le signal a été découpé en quatre tranches.

Il ressort de ces deux définitions que dans le domaine du son, on aura un échantillonnage temporel : ce que l’on doit mesurer c’est un signal qui se déroule dans le temps. Dans le domaine de l’image fixe, on va effectuer un échantillonnage spatial (on mesure la valeur RVB des points situés dans un repère orthonormé définit par la grille du capteur CCD ou CMOS).

Tandis que dans le domaine de la vidéo et du cinéma, on va employer à la fois un échantillonnage temporel : le nombre d’images enregistrées à la seconde. (On en déduit que le cinéma et la vidéo analogique utilisent eux-aussi un échantillonnage temporel respectif de 24 images et de 50 trames à la seconde2) et un échantillonnage spatial (la grille d’analyse de chaque image). Dans le domaine de l’image animée, plus la valeur de cet échantillonnage temporel sera élevée moins l’effet de la stroboscopie sera perceptible ?

Kung Fu Motion Visualization from Tobias Gremmler on Vimeo.

Kung Fu Motion Visualization, une création vidéographique de Tobias Gremmler illustre simultanément la question de l’échantillonnage spatial et temporel.

L’échantillonnage spatial détermine la définition de chacun des photogrammes du film ou de chacune des photos. Il est défini soit par un nombre de points global (6 millions de pixels par exemple) ou par deux chiffres précisant le nombre de points sur la longueur et la largeur de l’image (3000 x 2000 pixels). Si le premier nombre donne le nombre de photosites du capteur, il a pour inconvénient de ne fournir aucune information sur le format de l’image. Son rapport (16/9, 4/3, carré ...) reste inconnu, tandis que la seconde notation donne simultanément des informations sur le format de l’image. Rigoureusement employée (longueur x largeur), cette seconde notation, outre le nombre de photosites, précise le sens de l’image : horizontal ou vertical.

Numériser le plus grand nombre de points possible dans une image pour obtenir une image de qualité n’est pas suffisant. Faut-il encore quantifier (mesurer) correctement ces points, afin de capter les bonnes couleurs, c’est-à-dire la modulation chromatique et lumineuse de chacun des points pour restituer correctement la plage dynamique de l’image. C’est pourquoi, le nombre de bits par couleur primaire joue un très grand rôle. Il représente la gamme de couleurs reproduite par un périphérique (écran, imprimante…) ou le nombre de couleurs individuelles ou de niveaux d’intensité, qu’il peut analyser (scanner, appareil photo...).

Pour une image, la quantification est exprimée soit par un nombre de bits total soit, par un nombre de bits par canal rouge, vert et bleu. Lorsque chaque canal de couleur est défini par un nombre codé sur 8 bits, il existe 256 niveaux de luminosité possibles pour chaque couleur, ce qui permet de décrire 16,7 millions de couleurs3 (256 niveaux x 256 x 256) tandis qu’en 12 bits, ce nombre passe à 4 096 niveaux par couleur.

Si l’on a choisi un codage en RVB4 pour numériser une image, c’est parce que c’est l’un des codages qui correspond le mieux à la vision humaine compte-tenu de la difficulté de fabriquer des filtres couleurs de qualité. En effet, un CCD est uniquement sensible à l’intensité lumineuse, il fonctionne comme un pluviomètre à lumière. La séparation des couleurs se fait grâce à des filtres placés devant le capteur. Nous aurions eu une vision quadrichromique comme certains animaux, le filtrage du capteur se ferait sur quatre couleurs.

Illustrations extraites du DVD À la recherche de la fidélité, un DVD d’assistance au réglage des home cinémas édités et vendus par la CST. Conception et réalisation : Hervé Bernard et Denis Mercier
© Hervé Bernard 2009,

Première partie de cet article

Troisième partie