- Ne confondons pas échantillonnage et marchandage ! (1)- Le numérique, comment ça marche (3)

,  par Hervé BERNARD dit RVB

L’enregistrement d’un son ou d’une image est l’opération qui consiste à transformer ce son ou cette image en un signal afin de le diffuser et/ou d’en garder une trace durable sur un support afin d’en permettre une rediffusion future.

Cet enregistrement est de fait une forme de description de l’information que l’on veut archiver et il se fait sur un support physique1. Cette description se faisant, en analogique, pour un son grâce à une variation de l’intensité d’un courant et par des variations de la densité des grains d’argent pour l’image.

De fait, pour fabriquer un signal, il est nécessaire de le décrire. Si cette description a parfois recours à l’échantillonnage —cf le nombre d’images à la seconde, au cinéma et en vidéo— dans le monde analogique, elle passe nécessairement par l’échantillonnage dans le monde numérique. Par conséquent, l’échantillonnage est l’une des notions qui fonde la théorie de l’information et plus particulièrement celle du traitement du signal.

Déficience et mémoire

Définition :

L’échantillonnage, c’est le prélèvement d’une fraction représentative d’un objet, d’un ensemble2 pour en constituer une description selon un angle appelé dans la théorie du signal biais. De cette définition découle deux nécessités :

- déterminer une cadence de prélèvement ou fréquence de prise de cet échantillon ;

- la taille de cet échantillon doit être suffisante pour être significative.

Si l’on échantillonne, c’est pour caractériser un élément, c’est-à-dire pour le décrire. Par exemple, dans le cas d’un champ de tomates, l’échantillonnage permettra de décrire leur qualité afin d’en déterminer leur prix de vente. Ici, le biais est l’établissement du prix des tomates de ce champ.

Échantillonner implique donc de faire un traitement statistique des informations collectées. En effet, compte-tenu de la taille des champs de tomates contemporains, il est hors de question d’analyser les tomates unes par une pour en déterminer leur prix. Ce traitement statistique se fait notamment à travers les notions de moyenne et d’écart. C’est pourquoi, afin de faciliter ce travail statistique, les échantillons sont prélevés à une cadence régulière. Dans cet exemple, l’échantillonnage correspondra à un prélèvement d’une ou plusieurs tomate(s) à une distance régulière.

Ainsi, si dans un premier échantillonnage de votre champ, vous ramassez une tomate tous les cinq mètres et dans un second échantillonnage, vous optez pour deux tomates tous les dix mètres vous obtenez deux échantillonnages des tomates de ce champ qui contiennent le même nombre de tomates mais, leur pas d’échantillonnage (c’est-à-dire la distance séparant chaque échantillon) est différent puisque le pas de ce second échantillonnage est le double de celui du premier. Ces deux échantillonnage bien que contenant le même nombre de tomates produisent donc deux descriptions différentes de la qualité des tomates de ce champ. En effet, comme dans le premier échantillonnage, la distance séparant les échantillons est plus courte, cet échantillon se révèlera plus précis que le second. De fait, la probabilité de passer à côté d’une zone aride, malade ou au contraire prospère est deux fois moins grande que dans le second échantillon. La description de la qualité des tomates obtenu par le premier échantillonnage est donc plus précise que dans le second.

Après avoir montré dans cet exemple, l’importance de la cadence de l’échantillonnage, nous allons maintenant aborder la question de la taille de chacun échantillon prélevé. Toujours dans l’hypothèse de notre champ de tomate, si l’on prélève un échantillon d’une taille inférieure à une tomate entière, c’est-à-dire un morceau de tomate, nous nous trouvons confronté à un autre problème : le choix de ce morceau. Choix qui va induire une nouvelle source d’erreur : la probabilité que chaque prélèvement contienne ou non une partie abimée de la tomate. Donc, dans ce cas, afin de limiter les erreurs dans la réalisation de notre échantillonnage, nous sommes obligés de considérer que la taille minimum de l’échantillon sera celui d’une tomate entière. On remarquera que la notion d’échantillonnage est directement liée aux probabilités à travers les notions de moyenne et d’écart. Il est clair que si lors de notre échantillonnage, chaque prélèvement est composé de cinq tomates au lieu d’une, notre description n’en sera que plus précise. Cependant, elle sera probablement moins précise que si l’on prélève une tomate tous les mètres.

Première remarque : certains en déduiront que pour échantillonner correctement, il faut donc prélever tout le champ de tomate. Cependant, nous remarquerons que cette solution est antinomique de la définition même de l’échantillonnage. En effet, elle est contre-productive. Par ailleurs, comme le montre le théorème de Nyquist, cette remarque est erronée.

Seconde remarque : quand un échantillonnage est imparfait, entaché d’erreur, non seulement il est erronée mais, comme nous le montre notre champ de tomates, il va générer une information erronée, car l’acheteur de nos tomates sous la foi de cet échantillonnage va acheter les tomates à un prix trop élevé ou au contraire trop faible. Par conséquent, un mauvais échantillonnage n’est pas seulement mauvais, il fabrique une fausse information.

Après ces préliminaires qui nous ont permis de définir l’échantillonnage, nous étudierons dans les prochains épisodes le théorème de Nyquist, une application de l’échantillonnage dans le monde analogique avec la restitution du mouvement au cinéma, puis l’échantillonnage dans le monde numérique appliqué à la définition de l’image, à la description de ses couleurs ainsi qu’au monde sonore.

© Hervé Bernard 2009,

- Focale, argentique-numérique : quelles différences ?