Les conversions analogique
numérique
Et voilà, vous avez enfin sauté le pas pour passer de votre vieux multipiste analogique et poussiéreux (ah ces vieilles bandes 1 pouce...) à un système tout numérique. Et vous voilà face à un mur de chiffres et de vocabulaire aussi étranger qu'incompréhensif. Qu'est-ce qu'un échantillon ? un convertisseur ? pourquoi la qualité change-t-elle avec la fréquence d'échantillonnage ? qu'est-ce que la résolution ? la latence ? Prenons la tronçonneuse, et débroussaillons tout ça.
Principe
cliquez sur l'image pour l'agrandir
Derrière ce terme de "numérique", il y a le concept de discrétisation. C'est l'opposé même du monde "analogique" où un signal est stocké et restitué de manière continue dans le temps et l'amplitude. Ainsi, si on prend un signal numérique, il existe une plage de temps pendant laquelle le signal a exactement la même valeur alors qu'un signal analogique varie constamment.
On commence donc à cerner le mécanisme de passage d'un domaine à l'autre (du continu au discret) : pour convertir un signal analogique en numérique, on va fixer la valeur du signal pendant un temps donné puis convertir cette valeur en données numériques.
On vient ici de définir les trois termes majeurs du monde du numérique (nous les verrons plus en détail par la suite) :
- la fréquence d'échantillonnage : c'est elle qui donne le temps entre deux blocages du signal. Le temps est obtenu en calculant l'inverse de la fréquence (22 µs pour 44,1kHz )
- la résolution : c'est le nombre de bits qui sont utilisés pour convertir cette valeur bloquée.
- Un échantillon : c'est la valeur obtenue après conversion. Bien sur, l'échantillon dépend du signal, mais aussi de la fréquence d'échantillonnage et de la résolution.
L'illustration ci-contre montre un signal analogique (colonne de gauche) et sa transcription numérique (colonne de droite) à différentes résolutions (échelle verticale)
et différentes fréquences d'échantillonnage (échelle horizonale).
La fréquence d'échantillonnage
Son choix est très important. C'est la fréquence d'échantillonnage qui permet de déterminer la bande passante capturée lors de la conversion. En effet, il est convenu (c'est ce qu'on appelle le théorème de Shannon-Nyquist) que la fréquence maximale qui peut être traduite pas un signal numérisé est égale à la moitié de la fréquence d'échantillonnage. En d'autres termes : en échantillonnant à 32kHz, on ne gardera (et pourra reproduire) que les fréquences du signal original inférieures à 16kHz.
C'est donc pourquoi la fréquence d'échantillonnage considérée comme hi-fi est 44,1kHz. Elle conserve théoriquement toute l'étendue du spectre propre à l'oreille humaine. (jusqu'à 20 000Hz environ, la valeur précise de 44100 Hz a été choisie pour des contraintes de synchronisation avec les équipements vidéos).
Il est donc naturel de penser que plus la fréquence d'échantillonnage est grande, plus le signal échantillonné est fidèle à la réalité. C'est évidemment vrai, mais attention : plus la fréquence d'échantillonnage est grande, et plus la quantité de données à stocker est importante ! Une minute de signal stéréo échantillonné à 96kHz prend plus de deux fois la place d'une minute de signal stéréo à 44,1kHz.
C'est pourquoi les spécialistes s'accordent pour dire que 48kHz est le meilleur compromis entre bande passante et quantité de données. Mais nous verrons par la suite qu'utiliser une fréquence d'échantillonnage plus élevé a d'autres avantages. (et pas seulement commerciaux ;-) )
La résolution
Elle correspond aux nombre de bits utilisés pour convertir le signal analogique. Un signal de 16 bits, va permettre de coder le niveau du signal entre -32767 et 32768. C'est ce format qui est utilisé en hi-fi, car le plus petit niveau codé (1/32768) correspond à un niveau analogique de -90dB, soit le seuil limite d'audition de l'oreille humaine.
Cependant, à l'enregistrement, on préfèrera travailler à des résolution supérieures (20, 24, voir 32 bits) pour avoir une plage de manœuvre plus importante. Numériser à haute résolution, permet alors de garder quoi qu'il arrive une qualité optimum supérieure à la qualité CD : nous le verrons en détail plus tard.
Les convertisseurs
C'est la pièce autour de laquelle se place toute l'attention quand on converti un signal. En effet, si on cherche à numériser un signal analogique, il est crucial que le convertisseur soit bien conçu, car les données qui en sortent doivent représenter le plus fidèlement possible le signal analogique.
On cherche donc à faire des convertisseurs :
- précis : plus on augmente la résolution, et plus on a de difficultés à avoir des données précises sur les bits de poids faible (ceux qui représentent la partie du signal de plus faible niveau). Dans le bas de gamme, on peut très vite arriver à un convertisseur de 24bits théorique qui ne sera guère meilleur qu'un convertisseur 18bits professionnel. (carte Créative ou Terratec de premier prix)
- propres : si il y a bien un endroit où le signal analogique peut être perturbé par des parasites, c'est à l'entrée du convertisseur où il cotoit plusieurs circuits numériques. Il est donc important de diminuer le bruit au maximum.
- rapides : cette caractéristique va de paire avec la précision. Un convertisseur précis doit être rapide (et pas forcément l'inverse), afin de suivre un maximum de variation du signal et d'autoriser une plage dynamique la plus grande possible dans les transitoires.
Les convertisseurs utilisés dans les applications audio sont des convertisseur Delta-Sigma, qui sont des convertisseurs par approximation. Ils se prêtent très bien aux signaux audio car ils possèdent la plupart du temps des variations lentes. On parle alors de taux de suréchantillonnage (64, 128 voire 256 fois), qui est le nombre de fois où le signal sera vérifié pour chaque échantillon. Mais il n'est gage ni de rapidité, ni de précision : c'est avant tout un argument de marketing, puisque la grande majorité des convertisseurs possèdent un suréchantillonnage 64x pour les convertisseurs A/N, et 128x pour les convertisseurs N/A.
Choisir un convertisseur
Choisir une carte son pour faire des enregistrements, vous l'aurez compris, c'est avant tout (mais pas seulement), choisir les convertisseurs qui seront utilisés. Outre les critères de musicalité qui sont très subjectifs et surtout présents sur le haut de gamme (Apogée, Digidesign... ), on peut se baser sur certains chiffres :
- la résolution : nous l'avons vu avant, elle donne les possibilités des convertisseurs, mais n'est pas forcément représentative de la résolution "réelle".
- la fréquence d'échantillonnage : un convertisseur qui pourra numériser à forte cadence (donc "allant haut" dans les fréquences d'échantillonnage) sera probablement plus précis dans tous les cas de figure.
- le rapport signal/bruit (RSB, ou SNR en anglais) : Il va dépendre de l'environnement du convertisseur et de sa conception. Attention ! il y a le rapport signal bruit théorique, qu'on appelle bruit de quantification, et qui correspond à (6*(n-1)+1.8) dB pour n bits de précision, et il y a le RSB réel, toujours plus bas bien sûr ;-). Pour du 16 bits, par exemple, on aura toujours un RSB inférieur à 90 dB.
Bien sûr, plus le RSB est grand, et mieux c'est... mais attention aux méthodes de mesure qui varient d'un constructeur à l'autre : inutile de choisir un convertisseur plutôt qu'un autre pour un écart de 3 voir 6 dB.
- la dynamique : Théoriquement inférieure ou égale au RSB annoncé, il donne la différence entre le plus petit signal numérisable et le plus grand. Parfois il est supérieur au RSB, mais alors, il n'est que théorique, ou je n'ai pas bien compris le mécanisme de la numérisation des signaux ;-)
(même remarque que pour le RSB sur la fidélité des chiffres annoncés).
En gros, et c'est toujours le cas pour une fiche technique, il faut prendre les chiffres comme des valeurs indicatives pour aiguiller ses choix.

Bien numériser une source analogique (le seuil du 0dBFS)
Le concept de 0dBFS est arrivé avec l'air du numérique. En effet, FS signifie "Full Scale" (pleine échelle), et ce concept exprime tout le dilemme de la numérisation :
D'un coté, point de salut dans le dépassement du 0dB ! nous avons quitté le domaine de l'analogique où l'on pouvait, même sur cassette audio, s'autoriser quelques légères saturations. Ici, un dépassement se traduit par un clic, et une détérioration irrémédiable du signal converti.
Mais de l'autre coté, numériser à bas niveau (pour éviter les clics en gardant une marge de sécurité de 6 ou 12 dB par exemple), revient à diminuer la plage dynamique du convertisseur. Puisque toutes les caractéristiques citées plus haut (RSB, dynamique...) sont données pour un signal en pleine échelle, il faut leur soustraire la marge de sécurité.
Ainsi, il convient de numériser le plus près possible du 0dbFS sans pour autant le dépasser , c'est là que réside l'art de la prise de son numérique.
Mais tout cela se pratique de moins en moins. Les convertisseurs actuels ayant des plages dynamique de plus de 105 dB, on dépasse largement les 90dB théorique d'un signal numérique type "CD", même avec une marge de sécurité de 12dB. D'un autre coté, si on est pas sur de la précision de ses convertisseurs, approcher le 0dBFS est une bonne habitude à prendre (pour cela, on peut s'aider d'un léger compresseur, mais qui va alors colorer le son par la même occasion)
Un autre aspect du numérique : la latence
Nous l'avons vu au début de l'article, la conversion prend du temps. De plus, la gestion des flux de données dans un ordinateur est telle qu'elles sont transférées par blocs, plus ou moins gros. Il faut donc attendre qu'un bloc de données soit écrit ou lu sur la carte avant de le transférer (ou de transférer le suivant). Ce temps à attendre s'appelle la latence, il représente le temps entre lequel un signal est présent à l'entrée de la carte, et dans le programme (ou inversement). Il peut être spécialement important d'avoir une latence faible lors de l'enregistrement ou de l'utilisation d'effets numériques en temps réel, car une latence trop grande (plus de 10ms), peut troubler un musicien et l'empêcher d'être "calé".
Pour diminuer la latence, ou peut jouer sur :
- la taille du bloc (ou "buffer") : moins il comporte d'échantillons, plus il se rempli rapidement.
- la fréquence d'échantillonnage : plus on échantillonne vite, et plus on génère de données, donc plus le buffer se rempli vite.
C'est là que réside le principal avantage de l'échantillonnage à très haute fréquence en home studio : on peut atteindre des latences très faibles.
Conclusion
Vous voilà maintenant (je l'espère), un peu plus familiers avec l'environnement du "numérique". Il est important de garder à l'esprit que la qualité d'un signal dépend principalement du matériel utilisé pour sa conversion. Il n'est pas non plus nécessaire de numériser à tout prix à des fréquences de "pros" : utiliser du 96 kHz peut être intéressant pour diminuer la latence ou augmenter la précision d'un enregistrement d'une source de très bonne qualité, mais va donner des fichiers beaucoup plus volumineux, et des traitements gourmands en ressources. Et si vous vous orientez vers le milieu de gamme, sachez que les convertisseurs se valent globalement d'une carte à l'autre, il est donc préférable de porter son attention sur l'ergonomie plutôt que sur les chiffres de fiches techniques.
Remerciements :
Je remercie l'auteur du site E-lectronik (
http://perso.wanadoo.fr/e-lektronik/ ) pour avoir autorisé l'utilisation de la première illustration de cet article.