Newsletter
Pour être prévenu des nouveautés du site.

Votre adresse email :

s'inscrire...
 

Les conversions analogique numérique

Et voilà, vous avez enfin sauté le pas pour passer de votre vieux multipiste analogique et poussiéreux (ah ces vieilles bandes 1 pouce...) à un système tout numérique. Et vous voilà face à un mur de chiffres et de vocabulaire aussi étranger qu'incompréhensif. Qu'est-ce qu'un échantillon ? un convertisseur ? pourquoi la qualité change-t-elle avec la fréquence d'échantillonnage ? qu'est-ce que la résolution ? la latence ? Prenons la tronçonneuse, et débroussaillons tout ça.

Par Nicolas [no-one] STURMEL

Principe

exemples d'échantillonnage
cliquez sur l'image pour l'agrandir

Derrière ce terme de "numérique", il y a le concept de discrétisation. C'est l'opposé même du monde "analogique" où un signal est stocké et restitué de manière continue dans le temps et l'amplitude. Ainsi, si on prend un signal numérique, il existe une plage de temps pendant laquelle le signal a exactement la même valeur alors qu'un signal analogique varie constamment.
On commence donc à cerner le mécanisme de passage d'un domaine à l'autre (du continu au discret) : pour convertir un signal analogique en numérique, on va fixer la valeur du signal pendant un temps donné puis convertir cette valeur en données numériques.
On vient ici de définir les trois termes majeurs du monde du numérique (nous les verrons plus en détail par la suite) :
    - la fréquence d'échantillonnage : c'est elle qui donne le temps entre deux blocages du signal. Le temps est obtenu en calculant l'inverse de la fréquence (22 µs pour 44,1kHz )
    - la résolution : c'est le nombre de bits qui sont utilisés pour convertir cette valeur bloquée.
    - Un échantillon : c'est la valeur obtenue après conversion. Bien sur, l'échantillon dépend du signal, mais aussi de la fréquence d'échantillonnage et de la résolution.

L'illustration ci-contre montre un signal analogique (colonne de gauche) et sa transcription numérique (colonne de droite) à différentes résolutions (échelle verticale) et différentes fréquences d'échantillonnage (échelle horizonale).

La fréquence d'échantillonnage

Son choix est très important. C'est la fréquence d'échantillonnage qui permet de déterminer la bande passante capturée lors de la conversion. En effet, il est convenu (c'est ce qu'on appelle le théorème de Shannon-Nyquist) que la fréquence maximale qui peut être traduite pas un signal numérisé est égale à la moitié de la fréquence d'échantillonnage. En d'autres termes : en échantillonnant à 32kHz, on ne gardera (et pourra reproduire) que les fréquences du signal original inférieures à 16kHz.
C'est donc pourquoi la fréquence d'échantillonnage considérée comme hi-fi est 44,1kHz. Elle conserve théoriquement toute l'étendue du spectre propre à l'oreille humaine. (jusqu'à 20 000Hz environ, la valeur précise de 44100 Hz a été choisie pour des contraintes de synchronisation avec les équipements vidéos).
Il est donc naturel de penser que plus la fréquence d'échantillonnage est grande, plus le signal échantillonné est fidèle à la réalité. C'est évidemment vrai, mais attention : plus la fréquence d'échantillonnage est grande, et plus la quantité de données à stocker est importante ! Une minute de signal stéréo échantillonné à 96kHz prend plus de deux fois la place d'une minute de signal stéréo à 44,1kHz.

C'est pourquoi les spécialistes s'accordent pour dire que 48kHz est le meilleur compromis entre bande passante et quantité de données. Mais nous verrons par la suite qu'utiliser une fréquence d'échantillonnage plus élevé a d'autres avantages. (et pas seulement commerciaux ;-) )

La résolution

    Elle correspond aux nombre de bits utilisés pour convertir le signal analogique. Un signal de 16 bits, va permettre de coder le niveau du signal entre -32767 et 32768. C'est ce format qui est utilisé en hi-fi, car le plus petit niveau codé (1/32768) correspond à un niveau analogique de -90dB, soit le seuil limite d'audition de l'oreille humaine.
    Cependant, à l'enregistrement, on préfèrera travailler à des résolution supérieures (20, 24, voir 32 bits) pour avoir une plage de manœuvre plus importante. Numériser à haute résolution, permet alors de garder quoi qu'il arrive une qualité optimum supérieure à la qualité CD : nous le verrons en détail plus tard.

Les convertisseurs

C'est la pièce autour de laquelle se place toute l'attention quand on converti un signal. En effet, si on cherche à numériser un signal analogique, il est crucial que le convertisseur soit bien conçu, car les données qui en sortent doivent représenter le plus fidèlement possible le signal analogique.
On cherche donc à faire des convertisseurs :
    - précis : plus on augmente la résolution, et plus on a de difficultés à avoir des données précises sur les bits de poids faible (ceux qui représentent la partie du signal de plus faible niveau). Dans le bas de gamme, on peut très vite arriver à un convertisseur de 24bits théorique qui ne sera guère meilleur qu'un convertisseur 18bits professionnel. (carte Créative ou Terratec de premier prix)
    - propres : si il y a bien un endroit où le signal analogique peut être perturbé par des parasites, c'est à l'entrée du convertisseur où il cotoit plusieurs circuits numériques. Il est donc important de diminuer le bruit au maximum.
    - rapides : cette caractéristique va de paire avec la précision. Un convertisseur précis doit être rapide (et pas forcément l'inverse), afin de suivre un maximum de variation du signal et d'autoriser une plage dynamique la plus grande possible dans les transitoires.

Les convertisseurs utilisés dans les applications audio sont des convertisseur Delta-Sigma, qui sont des convertisseurs par approximation. Ils se prêtent très bien aux signaux audio car ils possèdent la plupart du temps des variations lentes. On parle alors de taux de suréchantillonnage (64, 128 voire 256 fois), qui est le nombre de fois où le signal sera vérifié pour chaque échantillon. Mais il n'est gage ni de rapidité, ni de précision : c'est avant tout un argument de marketing, puisque la grande majorité des convertisseurs possèdent un suréchantillonnage 64x pour les convertisseurs A/N, et 128x pour les convertisseurs N/A.

DIOChoisir un convertisseur

Choisir une carte son pour faire des enregistrements, vous l'aurez compris, c'est avant tout (mais pas seulement), choisir les convertisseurs qui seront utilisés. Outre les critères de musicalité qui sont très subjectifs et surtout présents sur le haut de gamme (Apogée, Digidesign... ), on peut se baser sur certains chiffres :

    - la résolution : nous l'avons vu avant, elle donne les possibilités des convertisseurs, mais n'est pas forcément représentative de la résolution "réelle".
    - la fréquence d'échantillonnage : un convertisseur qui pourra numériser à forte cadence (donc "allant haut" dans les fréquences d'échantillonnage) sera probablement plus précis dans tous les cas de figure.
    - le rapport signal/bruit (RSB, ou SNR en anglais) : Il va dépendre de l'environnement du convertisseur et de sa conception. Attention ! il y a le rapport signal bruit théorique, qu'on appelle bruit de quantification, et qui correspond à (6*(n-1)+1.8) dB pour n bits de précision, et il y a le RSB réel, toujours plus bas bien sûr ;-). Pour du 16 bits, par exemple, on aura toujours un RSB inférieur à 90 dB.
    Bien sûr, plus le RSB est grand, et mieux c'est... mais attention aux méthodes de mesure qui varient d'un constructeur à l'autre : inutile de choisir un convertisseur plutôt qu'un autre pour un écart de 3 voir 6 dB.
    - la dynamique : Théoriquement inférieure ou égale au RSB annoncé, il donne la différence entre le plus petit signal numérisable et le plus grand. Parfois il est supérieur au RSB, mais alors, il n'est que théorique, ou je n'ai pas bien compris le mécanisme de la numérisation des signaux ;-)
(même remarque que pour le RSB sur la fidélité des chiffres annoncés).

En gros, et c'est toujours le cas pour une fiche technique, il faut prendre les chiffres comme des valeurs indicatives pour aiguiller ses choix.

Bien numériser une source analogique (le seuil du 0dBFS)

Le concept de 0dBFS est arrivé avec l'air du numérique. En effet, FS signifie "Full Scale" (pleine échelle), et ce concept exprime tout le dilemme de la numérisation :
    D'un coté, point de salut dans le dépassement du 0dB ! nous avons quitté le domaine de l'analogique où l'on pouvait, même sur cassette audio, s'autoriser quelques légères saturations. Ici, un dépassement se traduit par un clic, et une détérioration irrémédiable du signal converti.
    Mais de l'autre coté, numériser à bas niveau (pour éviter les clics en gardant une marge de sécurité de 6 ou 12 dB par exemple), revient à diminuer la plage dynamique du convertisseur. Puisque toutes les caractéristiques citées plus haut (RSB, dynamique...) sont données pour un signal en pleine échelle, il faut leur soustraire la marge de sécurité.
    Ainsi, il convient de numériser le plus près possible du 0dbFS sans pour autant le dépasser , c'est là que réside l'art de la prise de son numérique.

Mais tout cela se pratique de moins en moins. Les convertisseurs actuels ayant des plages dynamique de plus de 105 dB, on dépasse largement les 90dB théorique d'un signal numérique type "CD", même avec une marge de sécurité de 12dB. D'un autre coté, si on est pas sur de la précision de ses convertisseurs, approcher le 0dBFS est une bonne habitude à prendre (pour cela, on peut s'aider d'un léger compresseur, mais qui va alors colorer le son par la même occasion)

Un autre aspect du numérique : la latence

Nous l'avons vu au début de l'article, la conversion prend du temps. De plus, la gestion des flux de données dans un ordinateur est telle qu'elles sont transférées par blocs, plus ou moins gros. Il faut donc attendre qu'un bloc de données soit écrit ou lu sur la carte avant de le transférer (ou de transférer le suivant). Ce temps à attendre s'appelle la latence, il représente le temps entre lequel un signal est présent à l'entrée de la carte, et dans le programme (ou inversement). Il peut être spécialement important d'avoir une latence faible lors de l'enregistrement ou de l'utilisation d'effets numériques en temps réel, car une latence trop grande (plus de 10ms), peut troubler un musicien et l'empêcher d'être "calé".
Pour diminuer la latence, ou peut jouer sur :
    - la taille du bloc (ou "buffer") : moins il comporte d'échantillons, plus il se rempli rapidement.
    - la fréquence d'échantillonnage : plus on échantillonne vite, et plus on génère de données, donc plus le buffer se rempli vite.

C'est là que réside le principal avantage de l'échantillonnage à très haute fréquence en home studio : on peut atteindre des latences très faibles.

Conclusion

Vous voilà maintenant (je l'espère), un peu plus familiers avec l'environnement du "numérique". Il est important de garder à l'esprit que la qualité d'un signal dépend principalement du matériel utilisé pour sa conversion. Il n'est pas non plus nécessaire de numériser à tout prix à des fréquences de "pros" : utiliser du 96 kHz peut être intéressant pour diminuer la latence ou augmenter la précision d'un enregistrement d'une source de très bonne qualité, mais va donner des fichiers beaucoup plus volumineux, et des traitements gourmands en ressources. Et si vous vous orientez vers le milieu de gamme, sachez que les convertisseurs se valent globalement d'une carte à l'autre, il est donc préférable de porter son attention sur l'ergonomie plutôt que sur les chiffres de fiches techniques.


Remerciements :
Je remercie l'auteur du site E-lectronik (http://perso.wanadoo.fr/e-lektronik/ ) pour avoir autorisé l'utilisation de la première illustration de cet article.

haut de page
Il y a 7 commentaires sur cet article.
Commenter cet article
Posté le 12-10-2004
anonyme
Un signal 16 bits ne peut pas restituer des composantes d'amplitude inférieures à -90dB FS, c'est un fait... donc que le convertisseurs ai des performances supérieures est surtout réellement absurde.

Enfin, les performances dynamiques d'un convertisseur sont données à la fréquence d'échantillonnage généralement la plus basse (44,1 kHz aujourd'hui) ce qui est normal, car le convertisseur y est plus efficace.

Il faut donc s'attendre à perdre 3 à 6dB de dynamique si on double la fréquence d'échantillonnage.... l'utilité du 96kHz, en plus de consommer énormément de DSP, est d'autant plus remise en question...
Posté le 06-10-2004
gg
Concernant la résolution, petite précision : sur 16 bits signés, on code de -32768 à 32767
Posté le 09-09-2004
jeef
Bon je confirme qu'il est possible de dépasser ces 90 db de SNR théoriques et donc la dynamique sur 16 bits car en fait la formule change dès lors que l'on passe à des architectures suréchantillonnées de type sigma delta.
De même, une échelle de quantification non linéaire ne permet pas forcément de dépasser ce SNR max mais permettra de l'harmoniser, c'est à dire conserver le SNR optimal même aux faibles amplitudes.
De plus, pour les faibles amplitudes, un bruit d'une autre nature apparaît sous forme de fréquences indésirables (et non sous forme de bruit blanc...je vais pas détailler ça deviendrait vite compliqué). Une solution appellée dithering consiste alors à rajouter du bruit en entrée pour supprimer ces fréquences désagréables...amusant non ? le truc c'est que un bruit uniforme de type souffle est bien moins gênant qu'un bruit de type grésillement ou sifflement. Cette technique peut-être offerte sous forme d'options sur certains softs.
Posté le 06-09-2004
Franco
Bravo pour l'article et merci à Jeef pour les remarques! J'insisterai beaucoup sur les compressions collossales devenues , afin d'éviter le 0 DFS,des Habitudes; sur la polarisation des utilisateurs à propos des caractéristiques techniques "papier" inaudibles et sur la faculté d'oublier le soin à apporter au traitement du local et des écoutes ( si possible non équalisées!....)
Merci et @++
Posté le 06-09-2004
jeef encore
et également pour renforcer ta conclusion : les performances du convertisseur d'une carte sont souvent totalement bouffées par la piètre conception analogique de la carte voire du PC entier : c'est bien d'avoir des CAN rapides et précis mais si c'est pour enregistrer du bruit très précis, ça sert plus à rien. Aujourd'hui les résolutions et fréquences d'échantillonnage standard sont définies par ce qu'offrent les fabricants de circuits intégrés mais la qualité du son dépendra toujours des frontaux d'amplification analogiques et de la qualité de dizaines de petits composants que l'on met autour et sur lesquels il est si facile de faire des économies...sans parler du savoir faire des ingénieurs qui dessinent la carte.
En somme si pour mettre sur le marché une carte dernière génération 96kHz 32 bits, ils se sont contenté d'augmenter la profondeur de mémoire des buffers et de remplacer le chip CAN, sans revoir la conception de l'ampli d'entrée, autant dire que la carte sera inutile.
Posté le 06-09-2004
jeef
à propos des valeurs de dynamiques qui seraient supérieures au 90 db théorique de SNR, je crois que selon l'algorithme de codage utilisé lors de la quantification il est possible d'améliorer sensiblement la dynamique au delà du SNR théorique, par exemple en économisant des bits sur la partie de très faible amplitude du signal qui est de toute façon noyée dans le bruit, pour les reporter sur les parties plus critiques à l'écoute.
Il faudrait explorer cet aspect codage pour être fixé. Les circuits intégrés de conversion A/N offrent parfois différentes possibilités plus ou moins standardisées selon le type de liaison.
Ceci dit, les données de dynamique doivent être mises en relation avec celles de la chaîne d'écoute dans son ensemble, qui seront loin d'être bonnes chez la plupart des consommateurs de musique. La différence peut se révéler inaudible sur un ensemble donné alors que avec des enceintes et un ampli béton ce sera flagrant.
Posté le 06-09-2004
xavier de bordeaux
Sympa, on en apprend des choses sur zikinf :)
haut de page
 
Copyright 1998-2008 ZIKINF.com. Tous droits réservés.
Conditions générales d'utilisation - Déclaration CNIL n°1011217