MASTERPLUS

24-bit ou 32-bit float ?

24-bit ou 32-bit float ?

Il m’arrive assez souvent de recevoir au studio des mixs qui ne semblent pas clipper de manière flagrante dans la session de l’ingé mix ou du producteur, mais qui clippent une fois exportés en 24-bit.

Le scénario courant est celui d’un mix très dense, à la dynamique fortement réduite, dont le niveau de sortie du mix bus dépasse régulièrement 0 dBFS. Tant que le projet reste dans la session, tout peut sembler encore exploitable. Mais dès que l’export est figé dans un fichier 24-bit, un écrêtement du signal, voire une saturation audible, apparaît.

À mon sens, ce type de situation révèle surtout une compréhension incomplète de la manière dont un DAW et ses formats de fichier se partagent la gestion de la dynamique, ainsi que des limites qui réapparaissent au moment de l’export.

Car, selon le contexte, on ne parle pas tout à fait de la même chose : la profondeur de bits du fichier audio, ou la précision interne du moteur audio. Ces notions sont liées, bien sûr, mais elles ne décrivent pas exactement la même chose. Et dans la pratique, cette nuance compte.

Que décrit vraiment la profondeur de bits ?

Si l’on simplifie, la profondeur de bits décrit la manière dont un signal numérique représente son amplitude. Mais cette idée ne recouvre pas exactement la même réalité selon que l’on parle d’un format PCM fixe, comme le 24-bit, ou d’un format en virgule flottante, comme le 32-bit float.

Dans un fichier 24-bit PCM, chaque échantillon est représenté sur une échelle fixe. Cela signifie qu’il existe un nombre déterminé de valeurs possibles, 2^24, soit 16 777 216, réparties de manière linéaire entre le minimum et le maximum représentables. Dans ce cadre, la profondeur de bits détermine à la fois la finesse de cette représentation et la dynamique théorique disponible. C’est ce qui explique que l’on associe souvent le 24-bit à environ 144 dBFS de dynamique théorique, selon la règle d’environ 6 dB par bit. Ici, il s’agit bien de dBFS, c’est-à-dire d’un repère relatif à la pleine échelle numérique.

Le 32-bit float suit une autre logique. Il ne repose pas sur une simple échelle fixe de niveaux. Sa représentation ressemble davantage à une forme de notation scientifique : une partie de la valeur décrit la précision du nombre, une autre son ordre de grandeur. Dit autrement, le système ne stocke pas seulement combien, mais aussi à quelle échelle.

C’est ce point qui change tout.

Grâce à cette structure, un environnement de travail en 32-bit float peut représenter des valeurs très supérieures à 0 dBFS sans les écrêter immédiatement. Tant que le signal reste dans cet espace de calcul, un dépassement peut donc parfois être récupéré plus tard en redescendant simplement le niveau.

En revanche, lorsqu’un signal doit être exporté dans un format fixe comme le 24-bit PCM, il doit à nouveau rentrer dans une échelle limitée. Si le niveau dépasse encore la valeur maximale représentable à ce moment-là, le clipping devient réel et définitif.

Autrement dit, le 32-bit float ne supprime pas magiquement tout risque de saturation. Il permet surtout au DAW de manipuler les niveaux avec beaucoup plus de souplesse tant que le signal reste dans son moteur audio interne. Et c’est précisément cette différence entre échelle fixe et représentation flottante qui explique pourquoi un mix peut sembler encore exploitable dans la session, puis clipper une fois exporté.

Le bit depth du fichier

Aujourd’hui, le 24-bit PCM et le 32-bit float se sont tous deux imposés comme des formats de référence, mais pas pour exactement les mêmes raisons.

Le 24-bit PCM reste extrêmement courant pour les enregistrements, les exports de pistes, les stems, les prémasters et de nombreuses livraisons destinées au mix ou au mastering. Dans beaucoup de cas, c’est le format le plus cohérent lorsqu’il s’agit de figer un fichier dans un état stable et directement exploitable.

Le 32-bit float répond à une logique un peu différente. On pourrait le décrire moins comme un format meilleur que comme un format plus tolérant dans certaines situations. Lorsqu’un signal a dépassé 0 dBFS avant export, un fichier 32-bit float peut parfois conserver une marge de récupération après réimport. À l’inverse, un export 24-bit PCM pourra clipper de manière définitive si ce dépassement n’a pas été corrigé avant le bounce.

Autrement dit, le 32-bit float n’améliore pas automatiquement le son. Il offre surtout davantage de souplesse dans certains cas de figure.

La précision interne du moteur audio du DAW

Le bit depth affiché dans un fichier audio ne décrit pas nécessairement la manière dont un DAW traite le signal en interne. Dans beaucoup de logiciels modernes, le moteur audio fonctionne en 32-bit float, parfois en 64-bit float pour certaines étapes de calcul. Cela change sensiblement la façon dont les niveaux sont gérés pendant le mixage.

Dans les systèmes plus anciens ou dans des architectures de calcul plus contraintes, un dépassement de niveau pouvait provoquer beaucoup plus vite une saturation ou un clipping à l’intérieur même du moteur audio. Le passage au floating point a apporté une plus grande souplesse. Tant que le signal reste dans cet espace de calcul interne, un dépassement temporaire au-dessus de 0 dBFS peut parfois être récupéré plus loin dans la chaîne en abaissant simplement le niveau.

C’est précisément ce qui explique qu’un mix puisse sembler encore exploitable dans la session, puis clipper au moment de l’export. Le moteur audio du DAW peut tolérer en interne certaines valeurs qu’un fichier 24-bit PCM, lui, ne peut pas représenter.

Cette souplesse ne doit toutefois pas être confondue avec un progrès esthétique en soi. Elle rend surtout les calculs plus tolérants. Elle n’annule ni les limites du format final, ni la nécessité de garder une vraie marge de travail.

Garder de la marge du début à la fin

Savoir qu’un DAW moderne travaille en 32-bit float en interne peut être utile. Mais ce n’est pas une raison pour utiliser toute la marge disponible, ni pour laisser un mix dépasser 0 dBFS en se disant que cela se rattrapera plus tard. La marge offerte par le 32-bit float est un confort de calcul, pas une stratégie de gain staging.

Dans la pratique, la solution reste simple : garder de la marge à chaque étape.

Cela commence dès l’enregistrement, avec des niveaux raisonnables et suffisamment de headroom. Cela se prolonge au mixage, où l’enjeu n’est pas de pousser le mix bus au maximum, mais de conserver un signal propre, lisible et encore exploitable pour la suite.

Cela ne veut pas dire, pour autant, qu’un mix doive rester sage, léger ou peu travaillé. Un mix peut au contraire être déjà très construit, avec des bus de voix ou d’instruments denses, une compression assumée, et des traitements qui apportent de la tenue, de la couleur ou du caractère, y compris à travers des outils numériques inspirés de machines analogiques comme le LA-2A, le 1176 ou le Zener Limiter.

La question n’est donc pas d’éviter la densité, mais de savoir où elle se situe.

Un mix peut être compact, énergique, déjà très musical, sans pour autant venir taper 0 dBTP en sortie. La marge utile doit surtout rester visible à la sortie du mix bus. Autrement dit, la dynamique globale ne dépend pas seulement du niveau du bus master : elle se joue aussi dans la manière dont les bus s’équilibrent entre eux, dans la hiérarchie entre les éléments, et dans les choix de niveau qui organisent réellement le mix.

Un mot sur les LUFS

Puisque l’on parle de niveau, cela vaut la peine de préciser rapidement ce que mesurent les LUFS.

Les LUFS, pour Loudness Units relative to Full Scale, ne mesurent pas simplement un pic instantané, mais une impression globale de loudness dans le temps, d’une manière plus proche de ce que l’on perçoit à l’écoute. C’est ce qui les rend utiles lors du mixage, notamment pour éviter de pousser un morceau jusqu’à un niveau déjà trop dense ou trop écrasé avant même le mastering.

Il est utile de ne pas les confondre avec d’autres repères :

  • dBFS : niveau numérique par rapport au maximum possible
  • dBTP : estimation des true peaks, c’est-à-dire des pics réels pouvant apparaître entre les échantillons
  • LUFS : mesure de loudness perçue sur une durée plus ou moins longue

Autrement dit, les LUFS ne remplacent ni la lecture des crêtes, ni le contrôle des true peaks, mais ils donnent un repère très utile pour juger si un mix est déjà trop poussé dans son niveau global.

Lors du mixage, garder un niveau global raisonnable, par exemple autour de -14 à -16 LUFS intégrés sur une production dense, permet souvent de conserver un headroom plus sain et d’aborder l’étape suivante dans de meilleures conditions.

Ce repère ne doit toutefois pas être compris comme une invitation à faire un mix timide ou sans matière. Un morceau peut parfaitement rester dense, tenu et déjà très incarné dans cette zone, à condition que cette densité vienne d’un vrai travail d’équilibre, de compression, de texture et de hiérarchie entre les éléments, et non simplement d’un niveau de sortie du mix bus trop élevé.


Julien Courtois