En SDR, les hautes lumières sont très souvent compressées à une étape ou l’autre de la chaîne de production, soit directement dans la caméra, soit en postproduction. C’est essentiellement pour ces hautes lumières que la réserve de luminosité est mise à contribution.
Pour être plus précis, la luminosité moyenne des images HDR n’est pas nécessairement plus importante qu’en SDR, l’importante réserve disponible étant mise à contribution pour la diffusion d’images plus réalistes. Les lumières spéculaires et les réflexions sont présentes dans l’image et ne sont plus autant compressées ou « brûlées » qu’en SDR.
Métadonnées, je t’aime… ou pas
Deux choix (si j’osais, je dirais deux visions) s’affrontent. Les technologies Dolby Vision, HDR10 et HDR10+ font appel à des métadonnées pour piloter l’écran afin d’afficher correctement l’image en fonction de ses caractéristiques, des caractéristiques de l’écran utilisé pendant l’étalonnage du programme et de celles de l’écran final.
Dolby Vision a été le pionnier du HDR. Cependant, l’important coût financier des licences et du matériel Dolby nécessaires pour la postproduction et l’étalonnage des programmes, mais également imposé aux constructeurs de télévision à qui Dolby demande le paiement de royalties importantes pour l’utilisation de sa technologie Dolby Vision, ont incité de nombreux industriels (dont Samsung, LG, Sharp, Sony, Vizio…) à adhérer au standard HDR10 concocté par la CTA (Consumer Technology Association, également éditrice du CES, le Consumer Electronic Show).
HDR10 est ainsi devenu le format le plus populaire actuellement, même si sur le papier le format Dolby Vision est plus ambitieux avec une quantification vidéo en 12 bits.
Dolby Vision et HDR10
En SDR, les composantes de l’image vidéo sont corrigées avec une courbe de gamma mise en place à l’origine de la création du signal de télévision pour compenser la non-linéarité de réponse à la lumière des tubes cathodiques. En HDR, cette courbe de gamma est abandonnée au profit d’une fonction de transfert PQ (Perceptual Quantizer) ou Hybrid Log-Gamma (HLG).
Pour désigner les fonctions de transfert PQ ou HLG, vous trouverez également dans la littérature consacrée au HDR le terme EOTF qui signifie electro-optical-transfer-function.
C’est Dolby Vision qui est à l’origine du Perceptual Quantizer publié sous la référence SMPTE ST 2084. Cette fonction de transfert permet l’affichage de vidéo HDR avec une luminosité pouvant atteindre 10 000 cd/m².
En résumé, la norme Dolby Vision utilise la fonction de transfert PQ, une quantification des composantes couleurs 12 bits, l’espace colorimétrique Rec. 2020 et l’utilisation de métadonnées dynamiques.
Les écrans de référence qui doivent être utilisés pour la préparation de programmes Dolby Vision doivent également présenter actuellement un pic de luminosité de 4 000 cd/m² minimum (des écrans plus lumineux devront être utilisés lorsqu’ils seront disponibles).
Le format HDR10 Media Profile utilise également la fonction de transfert PQ et l’espace colorimétrique Rec. 2020, mais avec une quantification des composantes couleurs 10 bits, un sous-échantillonnage chromatique 4:2:0 et des métadonnées statiques SMPTE ST 2086, MaxFALL, et MaxCLL.
Pour le HDR10+ les métadonnées sont dynamiques comme avec le Dolby Vision ; les contrastes sont plus saisissants et variables d’une scène à l’autre ou d’un plan à l’autre.
Le HDR10+ et le Dolby Vision imposent l’utilisation de matériel compatible, mais le HDR10+ reste libre de droit.
Hybrid Log Gamma ou HLG
Ce format a été développé conjointement par la BBC et la NHK dès 2014 pour contrer deux problèmes importants à leurs yeux. Premièrement, ces broadcasters souhaitaient un format directement diffusable en live (format broadcast sans postproduction !), ce que ne propose aucun des autres prétendants. Ils regrettaient également que les formats Dolby Vision et HDR10 et 10+ ne soient pas directement compatibles avec les téléviseurs SDR imposant la production de programmes HDR et SDR en parallèle.
Au lieu de partir d’un signal HDR comme pour les autres formats, HLG propose un signal SDR lisible par tous les téléviseurs auquel sont ajoutées des informations pour le rendu du signal HDR sur les téléviseurs qui en sont capables.
Le nom Hybrid Log Gamma vient de là : on ajoute au signal SDR traditionnel utilisant une courbe gamma un signal utilisant une courbe logarithmique pour la luminosité additionnelle : le log et le gamma du HLG… CQFD.
Les broadcasters anglais et japonais de la BBC et de la NHK souhaitaient éviter un format intégrant des métadonnées pouvant être perdues « en route », ou un codage trop complexe non synchronisé avec les images potentiellement responsables d’un affichage incorrect des couleurs. Le HLG peut même être affiché sur les anciens téléviseurs, HD, voire SD.
Parmi les autres avantages (en tout cas pour les créateurs de contenus), la majorité des équipements actuels des studios peuvent être utilisés avec quelques légers changements pour le HLG.
Donc la technologie HDR offre des images plus lumineuses que le SDR ?
Oui et non. Contrairement à une idée générale, entretenue par les équipes marketing, les images HDR ne sont pas prévues pour être plus lumineuses en moyenne. La réserve lumineuse supplémentaire par rapport aux moniteurs SDR est dédiée aux détails dans les hautes lumières : les réflexions, les hautes lumières du feu, les détails dans les nuages. Bien entendu l’étalonneur pourrait à priori utiliser la marge disponible via cette technologie selon ses envies, mais ce serait souvent contreproductif par rapport aux ambitions initiales du HDR.
Il est d’ailleurs à noter que la majorité des téléviseurs, et même des moniteurs d’étalonnage dédiés au HDR, ne permettent l’affichage des plus hautes lumières que sur une zone restreinte de l’image. Grâce à sa technologie particulière le moniteur Eizo CG3145 est l’un des seuls capable d’encaisser des hautes lumières sur une zone étendue de l’image (le moniteur utilise un éclairage « par pixel »).
Même si les argumentaires commerciaux mettent également en avant une amélioration dans les noirs, le véritable gain visuel se situe essentiellement dans les hautes lumières.
En HLG, la première partie du signal est décrite par une courbe en « correction de gamma » similaire au signal SDR. C’est la quantification plus fine, en 10 ou 12 bits qui peut améliorer les résultats dans cette zone de l’image.
Reparlons également des valeurs de luminosité moyenne des écrans. En SDR, les normes originelles ont été créées sur une base de luminosité maximale de 100 nits. Les programmes sont étalonnés sur des écrans calibrés autour de 100 à 120 nits de luminosité maximum.
Cependant, la technologie SDR étant « relative », lorsque l’on visionne les images sur un écran SDR sous des conditions d’éclairage ambiant assez lumineuses, les moniteurs récents permettent un affichage des images avec une luminosité sensiblement plus grande (entre 300 et 500 nits) ; l’étagement des zones tonales de l’image s’adapte à ce réglage.
La technologie HLG étant également relative, elle permettra ainsi de s’adapter à l’éclairage ambiant.
Pour les technologies comme Dolby Vision, HDR10 ou HDR10+, la description absolue des luminosités de l’image prévue dans les métadonnées n’est pas conçue pour permettre une adaptation de l’affichage aux conditions d’éclairage. Cela pourra être le désavantage de ces technologies pour la visibilité des images sous des éclairages intenses comme on peut en trouver dans un séjour lumineux. Ces technologies seront, à l’opposé, très précises et réalistes, notamment le Dolby Vision et ses 12 bits, pour l’expérience d’un vidéophile possédant un home-cinéma correctement calibré.
Plus on est de fous…
Pour ne pas simplifier la visibilité d’un marché qui a fort à faire avec les normes actuelles, pas encore digérées ni par le public ni par les fabricants, deux prétendants souhaitent proposer leurs solutions.
La marque française Technicolor, basée à Issy-les-Moulineaux, a développé sa technologie propriétaire qui va être intégrée courant 2019 dans des téléviseurs grand public (Philips et LG).
En fait, la solution de technicolor n’est pas nouvelle ; et technologiquement ses avantages semblent alléchants, même si les informations à notre disposition restent limitées.
En effet, à la différence des autres formats, la technicolor advanced HDR solutions peut traiter des contenus HDR, mais également SDR ou des flux de caméras HDR HLG ou SDR. Le puissant traitement d’image permet même de partir de sources SDR, en respectant, d’après le fabricant, les intentions du réalisateur.
Eclair propose une solution dédiée aux salles de cinéma, Eclair Color, qui combine la préparation d’un master dédié et l’optimisation de projecteurs de cinéma numériques Sony Digital Cinema 4K et Barco.
Eclair souligne que les étapes de création du HDR étant faites pendant la réalisation du master, rien ne change au tournage. Le master est également réalisé sous le contrôle artistique du réalisateur et du chef opérateur pour conserver les intentions initiales du réalisateur.
Pourquoi Dolby utilise du PQ pour le HDR
Si, depuis les années 30, la courbe de correction de gamma a été conservée dans les normes télévisuelles, c’est qu’en plus de répondre à un besoin technologique elle est également représentative de la réponse de l’œil à la lumière qui fonctionne d’une manière logarithmique : cette courbe de gamma fut donc un avantage pour l’encodage du signal de télévision en SDR, en SD, en HD et même en UHD.
Plongeons-nous un petit peu dans les équations mathématiques (promis, un tout petit peu). L’écran cathodique est un grand tube en verre sous vide d’air, un canon à électrons les envoie (les électrons… suivez un peu) vers la surface de l’écran. Un ensemble de luminophore réagit à ce bombardement d’électrons en créant de la lumière.
L’intensité lumineuse est liée à la tension émise aux bornes du canon à électrons, avec une réponse non linéaire, le fameux gamma : où I est la luminosité de l’écran et Vs la tension source aux bornes du canon à électron.
À l’époque des débuts de la télévision, si les téléviseurs étaient peu nombreux, les caméras l’étaient encore moins. La correction de gamma qui permettait de retrouver la linéarité du signal retransmis avait alors été implémentée au sein des caméras pour éviter d’alourdir le prix des postes de télévision.
La correction suivait sensiblement l’équation suivante : = Vc0,45
La correction de gamma valait 0,45 pour un gamma de 2,4.
Les véritables équations décrivant le signal vidéo sont un peu plus complexes ; avec notamment une réponse différente sur le tout début de la plage lumineuse.
Le gamma fonctionne très bien, pourquoi le changer ?
Eh bien justement, le gamma fonctionnait relativement bien avec pour des écrans à niveaux de luminosité relativement bas et avec une plage de dynamique restreinte.
C’est pour cela que des courbes de transfert (EOTF) ont été mises au point pour le HDR. Les travaux de Barten sur la sensibilité au contraste de l’œil humain ont notamment servi à l’élaboration de PQ. Le but étant d’optimiser l’encodage du signal pour qu’une quantification relativement modeste (12 bits pour le DolbyVision; , 10 bits pour le HDR10 et le HDR10+), suffise à présenter à l’œil humain des échelles de tons qu’il ne percevra pas (pour éviter les phénomènes de banding et la dégradation de la qualité perceptive de l’image).
Le HLG, pour sa part, utilise deux fonctions de transfert, la partie des lumières plus basses est décrite par une EOTF similaire au signal SDR avec correction de gamma ; c’est ce qui permet la compatibilité totale et directe du HLG avec le matériel SDR. Les hautes lumières sont gérées par une courbe logarithmique.
TRoisième partie du dossier demain…
Extrait de l’article paru pour la première fois dans Mediakwest #28, p.34/42. Abonnez-vous à Mediakwest (5 numéros/an + 1 Hors-Série « Guide du tournage ») pour accéder, dès leur sortie, à nos articles dans leur intégralité.