Dossier HEVC : où en est-on ? (article et Web TV)

18 mois après sa publication, la norme de compression HEVC s’affirme comme un indéniable succès. Le point sur son évolution.
HEVC_evolution.png

 

C’est fin janvier 2013 qu’a été finalisée la première version de la norme HEVC (ISO/IEC 23008-2), également connue comme H.265. S’inspirant de l’approche boîte à outils de sa devancière H.264 qu’elle devrait remplacer progressivement, elle proposait initialement trois Profils : Main Still Picture, Main et Main 10. Les deux derniers ont donné lieu à des développements importants. Destinés à la diffusion vidéo, ils supportent le 4:2:0 avec un codage sur 8 ou 10 bits. Comme H.264, ces Profils se décomposent en Levels définissant, pour un Profile donné, des contraintes pour certains paramètres du flux de données (notamment vis-à-vis du buffering). Couvrant du QCIF à l’UHD 8K, les Levels les plus caractéristiques sont le 4.1 (pour le full HD 1080p50 ou 60), le 5.1 (pour l’UHD-1 en 2160p50 ou 60), le 5.2 (pour une UHD HFR 2160 p100 ou 120) et le 6.2 pour la future UHD-2 en 4320 x7680 à 120 i/s.

Originalité par rapport à H.264, chaque Level, à partir du niveau 4, se décline en deux Tiers, respectivement Main et High pour des applications ne différant que par le débit max ou la taille du buffer (cf. schéma).

 

Une évolution particulièrement rapide

Comme toutes les normes de compression MPEG, HEVC ne normalise pas l’encodage (mais seulement les formats, la syntaxe et la structure du flux de données ainsi que, d’autre part, les caractéristiques d’un décodage de référence). Cela permet à chaque fabricant de concocter sa propre sauce en implémentant, complètement ou non (et généralement progressivement), la panoplie d’outils utilisables. C’est ainsi que MPEG-2 puis H.264 nous avaient habitués à une montée en puissance des performances dans la durée allant de pair avec la mise en œuvre progressive des outils les plus complexes (nécessitant davantage de ressources de calcul). Des progrès qui se poursuivent aujourd’hui encore.

HEVC bouscule ce calendrier. Deux exemples illustrent bien cette accélération spectaculaire. Le projet de R&D 4EVER que pilotent les Orange Labs, lancé en juin 2012 pour trois ans, prévoyait parmi ses livrables que le partenaire chargé des encodeurs, Ateme, fournisse un outil HEVC temps réel avant la fin du projet. Mais cela concernait à l’origine un encodeur HD. En avril 2014, au NAB, Ateme a montré un prototype de cet encodeur mais en UHD, 2160p60. Benoît Fouchard, Chief Strategy Officer d’Ateme résume : « HEVC a fait en 18 mois ce qui avait nécessité près de quatre ans avec H.264 en termes d’encodage, de décodage et d’interopérabilité. » À l’IBC, on a pu voir les premières STB avec décodage par silicium.

Deuxième illustration. HEVC affichait la promesse d’offrir, à terme, 50 % de réduction des débits, à qualité constante, par rapport à H.264. Les résultats des tests conduits par la BBC, NTT et d’autres, présentés à l’IBC par Ken McCann de Zetacast, ont montré que c’était en passe d’être réalisé. Ces tests ont porté sur une évaluation subjective normalisée de 20 séquences couvrant un échantillon de résolutions (de 480p à 2160p), chaque séquence étant évaluée à quatre débits différents, comparant le High Profile de H.264 et le Main Profile de HEVC. Les débits nécessaires avec HEVC n’ont représenté en moyenne que 41 % de ceux utilisés pour H.264 à qualité subjective équivalente, soit un gain de 59 %. Comme prévu, l’efficacité d’HEVC a été d’autant plus forte que la résolution était élevée, croissant régulièrement de 52 % pour la SD à 64 % pour l’UHD en passant par 62 % pour le 1080p (cf. Schéma). Cela est dû au fait que les nouveaux outils de l’arborescence de codage (coding tree) de HEVC donnent alors toute leur mesure.

Ces gains offrent trois catégories d’avantages, au besoin cumulables : faire plus ; payer moins ; faire mieux. Ils permettent soit, à qualité constante, de multiplier le nombre de chaînes diffusées du fait de la baisse des débits nécessaires (et/ou d’étendre la couverture ADSL, augmentant d’autant le public potentiel) ; soit de poursuivre la diffusion des programmes OTT tels qu’ils existent en diminuant les coûts de CDN, donc de la diffusion, tout en limitant l’engorgement des réseaux ; soit d’augmenter la qualité en transformant en HD des chaînes SD (ou d’améliorer la HD en passant du 1080i au 1080p) à budget débit constant mais aussi de rendre crédible la diffusion en UHD sur réseaux IP ou DVB-S2 et T2.

Les débits effectivement utilisés lors des premières diffusions expérimentales d’UHD ont toutefois été moins spectaculairement réduits, du fait de la marge de sécurité prise. Les gains les plus importants observés étaient plutôt de l’ordre de 30 à 35 %. Mais ce pourcentage est appelé à croître rapidement.

 

Des technologies matures

C’est peut-être le point le plus marquant. Si l’UHD compressée en HEVC a fait l’objet d’un nombre appréciable d’expérimentations ponctuelles à l’occasion d’évènements spectaculaires ou de campagnes d’essais ainsi que d’une diffusion limitée de programmes enregistrés (et donc encodés off line) sur des chaînes expérimentales ou par Netflix aux USA, elle a également fait l’objet de tests de télévision en direct en vraie grandeur, dans la durée, extrêmement proches des vraies conditions opérationnelles d’exploitation. Non seulement ces tests ont permis de mettre en évidence la qualité et la stabilité des encodeurs HEVC mais aussi, et c’est tout aussi important, l’interopérabilité avec les STB ou les décodeurs des TV (haut de gamme mais standards) utilisés. On se souvient que cela avait été très loin d’être le cas lors des tests de H.264, imposant un long travail de clarification avant que la norme soit jugée stable. Et ces tests ont aussi montré la capacité des réseaux actuels à diffuser de l’UHD.

Le premier d’entre eux s’est déroulé à l’initiative de France Télévisions, en juin 2014, à l’occasion de Roland Garros. Durant une dizaine de jours, la couverture du tournoi a été assurée en permanence en UHD-1 phase 1. Trois fabricants d’encodeurs avaient été sélectionnés et trois réseaux de diffusion utilisés. Envivio, avec son logiciel Ultra HD Envivio Muse tournant sur Envivio G5, assurait l’encodage transmis par fibre optique à l’émetteur TDF de la tour Eiffel pour une diffusion expérimentale en DVB-T2 ; Ateme, avec son Titan Live, alimentait le satellite Eutelsat E5WA en DVB-S2 ; la start-up rennaise BBright, quant à elle, faisait de même pour Internet avec son SLED-4K. Un dispositif expérimental d’autant plus convaincant que le tennis est un sport exigeant s’agissant de la compression.

Autre test éprouvant et significatif, la Coupe du Monde de football. Au-delà des opérations de prestige, celle-ci a notamment fait l’objet d’une diffusion en direct de matchs phares en UHD par la BBC et sur trois réseaux TNT en Corée. Les chaînes de traitement étaient complexes, associant transmission en Quad Split (quatre images 1080p encodées en H.264 et juxtaposées formant une image UHD) et/ou utilisation d’HEVC. Pour la Corée, Ateme assurait ainsi l’encodage de contribution sur 10 bits ainsi que la diffusion sur l’un des réseaux (en 8 bits du fait de la limitation des premiers téléviseurs disponibles). Le Mondial a aussi fourni l’occasion de valider le fonctionnement de HEVC avec MPEG DASH pour le streaming adaptatif.

Ces tests ont permis de valider le choix de certains paramètres pour l’UHD. Si le 2160p25 ou 30 donne des résultats acceptables pour la diffusion de films en VoD (encodés off line avec des débits assez bas), il n’est pas suffisant pour les émissions en direct et tout particulièrement le sport qui exige un minimum de 50 ou 60 images/s. De même, l’encodage au Profile Main 10 sur 10 bits apparaît le gage d’une UHD de qualité. C’est ce que préconise le DVB pour l’UHD-1 phase 1 : le 2160p50 ou 60 sur 10 bits.

Lors des tests en configuration opérationnelle, les encodeurs Live HEVC 4:2:0 en 2160p50 ou 60 sur 10 bits étaient des encodeurs logiciels. Les débits de diffusion actuels nécessaires se situent dans la fourchette 18-25 Mbits/s (un ordre de grandeur comparable à celui de la HD au démarrage du MPEG-2). Une prochaine étape d’évolution verra aussi apparaître des solutions hardware. D’ores et déjà, on a vu à l’IBC les premières STB intégrant un chip pour le décodage HEVC. D’autre part, HEVC continue d’évoluer.

 

La norme s’enrichit

Lors du 109ème meeting MPEG à Sapporo, en juillet dernier, les travaux ont été finalisés pour trois extensions de MPEG s’inspirant des précédents pour H.264 et qui devraient donner lieu prochainement à la publication d’une version 2 de la norme. Il s’agit de Range Extensions (RExt), Multiview (MV-HEVC) et Scalable (SHVC).

À l’image de ce qui s’était déjà passé pour H.264, les versions dites Range Extensions visent des codecs augmentant l’échantillonnage et les formats de codage pour la contribution ou la production. Aux versions 4:2:0 Main et Main 10, viennent s’ajouter des versions Main 4:2:2 sur 10 ou 12 bits et 4:4:4 sur 10, 12 et 16 bits Intra. Ces versions vont introduire de nouveaux outils qui n’étaient pas supportés antérieurement par les Profils Main et Main 10 (cf. tableau). On peut s’interroger sur l’intérêt technique d’un profil de contribution 4:2:2 sur 10 bits pour HEVC par rapport au Main 10 (le 4:2:2 sur 10 bits avait été introduit dans H.264 pour contrebalancer les inconvénients du mode entrelacé, ce qui est sans objet pour HEVC et son mode progressif). Mais des versions vont sans doute apparaître. Dès l’IBC, NTT montrait l’UHD-1000, un premier décodeur RExt en 4:2:2 sur 10 bits.

Le MV-HEVC aura probablement moins de concrétisations, du moins dans un premier temps. Ce Profil a pour objet la diffusion des vues 3D Stéréo et bénéficie d’outils spécifiques de compression inter-vues ainsi que d’évolutions vers de nouveaux codages (prise en compte de la profondeur). Allegro DVT propose déjà des flux de référence pour tester la conformité des outils RExt et MV-HEVC.

Le Profil scalable SHVC aura-t-il plus d’impact que son prédécesseur H.264, en pratique jamais déployé et dont il reprend pourtant la philosophie ? C’est possible. Comme lui, il se compose d’une couche de base (correspondant au Profil Main ou Main 10) et de couches d’amélioration. Celles-ci peuvent concerner, par exemple, la résolution spatiale (permettant une transition du 1080p vers le 2160p en conservant la compatibilité pour les récepteurs HD) mais aussi la résolution temporelle. Il pourrait ainsi favoriser le passage progressif au High Frame Rate, HFR, dont le projet de R&D 4EVER a bien montré l’impact. Et cela vaut aussi bien pour du 1080p100 ou 120 que pour l’UHD-1.

D’autres évolutions concernent aussi MPEG-H. Il faut en effet se souvenir que HEVC (ISO/IEC 23008-2) n’est que la partie 2, consacrée au codage vidéo, d’une norme plus globale dite MPEG-H. La première partie (ISO/IEC 23008-1) concerne le transport et définit MMT (pour MPEG Media Transport), le remplaçant de MPEG-2 TS. MMT est conçu pour une approche hybride associant broadcast et IP. Agnostique vis-à-vis du type de codec, il permet, par rapport à son prédécesseur, à plusieurs expéditeurs d’adresser plusieurs récepteurs ; il supporte de multiples sources et la synchronisation entre plusieurs équipements et assets (notamment des éléments déjà présents dans des caches locaux) ainsi que la correction d’erreurs au niveau de la couche Application ; il permet le multiplexage dynamique de divers composants en un flux et la flexibilité au niveau de la longueur des paquets. Il intègre l’approche HTML5.

La partie 3 de MPEG-H concerne l’audio interactif et immersif. Une version 1 de ISO/IEC 23008-3 avait été finalisée en août 2013 concernant des débits compris entre 256 Kbits/s et 1,2 Mbits/s. Elle devrait être publiée en tant que norme en février 2015. Le meeting de Sapporo a sélectionné les technologies qui figureront dans la version 2 qui s’intéresse à des débits plus bas : de 48 à 128 Kbits/s. Ces technologies supportent divers formats : basé sur le canal, basé sur le canal et des objets (C+O), et basé sur une scène Higher Order Ambisonics (HOA). Les deux dernières technologies pourraient fusionner. Une version presque définitive, dite DIS pour Draft International Standard, est attendue pour juin 2015.

 

Quel avenir ?

HEVC, qui n’en est encore qu’aux prémices de son évolution, apparaît déjà comme l’exemple même d’une technologie indispensable rendant possible de nouveaux développements ou services, favorisant l’émergence de nouveaux comportements. Certaines incertitudes demeurent concernant le problème des royalties du fait que quelques grands détenteurs potentiels de droits n’ont pas encore clarifié leur position vis-à-vis des propositions de licence de MPEG LA. Mais même si ces incertitudes peuvent freiner son expansion, la question de son apport distinctif ou de son intérêt ne se pose plus.

Si l’UHD a besoin d’HEVC pour émerger, HEVC n’a pas besoin de l’UHD pour se développer. Ses premières implémentations concerneront la HD. Son intérêt sera d’abord économique ou fonctionnel (évitant la saturation des réseaux IP par ex.) avant de permettre un saut qualitatif. Ce n’est pas un hasard si Apple a déjà intégré H.265 dans le nouvel iPhone 6. Même s’il est probable qu’HEVC se développera d’abord pour des offres OTT de l’Internet fixe ou mobile avec des décodeurs logiciels téléchargés (mais plutôt sur tablettes que sur Smartphones, du fait des exigences en termes de calcul de décodage pesant sur la durée de vie des batteries), son rôle sera ultérieurement déterminant pour les évolutions de la TNT ou du satellite.

Assurément, HEVC, sera au cœur des nouveaux modes de consommation télévisuelle. 

 

Interview vidéo : Jean-Marc Thiesse, Responsable de la recherche HEVC chez ateme, présente le Standard HEVC aux lecteurs de Mediakwest