OTT, Over The Top, « par-dessus », possède en fait une double définition. La première, technique, n’est pas discutable. Elle correspond à la diffusion de la vidéo sur Internet et renvoie au fait que les protocoles liés à la diffusion de celle-ci se situent au-dessus de la pile des protocoles classiques de l’Internet et notamment de l’IP. La seconde, économique, est plus polémique : elle définit OTT comme une position stratégique dans la chaîne de valeur qui utilise des infrastructures développées par d’autres pour offrir un service. On l’aura compris, elle témoigne des angoisses des opérateurs Télécom qui voient exploser la consommation de vidéo sur leurs réseaux.
En effet, le Visual Networking Index 2001-2015 de Cisco prévoit que la vidéo représentera 62% du trafic internet grand public en 2015. Il envisage un triplement de la VoD sur cette période. Sa mise à jour 2011-2016 note que la vidéo représentait déjà 52% du trafic internet mobile fin 2011.
Un peu de technique d’abord
Internet fonctionne par empilement de couches de protocoles qui gèrent respectivement les aspects physique, réseau, transport puis les processus utilisateurs (les applications). La vidéo vient par-dessus (notamment la compression). Mais son histoire a connu quelques allers et retours.
Au commencement était HTTP, le protocole de téléchargement des pages web qui découpe l’information en paquets et via TCP, un protocole de contrôle fiable mais lourd et, par conséquent, lent, vérifie leur bonne transmission. Mais, à l’origine, la lecture ne pouvait démarrer qu’une fois le fichier complet téléchargé, ce qui était inadapté pour la diffusion en temps réel de flux vidéo.
On peut dater les vrais débuts de la vidéo sur Internet à 1997 et à l’annonce de RealVideo, la solution de streaming vidéo de RealNetworks. L’idée était d’avoir recours, pour le streaming, à un protocole simplifié, UDP, qui fonctionne « au fil de l’eau » sans contrôle des erreurs. Mais pour jouer la vidéo, il fallait aussi une télécommande, rôle généralement dévolu au protocole RTSP. Mais RTSP utilise un port dédié qui est souvent bloqué par les routeurs ou les pare-feux d’entreprise. Problème croissant à mesure que l’accès au réseau se généralisait.
L’acheminement du programme se fait selon le modèle Internet dit du « Best Effort », au mieux de l’encombrement du réseau, sans aucune garantie de qualité de service. Autant dire que la qualité de l’expérience utilisateur s’en est longtemps ressentie, avec des imagettes de faible résolution et de dimension réduite et des gels d’image fréquents et pénalisants.
Le vrai décollage de la vidéo date de 2005 avec l’apparition de YouTube et Dailymotion. Progressivement, les accès Internet sont devenus haut débit et les techniques (de compression comme de transmission) ont progressé. On vit ainsi apparaître le Progressive Download, permettant de commencer à lire le fichier vidéo pendant son téléchargement. La qualité s’est améliorée spectaculairement. Flash d’Adobe et H.264 sont devenus les protocoles de compression vidéo (et donc aussi de lecture) les plus utilisés avec, dans une moindre mesure, Windows Media. Du fait des débits accrus, on a redécouvert l’intérêt du HTTP streaming pour franchir les pare-feux. Pour gérer l’encombrement du réseau, les fournisseurs de contenus ont fait deux choses : offrir à l’utilisateur le choix (fait dès le départ) de divers niveaux de qualité, s’abonner à des CDN, Content Delivery Networks comme Akamai, prestataires de services disposant de serveurs de cache à travers le monde, positionnant le contenu au plus près du destinataire.
Une approche dynamique, l’Adaptive Streaming
Un progrès supplémentaire a été accompli en 2010 avec l’apparition de l’Adaptive Streaming. Plutôt que de proposer 2 ou 3 niveaux de qualité globalement pour le programme, on découpe celui-ci en petites tranches qui sont chacune encodées à divers niveaux et transmises via HTTP permettant au terminal de l’utilisateur de piloter dynamiquement, en temps réel, la qualité de ce qu’il voit en fonction des variations du réseau. L’utilisateur dispose ainsi, à chaque instant, de la meilleure qualité possible et on limite les risques de gel. Les trois solutions les plus utilisées sont HLS, pour HTTP Live Streaming d’Apple, Smooth Streaming de Microsoft et Dynamic Streaming d’Adobe.
Problème : tout fournisseur de contenu désireux d’être présent sur Internet doit désormais encoder d’au moins une douzaine de façons différentes (et souvent davantage) chaque programme pour être sûr de pouvoir toucher les différents terminaux. Fin 2011, le groupe MPEG a normalisé DASH (Digital Adaptive Streaming over HTTP), agnostique vis-à-vis des codecs vidéo, censé simplifier cela. Des outils DASH commencent à apparaître. Toutefois, de gros acteurs comme Apple ou Google, après avoir participé aux travaux de standardisation, ne se sont pas encore précipité pour annoncer qu’ils l’adopteraient.
IPTV
La TV sur IP, est-ce de l’OTT ? Non, même si la différence est techniquement mince. La confusion est particulièrement sensible en France du fait du modèle intégré de box proposé par Free dès 2003 avec le Triple Play. Aux États-Unis, les choses sont plus simples : on a un fournisseur d’accès qui propose un modem (ADSL ou autre) pour l’accès Internet, et des boxes pour accéder aux contenus proposés par divers fournisseurs spécialisés (ex Netflix). En France, la box fait tout : raccordée au PC, à la console (et désormais à la TV connectée), elle joue son rôle de modem et offre les accès aux ressources vidéo de l’Internet. Raccordée directement au téléviseur, elle permet de recevoir les émissions des chaînes et le bouquet de programmes, notamment VoD, du fournisseur d’accès Internet (FAI). La première situation, c’est de l’OTT ; la seconde de l’IPTV.
Les différences sont mineures sur le plan technique (l’IPTV utilise le protocole de transport de MPEG dont ne disposent pas la plupart des PC) mais ont des conséquences importantes. Contrairement au Best Effort de l’OTT, l’opérateur Télécom offre une qualité de service minimum, gérant de manière privilégiée une portion de son réseau d’accès chez l’utilisateur. On parle de réseau managé.
En clair, dans la plupart des foyers français, on peut recevoir la même chaîne de TV d’au moins trois manières : en direct via la TNT ; via l’offre IPTV de son FAI ; sur son PC, son smartphone ou sa console en mode OTT (et éventuellement sur sa TV en mode TV connectée). Simple. L’embarras du choix mais avec des qualités variables.
Les services
Pour ajouter à la confusion, on peut le plus souvent retrouver des services voisins en OTT et en IPTV et les différences de qualité s’amenuisent à mesure que le très haut débit se développe. C’est le cas pour l’offre de VoD, gratuite ou payante, à l’acte ou bien en mode SVoD, forfaitaire par abonnement. C’est aussi le cas pour les services de complément des chaînes dits de « Catch Up TV » (TV de rattrapage) correspondant à des programmes dont les chaînes de TV ont négocié les droits pour une diffusion complémentaire pendant un certain laps de temps après leur passage à l’antenne. Ces services de « magnétoscope virtuel » sont très prisés du public comme en témoigne le succès en France ou, au Royaume-Uni, de l’iPlayer de la BBC.
Les FAI gardent encore pour quelque temps l’avantage sur ce plan avec leurs PVR (Personal Video Recorder) intégrés dans les plus évoluées de leurs Set Top Boxes ou proposés en mode virtuel en réseau (on parle alors de nPVR, ou networked PVR). Il en est de même pour d’autres services de convenance comme la « diffusion décalée », la Time Shift TV ou la « Pause & Call TV » ou encore la « Start Over TV » permettant de démarrer en retard le visionnage d’un programme quelques minutes après que sa diffusion en direct ait commencée. Certains opérateurs ont également envisagé des dispositifs de Push VoD, poussant sur la STB, durant les périodes creuses du réseau, des contenus considérés comme devant intéresser l’utilisateur en fonction de ses profils antérieurs de consommation.
L’avantage pourrait être de courte durée. Les services HbbTV, visent à ramener ces services sur le téléviseur connecté, en mode OTT, redonnant ainsi aux chaînes le contrôle sur les modes complémentaires d’exploitation de leurs programmes. Et il est clair que c’est, de toute manière, l’approche OTT qui se développe davantage que l’IPTV.
La délinéarisation de la télévision
La situation est toutefois loin d’être assurée pour les chaînes de TV. Les grandes manœuvres s’engagent entre tous les acteurs (grands acteurs de l’Internet, opérateurs Télécom, broadcasters, détenteurs de contenus…) dans la perspective de recompositions importantes de la chaîne de valeur.
Les opérateurs Télécom craignent d’être ravalés au rang de simples fournisseurs de connectivité, une commodity comme l’électricité. Certains disent même que c’est inéluctable. En attendant, ils s’efforcent de retarder l’échéance et de ramener de la valeur dans leurs réseaux, par exemple en modifiant son architecture pour installer leurs propres CDN afin d’alléger le trafic interne ou en cherchant à valoriser les statistiques d’usage de leurs abonnés pour en tirer des profils permettant de cibler plus étroitement les publicités.
Ils cherchent aussi les moyens de faire payer les purs acteurs de l’Internet tels Google ou Apple qui valorisent leurs propres services sans contribuer aux investissements nécessaires du réseau à proportion de leur trafic. Les plus virulents des FAI parlent à leur propos de « voyageurs clandestins », ne payant pas leur transport, en rêvant à un partage moins inégal des revenus. En attendant, ils sont bien décidés à ne pas reproduire « l’erreur » de l’Internet fixe et à ne plus proposer des forfaits vraiment illimités pour les mobiles.
Les chaînes de TV se voient menacées d’une autre manière. Si leurs programmes sont accessibles sur Internet au libre choix du spectateur, pourquoi les regarder en direct, sauf pour quelques rares grands évènements fédérateurs ? Pourquoi ne pas aller au bout de la délinéarisation ? Pourquoi les producteurs ne valoriseraient-ils pas directement leurs catalogues sur Internet ou via les App Stores des grands acteurs ? Et pourquoi laisser aux chaînes ces fréquences hertziennes si précieuses pour les opérateurs Télécom qui souhaitent développer les nouvelles générations de mobiles ? Et dont les moyens financiers – et donc le lobbying – sont sans commune mesure avec les leurs ? Sans parler des Apple TV et autres Google TV qui, pour l’instant, c’est vrai, ont déçu. Mais pour combien de temps ? Les broadcasters commencent à prendre conscience des dangers et à se mobiliser globalement, le forum FoBTV sur l’avenir de la TV en témoigne. Des initiatives comme HbbTV vont aussi dans ce sens mais bien timidement et tardivement (et l’Europe avance encore en ordre dispersé).
Les fabricants de TV ou de terminaux, quant à eux, se rêvent aussi en gestionnaires d’App Stores sur leurs Smart TV et, de ce point de vue, ne sont pas nécessairement des alliés naturels pour les diffuseurs.
Quant aux grands acteurs de l’Internet, ils ont engagé l’affrontement sur tous les terrains, n’hésitant pas à investir avec le succès que l’on sait le domaine de la téléphonie ou à se battre pour recomposer les cartes dans le domaine de la technologie vidéo. On a ainsi vu Apple ostraciser Flash de tous ses équipements, alors même que Flash était de très loin le mode le plus populaire de consommation de la vidéo. Et quelques mois plus tard, Adobe reculait, annonçant qu’il ne développerait plus Flash pour les mobiles, ce que beaucoup ont traduit comme un futur désengagement pur et simple. On a aussi vu Google annoncer en mai 2010 une guerre des codecs en promouvant webM (solution libre fondée sur le codec VP8 de la société ON2 qu’il avait rachetée) contre H.264 (qu’utilise Apple). Google annonçait même que Youtube allait renoncer à H.264. Quelques mois plus tard, rétropédalage en souplesse. WebM n’a pas pris. Même ses alliés initiaux comme Firefox de Mozilla font aujourd’hui marche arrière. Mais la guerre pour la prééminence n’est pas terminée. Tous les terrains sont bons.
Et les régulateurs nationaux ? Ils ont pu jouer un rôle important pour la TV sur IP car on se situait dans un cadre national. Les régulateurs japonais ou coréens ont ainsi bloqué longtemps le développement de services d’IPTV alors que l’infrastructure en fibre optique était largement déployée. À l’inverse, l’ARCEP a joué en France un rôle déterminant pour le développement de l’ADSL et des offres Triple Play. Toutefois ils apparaissent désormais assez démunis (même si en France, le CSA fait figure de pionnier par rapport à ses homologues européens) face à l’OTT et ses mastodontes mondiaux.
La révolution pour demain ?
Les grandes évolutions prennent du temps. Il y a généralement un fossé immense entre la vision et sa pleine réalisation.
La VoD et la TV interactive remontent à 35 ans avec la première expérience américaine de quasi vidéo à la demande par câble Qube, à Columbus, dans l’Ohio en 1977 qui proposait 30 canaux dont 10 interactifs. En France, à Biarritz, fin 1980, l’ancêtre de France Telecom met en place une « vidéothèque » analogique chez 1500 abonnés à la fibre (déjà)… En 1991, Time Warner offre 150 canaux à ses abonnés du service Quantum dans le Queens à New York dont près de 60 canaux de nVoD, avant de mener trois ans plus tard une expérimentation décevante de vraie VoD à Orlando, le Full Service Network. La vision des innovateurs voulant augmenter la liberté de choix était bonne, la capacité de la technologie à tenir ses promesses largement sous-estimée.
Les choses semblent différentes aujourd’hui et les technologies presque matures. Mais il faut aussi se souvenir des leçons des sciences de l’information et de la communication. Quasiment jamais dans l’histoire de l’innovation, une nouvelle technologie ou un nouveau mode d’organisation ne remplace brutalement l’ancien. Au contraire, il commence par le compléter et la période de coexistence et de transition dure souvent bien plus longtemps qu’on ne le pense. Les chaînes de télévision ont encore de l’avenir.