Guilhem Krier (directeur business development, Panasonic Connect Europe), Benoît Quirynen (SVP stratégie et partenariats, EVS), François Valadoux (directeur général délégué et directeur technique, AMP Visual TV), Luc Doneux (directeur business development-live production, Riedel), Étienne Godart (responsable des solutions de diffusion en direct, HBS) et Christophe Barbé (responsable de l’infrastructure broadcast, HBS) ont croisé leurs regards sur les dessous de cette opposition en marche.
État des lieux
Mediakwest : D’une manière générale, dans quelle mesure l’industrie du sport broadcast pioche-t-elle aujourd’hui dans celle de l’informatique ?
E.G. et C.B. : Le broadcast bénéficie aujourd’hui des technologies IT qui permettent la mise en œuvre d’une architecture orientée microservices (Docker et Kubernetes) pour les solutions de contrôle et de monitoring des réseaux à large bande passante transportant des flux IP (ST-2110) non compressés. Mais le monde du broadcast reste encore très spécialisé et nécessite des adaptations de ces technologies à ses besoins spécifiques. D’autre part, si des solutions software de mélange audio/vidéo sont d’ores et déjà très utilisées pour le sport, ces solutions ne sont pas encore assez puissantes ou robustes pour la couverture d’événements internationaux d’envergure.
B.Q. : Les besoins de flexibilité peuvent être plus facilement couverts par des solutions logicielles que matérielles. Les premières requièrent des technologies IP pour supporter la flexibilité. Depuis quelques années, on assiste donc à une adoption croissante de ces technologies IP dans le broadcast et des solutions plus logicielles. Chez EVS, on parle d’approche ASWAR (As SW as Reasonable). Le matériel reste néanmoins incontournable pour des fonctions d’infrastructure avec des traitements du signal en quantité massive ou pour des raisons de robustesse. L’intelligence artificielle connaît aussi une adoption croissante pour des fonctions d’assistance, voire d’automatisation de certains workflows.
L.D. : La postproduction, la création de news, les conducteurs de playout, la gestion (MAM…) et la création de contenus non linéaires (NLE) sont déjà depuis longtemps essentiellement basés software. Le point critique est la gestion du temps réel, et donc du live. Quand j’ai créé SimplyLive (ndlr : fondée en 2016, la société a rejoint l’orbite de l’allemand Riedel en septembre 2022), l’une de mes convictions était que toutes les fonctions broadcast de production live pouvaient être implémentées par software. Cela allait créer une fenêtre d’opportunité dans le marché de la production live. Il est évident que l’existence de cette fenêtre tient au fait que l’industrie IT améliore constamment les performances des CPU, GPU, RAM, SSD pour d’autres applications que la production live mais, grâce à l’amélioration des performances de ces derniers, on peut garantir l’exploitation et la production en temps réel des contenus. Aujourd’hui, toutes les fonctions de production live (mélange audio et vidéo, ralentis et highlights, gestion et utilisation des graphiques, ordres, contrôle de la vision…) peuvent être traitées en temps réel par software. Certains prestataires ou clients avancent à grands pas dans cette direction afin de s’offrir une plus grande flexibilité d’utilisation des équipements sur la base d’une même plate-forme IT.

Cloud versus rack
Dans l’écosystème du sport broadcast, dans quelle mesure les solutions proposées dans le cloud concurrencent-elles celles en mode rack ?
F.V. : Aujourd’hui, compte tenu des exigences du marché, il n’y a pas de solution cloud permettant d’égaler la puissance et les fonctionnalités des équipements dans les cars. Pour le sport premium, cela n’existe pas. Pour l’heure, on n’a pas la capacité de garantir à nos clients le même niveau de qualité qu’en mode rack. Le point bloquant est aussi d’ordre économique. Aujourd’hui, en France comme dans d’autres pays, un outil n’est pas dédié sport, n’est pas dédié plateau, etc. On a un modèle économique qui s’équilibre parce qu’on fait du sport le week-end et, avec les mêmes outils, des plateaux en semaine. On est dans l’obligation de mutualiser les moyens parce qu’aujourd’hui on n’est plus dans un modèle où on peut envisager un retour sur investissement sur un seul type de marché, que ce soit le sport ou autre. Quand on parle de remote production, l’installation du matériel sur site représente le coût le plus élevé. Et que vous alliez dans le cloud ou non, ce coût ne sera jamais compressible. D’autre part, si on décidait de faire tout le sport en remote, encore faudrait-il qu’on arrive à le faire aussi pour les plateaux et des opérations spéciales, comme le 14 Juillet. Et là se dresse la question de l’éligibilité. Or, aujourd’hui, s’il y a 100 Giga sur les stades de football en France, déjà pour le rugby, cette éligibilité disparaît. Ce qu’on peut arriver à faire, pour l’heure, c’est d’installer un rack centralisé dans un media center.

B.Q. : Les productions sport entièrement produites dans le cloud sont cantonnées à des événements secondaires, voire mineurs. Toutefois, dans le cas de productions premium, certains workflows sont parfois exécutés dans le cloud, dans une approche hybride. C’est pourquoi EVS a développé le concept de « balanced computing » avec des solutions qui permettent une flexibilité de déploiement des workflows en fonction des contraintes spécifiques de production. Par exemple, notre solution logicielle de super ralentis XtraMotion peut aussi bien être déployée dans le cloud que dans un car-régie.
Pour le sport notamment, l’avenir est-il, selon vous, à des solutions « end to end » dans le cloud ?
B.Q. : En fonction de différents facteurs (connectivité, coûts…), nous allons sans doute vers une évolution de la proportion des workflows hébergés dans le cloud. Pour autant, aujourd’hui, nous recevons des commandes de solutions EVS à long terme (dix ans) qui augurent des productions locales plutôt que dans le cloud. Le coût du cloud n’est pas non plus à sous-estimer. Certains clients avaient basé leur choix sur une durée d’utilisation du cloud limitée à la durée de l’événement. Mais dans les faits, les équipes doivent disposer d’un temps de préparation et doivent également exécuter une série de workflows après l’événement. Du coup, au lieu de deux heures, les infrastructures cloud sont parfois mobilisées pendant huit heures, voire vingt-quatre heures, ce qui multiplie le coût effectif par quatre, voire par douze.
L.D. : Est-ce que le cloud est la solution à tout ? Je ne le pense pas. Tout est une question de taux d’utilisation et de prix. Le débat cloud versus data center n’est pas un débat en soi. Aujourd’hui, un prestataire ne pratiquera jamais les mêmes prix que de gros acteurs comme Comcast, Disney, etc., dans le cloud. Ce constat interroge sur le modèle économique à adopter. La technologie nous permet désormais de dissocier les trois points essentiels d’une production live : la captation audio/vidéo, le traitement des données et le traitement éditorial. Aujourd’hui, la grande question est de savoir si, en fonction du type de contenu, de la complexité éditoriale, de la récurrence de la production, des distances, des coûts logistiques et des coûts de connexion (fibre ou autre), cela se traduit par une, deux ou trois localisations.
Des choix différents vont s’opérer en fonction des pays et types de contenus, et ces choix entraîneront plusieurs combinaisons possibles, telles qu’un data center ou cloud public pour le traitement des données audio/vidéo, une régie d’exploitation chez l’ayant droit ou chez le producteur ou prestataire, ou des opérateurs travaillant à la maison depuis leur PC. Il y aura toujours du hardware en place, type pupitre audio, mélangeur, contrôleur ralenti, etc., mais le traitement des données, à terme, s’effectuera totalement en mode software.
Captation versus processing vidéo
Les tournages sport sont-ils appelés à demeurer l’un des derniers bastions du hardware ou allons-nous, à l’exception des caméras et des micros, vers une quasi-disparition des solutions matérielles ?
E.G. et C.B. : Oui, à plus ou moins court terme, le processing vidéo sera « software based ». Certains éléments, comme les mélangeurs vidéo, basculent petit à petit vers des solutions software. Cependant, l’échelle de ces systèmes est encore un frein. Il n’est en effet pas si simple de remplacer un mélangeur de 196 entrées 1080p50 par une solution software tournant sur des serveurs de type data center.
B.Q. : La volumétrie des trafics IP et les traitements vidéo liés aux besoins du marché broadcast créent un besoin spécifique qui, pour certaines fonctions, ne peut aujourd’hui encore être adressé efficacement, étant donné les contraintes de fiabilité, de robustesse et de latence, qu’avec des solutions basées sur du hardware spécifique. Un PC équipé d’un noyau Linux peut jouer le rôle d’un switch Cisco ou Arista de base. Cependant, de nombreux clients achètent toujours des switches et routers Cisco ou Arista parce que c’est globalement plus efficace, moins cher, plus performant et moins gourmand en énergie.
L.D. : Nous aurons toujours besoin de caméras et de microphones sur site. Maintenant, le modèle de captation peut évoluer et évolue avec un éventail d’options plus large qu’autrefois (mini caméras, modèles PTZ, systèmes de tracking automatique, capteurs 8K…). Les choix se feront en fonction du type de contenu à produire. En termes de modèle, je pense que les productions premium (plus de quinze caméras) se feront toujours sur site, mais de plus en plus avec des solutions software. Pour les productions standard (moins de quinze caméras), je pense que l’accent sera mis sur l’augmentation de l’efficacité du mode de production du contenu.
Précisément, côté captation, une solution logicielle embarquée dans la caméra pourrait-elle permettre de zoomer et de cropper dans l’image afin d’obtenir différentes valeurs de plan et, du coup, de réduire le nombre d’appareils sur site ?
G.K. : C’était typiquement l’idée de notre système ROI (Region Of Interest). Basé sur des capteurs 8K, celui-ci permettait de venir cropper en live un signal HD et de simuler différentes focales avec une seule caméra et une seule optique. Pour le sport en particulier, on pouvait ainsi multiplier les points de vue tout en économisant sur des 80x, des 100x et autres qui sont des optiques très onéreuses. Malheureusement, avec l’arrivée du Covid, le monde de la production a connu un coup d’arrêt et on n’a pas poursuivi le développement de ce système, mais le concept va très certainement être repris à l’identique dans quelque temps.
Aujourd’hui, on pousse de plus en plus vers le sport, du moins des compétitions qui se déroulent sur des surfaces réduites et se filment en général en plans fixes, nos caméras PTZ de nouvelle génération, Celles-ci sont dotées de systèmes d’autotracking de plus en plus élaborés et embarquent toutes une technologie de cropping. Un modèle haut de gamme comme la AW-UE 160, par exemple, sortie en février dernier, est même la première caméra PTZ du marché à embarquer directement le standard ST-2110, en plus d’un chip qui permet de faire du ralenti.
F.V. : Ces techniques peuvent se concevoir pour des productions plus légères, spécialement des compétitions se disputant sur des aires de jeu réduites. Elles permettent d’offrir plusieurs valeurs de plan à partir d’un plan large mais présentent l’inconvénient d’être mono-axe, ce qui ne répond pas vraiment aux codes actuels de la réalisation sportive ni aux attentes des téléspectateurs.
B.Q. : Il est certain que les outils de production de sport premium s’inspirent et s’inspireront encore des pratiques de production issues du sport amateur ou de certains sports de niche. On a vu, par exemple, une utilisation de StreamDeck comme contrôleur de certains équipements. Cependant, les attentes en termes de qualité d’image, les engagements des fournisseurs en termes de périmètre d’utilisation, de fiabilité, de flexibilité, de distribution des rôles resteront autant d’obstacles pour l’utilisation de logiciels identiques ou, en tout cas, des versions d’un même logiciel.
L’encodage lui-même ne glisse-t-il pas de plus en plus du hardware vers le software afin d’obtenir une qualité d’image optimale ?
B.Q. : L’encodage sans contrainte de latence est effectivement le plus souvent effectué sur du matériel non-spécifique broadcast et néanmoins très gourmand. C’est surtout le cas pour les compressions fortes, de type H265.
FPGA versus COTS
Dans l’écosystème qui nous intéresse ici, comment un constructeur comme vous appréhende-t-il la tendance générale à la virtualisation et au COTS computing ?
B.Q. : EVS propose depuis plus de cinq ans une partie de ses produits et solutions sur des équipements COTS, même si certains clients préfèrent toujours de l’équipement EVS. Par ailleurs, EVS a intégré le concept de virtualisation sur des équipements orientés matériel, spécifiques au broadcast. Neuron, par exemple, supporte différentes applications (Convert, Compress, View, Bridge, Shuffle, Protect) qui peuvent être chargées sur un même équipement d’une production à l’autre. Cette approche permet de combiner flexibilité et performance. Chez EVS, toutes ces optimisations et les choix entre matériel et logiciel se conçoivent également dans une logique d’optimisation de l’empreinte carbone. Une solution Multiviewer HW peut consommer jusqu’à huit fois moins d’énergie qu’une solution SW pour certains types de signaux.

G.K. : Il n’y a pas de software sans hardware. Ce qu’on voit disparaître chez les manufacturiers comme Panasonic, c’est le hardware dédié, avec des cartes électroniques qui étaient développées pour une seule application. Ce business model n’est plus compatible avec le monde d’aujourd’hui. Depuis 2019, on a ainsi arrêté le développement des FPGA pour les gros mélangeurs, ceux supérieurs à deux ME (Mix Effects), pour aller vers celui d’applicatifs software tournant avec des composants COTS (processeur Intel, carte graphique Nvidia…). Chez nous, cette transition s’est traduite notamment avec la mise sur le marché de Kairos, notre moteur de rendu vidéo orienté broadcast, qui est un pur développement software.
On pourrait aussi parler, pour filer ce concept de virtualisation et de migration vers le software, de nos caméras plateau de nouvelle génération, actuellement en phase de développement, qui, à l’horizon des deux prochaines années, vont être ouvertes à un traitement complètement IP. La tête de caméra restera toujours la tête de caméra. En revanche, les briques hardware (CCU, RCP…) d’un système classique pourront être virtualisées via un pupitre de commande sur PC qui viendra directement piocher le flux de la caméra dans le mélangeur.
Cette tendance pourrait-elle s’accélérer avec la diffusion de la norme ST-2110 ?
B.Q. : La SMPTE 2110 Live IP est effectivement le catalyseur principal de ces évolutions. La plupart des projets sur lesquels EVS travaille aujourd’hui reposent sur cette technologie.
Acteurs historiques versus nouveaux entrants ?
L’essor des solutions orientées software, sinon « software only », peut-il remettre en cause la pérennité de certains modèles industriels ?
B.Q. : Le logiciel demande plus de maintenance, notamment pour maintenir des niveaux de sécurité élevés. Plusieurs clients, dans le secteur, ont subi des attaques qui les ont empêchés de diffuser leurs contenus. EVS a d’ailleurs développé différents composants afin d’augmenter ces niveaux de sécurité.
Les clients attendent aussi des solutions logicielles des mises à jour plus fréquentes pour bénéficier de nouvelles fonctionnalités ou simplement pour maintenir la compatibilité avec l’environnement logiciel qui est mis à jour. Mais globalement, le TCO (Total Cost of Ownership) devrait diminuer en considérant les gains d’efficacité opérationnelle réalisés grâce aux nouvelles générations de solutions.
G.K. : Côté industrie, il est clair qu’il y a un changement de paradigme. C’est d’ailleurs la raison pour laquelle, pour Kairos par exemple, nous avons ouvert une unité R&D en Allemagne, tandis que notre usine au Japon, elle, est spécialisée dans le hardware. Les fournisseurs de hardware d’aujourd’hui seront les fournisseurs de software de demain. Les acteurs resteront les mêmes. Simplement, en s’inscrivant dans une logique d’éditeur, ils vendront de plus en plus de licences à des clients qui achèteront par ailleurs des serveurs du marché sur lesquels tourneront des solutions logicielles Panasonic et autres.
Y a-t-il une possibilité, à terme, de voir les broadcasters et leurs prestataires se détourner des fabricants de hardware ?
F.V. : Il n’y a pas eu de disruption. À aucun moment, on n’a vu un nouvel entrant orienté software supplantant les fabricants de hardware. De toute manière, ces derniers avancent aussi sur des solutions hybrides ou des solutions sur étagère moins onéreuses.
Extrait de l’article paru pour la première fois dans Mediakwest #52, pp. 92-96