You are currently viewing Des lives réalisés par des machines, science-fiction ou réalité ?
À l’Assemblée nationale, c’est le bouton de prise de parole qui indique l’orateur au système, qui focalise automatiquement les caméras et la réalisation sur lui. © Assemblée nationale

Des lives réalisés par des machines, science-fiction ou réalité ?

 

Nous sommes heureusement encore bien loin des situations apocalyptiques annoncées, mais il faut reconnaître que l’intelligence artificielle devient de plus en plus performante et nous rend des services grandissants au fur et à mesure des années. Depuis qu’elle s’est formée pour devenir capable d’identifier les êtres humains, notamment leurs bustes, têtes et yeux, mais aussi les animaux et les véhicules, elle nous offre des performances époustouflantes en matière d’autofocus : la machine est devenue meilleure que nous pour repérer et suivre le sujet. Mais les progrès sont loin de s’en tenir à la mise au point ou encore à l’exposition. Ils gagnent toute la chaîne de production, jusqu’à la réalisation des lives.

Nous allions étudier ces avancées dans la retransmission d’événements par le biais de deux solutions : celle créée à l’Assemblée nationale et celle proposée par Pixellot, qui sont toutes les deux à œuvre dans des domaines très différents.

Dans un lieu tel que l’Assemblée nationale, l’enjeu est de diffuser ce qui se dit pendant les commissions publiques, car cela fait partie des obligations d’un des sites stratégiques de notre démocratie. Le plus souvent, ce sont deux salles de commission qui sont exploitées simultanément, mais leur nombre peut monter jusqu’à huit. Avoir une équipe technique pour couvrir toutes ces salles coûterait donc très cher.

Göran Seifert, chef de projet audiovisuel, a ainsi créé un système pour automatiser la production des lives dans ces salles. Chacune est équipée de six caméras robotisées sur tourelles, avec une colorimétrie figée mais dont la gestion de l’exposition et de la mise au point sont confiées aux automatismes. Jusque-là rien d’extraordinaire, si ce n’est que le cadrage et la réalisation sont eux aussi faits de manière automatique !

Il s’agit d’un système de conférence : chaque intervenant a devant lui un micro, qu’il active pour s’adresser à ses auditeurs. Ainsi, quand un participant appuie sur le commutateur du micro en face de lui ça indique qu’il devient l’orateur, ce qui enclenche un preset. Les caméras se cadrent alors automatiquement sur lui, en respectant plusieurs valeurs de plan définies, et la réalisation commute la source pour toujours montrer celui qui parle. Une boucle est programmée pour enchaîner régulièrement des plans moyens, serrés et un plan large de la salle, afin de donner du rythme à la réalisation pour qu’elle ne soit pas trop lassante à regarder.

La captation live de ces deux à huit salles de conférence nécessite alors la présence d’une seule personne pour gérer tout l’ensemble. C’est l’ingéniosité de Göran, exploitant les avancées techniques de toute la chaîne de production, qui permet de créer tous ces programmes avec si peu de personnel. Une belle association homme-machine.

La solution proposée par Pixellot va encore plus loin dans les automatismes puisqu’elle se passe complètement d’opérateur ! Distribuée en France par la société Get-Live, fondée par Stéphane Dery, elle est destinée à la captation et à la diffusion d’événements sportifs « mineurs », qui jusque-là ne bénéficiaient pas d’une couverture live.

La solution Pixellot associe quatre caméras 8K et une puissante intelligence artificielle capable d’analyser des scénarios de jeu pour réaliser automatiquement les lives de compétitions sportives. © Get-Live

Il s’agit d’une solution assez géniale, qui rassemble dans une petite tour quatre caméras équipées d’objectifs grand angles et de capteurs 8K. Placée au bord du terrain, elle permet de découper la zone en quatre axes verticaux, qui sont analysés pour effectuer une réalisation automatique. Au début, celle-ci se basait sur le tracking, par exemple du ballon, mais pour un rendu plus palpitant c’est dorénavant une analyse de scénarios qui conduit les choix d’angles des caméras. En effet, ce n’est pas toujours le joueur porteur du ballon qu’il est intéressant de suivre mais aussi celui qui se positionne de manière stratégique pour le recevoir, afin de tenter une action qu’il espère décisive. C’est grâce à l’intelligence artificielle que la tour Pixellot analyse tous les angles pour anticiper les phases de jeu, car elle a appris à reconnaître les scénarios de jeu de seize sports, parmi lesquels football, basketball, volleyball, hockey, etc. En gros, tous les sports collectifs.

Grâce à la grande dimension des capteurs 8K des caméras, la solution peut bénéficier pour le flux final en HD de plusieurs valeurs de plan en cropant sans perte de qualité dans une grande image, pour focaliser l’attention sur un joueur ou une action avec un cadre plus serré. Il est possible aussi d’associer d’autres caméras robotisées sur tourelle et de lancer des ralentis pour enrichir la réalisation, le tout sans personne sur le terrain en utilisant les services de remote production. De même pour l’ajout de commentaires enregistrés à distance par des personnes qui suivent la compétition derrière leur écran.

En amont du match on peut entrer les noms des joueurs, que le système reconnaît grâce à leurs numéros de dossard. Cela permet d’ajouter des graphiques, mais aussi de focaliser la réalisation sur un seul individu. Avec l’application dédiée (accessible dans l’enceinte du stade uniquement pour des questions de droits) on peut réaliser son propre live et, par exemple, ne suivre que le joueur qui nous intéresse. L’intérêt est évident pour un père de famille venu assister au match de l’équipe de son fils, mais aussi pour des entraîneurs ou des recruteurs qui surveillent un athlète en particulier. Toujours via cette application, on peut isoler un extrait du flux pour le partager sur les réseaux sociaux.

 

Le système peut identifier un joueur et ne suivre que lui, pour créer un flux personnalisé et générer des highlights sur un athlète. © Get-Live

 

L’IA au service de la production

Grâce aux données sur les joueurs et à celles de scoring générées pendant le match, il est possible en fin de compétition de créer automatiquement des highlights, basés sur certains types d’actions (les buts…) ou certains joueurs. Non seulement la réalisation est automatisée, mais le montage aussi ! Si on veut ajouter sa patte de monteur, on peut toujours utiliser cette matière comme base pour un montage nettement plus rapide, puisque tout le dérushage est fait par la machine.

C’est une utilisation des technologies actuelles qui ouvre de nouvelles perspectives en matière de lives, en complément de l’offre déjà existante. De nombreuses villes équipent ainsi leurs gymnases pour proposer à leurs habitants des retransmissions des compétitions, qui n’étaient pas visibles auparavant. Une fois la tour Pixellot installée, il suffit de programmer en avance la plage horaire de la captation, avec diffusion sur le site choisi, par exemple celui de la mairie ou de la fédération sportive. Il est facile d’imaginer l’engouement que cela peut représenter, pour les recruteurs ayant accès depuis leur fauteuil à tous les matchs d’une catégorie et pour les parents lassés de passer leurs dimanches à se geler au bord des stades.

Ces deux solutions, aux finalités très différentes, ont en commun de s’appuyer sur les avancées des automatismes et de l’intelligence artificielle pour réaliser des lives sans avoir besoin de personne, et ainsi pour des budgets réduits qui étaient jusqu’alors inenvisageables. Faut-il s’inquiéter pour notre avenir en tant que technicien audiovisuel et être humain ? Ce fameux grand remplacement avec lequel on tente d’effrayer les foules, serait-il celui par la machine ?

Il ne paraît pas imaginable que la production audiovisuelle des événements majeurs soit assurée uniquement par des systèmes automatisés, et que les huit mille personnes embauchées par OBS pour la captation des Jeux Olympiques soient remplacées par une grande intelligence artificielle. On en est encore loin.

Néanmoins, c’est indéniable que ces nouvelles solutions astucieuses viennent en complément à cette offre « premium » et permettent d’élargir considérablement l’éventail des retransmissions en direct. Là où le temps disponible par une chaîne de télévision est limité, celui d’un site Internet est infini, ce qui démultiplie les opportunités pour des conférences, spectacles ou compétitions sportives de bénéficier d’une couverture audiovisuelle, et ainsi de toucher un public bien plus vaste. Le live est sans doute le format le plus porteur en ce moment, nous sommes tous gagnants à le voir progresser et se diversifier.

 

Article paru pour la première fois dans Mediakwest #46, p. 32-33