You are currently viewing TetaVi, la nouvelle génération de captures de personnages
Gilad Talmon, CEO de TetaVi. © DR

TetaVi, la nouvelle génération de captures de personnages

 

Tout d’abord, pouvez-vous présenter votre entreprise et nous expliquer pourquoi vous avez choisi de mettre au point cette technologie ?

L’entreprise a été fondée fin 2016 par un duo d’entrepreneurs, Miky Tamir et Micha Birnboim, tous deux issus de l’univers de l’optoélectronique et de la vision artificielle. Leur but était de créer une nouvelle technologie capable de produire de nouvelles expériences vidéo qui ne limitent pas le point de vue de l’utilisateur et lui offrent une expérience immersive, en particulier dans le domaine du sport. Ensuite, au fur et à mesure des progrès réalisés sur notre technologie, nous avons découvert de nouvelles applications, par exemple dans les secteurs des spectacles en direct ou encore des médias.

 

En quoi vous distinguez-vous des autres acteurs sur le marché de la capture d’images volumétriques ?

Nous avons deux principaux avantages compétitifs qui sont tous deux liés à l’activité originelle de l’entreprise. Globalement, le marché de l’image volumétrique comprend trois segments. Tout d’abord, les systèmes de capture d’images grand-angle, avec des acteurs comme Canon, dont les solutions couvrent une très grande surface mais produisent des images de qualité relativement faible : on peut ainsi embrasser du regard tout un terrain de football, mais pas zoomer sur un joueur individuel.

Il y a ensuite les solutions en studio mettant en jeu des dizaines de caméras et parfois même plus de cent dans le cas de la solution proposée par Microsoft. Celles-ci font appel à un fond vert pour la capture et sont très exigeantes en matière d’équipement.

Enfin, il y a les solutions qui mettent l’accent sur le zoom volumétrique, qui sont généralement très mobiles et basées sur des équipements disponibles dans le commerce.

Chez TetaVi, notre objectif dès le début était de donner aux utilisateurs le moyen de filmer en conditions réelles – on ne peut pas installer un fond vert dans un stade tout entier ! – tout en gardant une qualité d’image élevée. C’est ainsi que nous avons créé un système très mobile, rapide à installer et qui demande peu d’équipement. De plus, nous faisons appel à des fonctions de « deep learning » nous permettant d’étoffer les images sans nécessiter plusieurs caméras.

Notre solution offre donc une qualité comparable à celles des meilleures solutions en studio, mais elle est beaucoup plus portable que ces dernières : par exemple, pour capturer des images volumétriques de chaque joueur d’une équipe de football, il n’est pas nécessaire que ceux-ci se déplacent dans un studio dédié. Nous pouvons apporter notre matériel dans le stade de l’équipe et réaliser les prises de vue à la fin d’une séance d’entraînement ! Ou encore, si un réalisateur souhaite utiliser notre système pour le tournage de son film, il peut l’installer sur le lieu du tournage et filmer ainsi des séquences spécifiques en 3D, en parallèle de la production.

Même avec un budget illimité, il est parfois tout simplement impossible de venir filmer en studio et c’est là que notre système s’illustre particulièrement.

 

Avez-vous des chiffres concernant le développement du marché mondial de la capture volumétrique ?

Il y a en fait différents marchés en fonction des usages : effets spéciaux pour le cinéma, publicité pour le digital et ainsi de suite. Chacun a sa propre évolution et son propre potentiel, c’est comme si vous me demandiez de vous décrire le développement du marché de la vidéo ! C’est très difficile à quantifier sans être plus précis. Selon nous, le marché de la vidéo volumétrique s’élève à quelques milliards de dollars et il pourrait atteindre des dizaines, voire des centaines de milliards sous l’influence de deux facteurs.

Le premier est le développement du marché de la réalité virtuelle et augmentée qui connaît en ce moment une véritable explosion, notamment avec de grands acteurs comme Facebook. Par ailleurs, les téléphones modernes intègrent de plus en plus souvent des fonctions de réalité augmentée, ce qui représente des milliards d’écrans capables de prendre en charge des contenus vidéo en 3D.

Le deuxième facteur, contribuant au développement de notre marché, c’est la prolifération des équipements de capture volumétrique présents sur les téléphones portables haut de gamme avec leur technologie Lidar. Nous misons beaucoup sur ces nouveaux produits. Nous avons d’ailleurs prévu une annonce à ce sujet en début de semaine prochaine.

 

Quel est le niveau d’automatisation de vos solutions et quel degré d’expertise technique exigent-elles ?

C’est comme la vidéo traditionnelle : le processus peut être entièrement automatisé, mais cela dépend de l’usage que l’on en fait. Par exemple, si je cherche à tourner une séquence pour un usage familial, je n’ai qu’à entrer dans le studio, à appuyer sur un bouton et tout ce qui passe dans le champ de la caméra sera automatiquement capturé. En revanche, si je travaille sur une production hollywoodienne ou sur un jeu vidéo AAA, mes besoins sont différents et je peux faire appel à des solutions qui offrent des fonctions très avancées pour le montage et la manipulation des images.

Pour résumer, le niveau d’expertise technique requis est similaire à celui de la vidéo 2D, c’est-à-dire que le fonctionnement de base est automatisé tandis que les options plus poussées demandent des compétences précises. Certains processus sont même plus faciles en 3D qu’en 2D comme par exemple l’ajout d’éléments supplémentaires à un modèle 3D capturé en volumétrie. Le tournage volumétrique permet également de s’affranchir de la limite que représente le placement de la caméra puisqu’il rend possible la création de caméras virtuelles et de montrer une scène donnée sous n’importe quel angle.

 

À quel niveau l’IA intervient-elle dans vos solutions ?

Sans en dévoiler trop sur nos secrets de fabrication, je peux dire que l’intelligence artificielle est omniprésente dans les produits que nous mettons au point. Il y a un peu moins de trois ans, nous avons compris que les algorithmes traditionnels sont limités par un « plafond de verre » bien plus bas que celui de l’IA. Nous avons donc commencé une grande migration vers l’IA de toutes nos fonctions de génération de contenus vidéo volumétriques. Cette migration progressive est en cours et elle nous permettra, à terme, de faire évoluer nos solutions au rythme des progrès réalisés dans le domaine de l’intelligence artificielle.

 

Pour un tournage en extérieur, combien de temps faut-il pour déployer le studio mobile ?

Une équipe de trois techniciens formés peut faire l’installation de A à Z (de l’arrivée du matériel au lancement de la capture, en passant par le calibrage) en quatre heures environ mais nous continuons de travailler à réduire encore plus ce délai.

 

L’augmentation du nombre de caméras permet-elle de capturer des images plus détaillées ou une surface plus importante ?

Passé un certain stade, l’ajout de nouvelles caméras pour un volume donné n’a que peu d’effet en termes de qualité d’image puisque les « zones d’ombre » peuvent être complétées par des algorithmes. Miky, l’un de nos fondateurs, qui possède un doctorat en physique, dit souvent que la capture de données réelles est toujours préférable à cette interpolation par un algorithme. En principe, avec un nombre infini de caméras, on devrait donc atteindre une qualité parfaite.

Chaque caméra ajoutée apporte cependant un bénéfice inférieur à la précédente, c’est pourquoi en pratique nous préférons mettre à profit ces caméras supplémentaires pour capturer une zone plus étendue ou occupée par plus de monde. En effet, plus il y a de personnes présentes dans la zone de capture, plus elles bloquent le champ des caméras. Dans ce cas précis, il est effectivement utile de disposer un plus grand nombre de caméras mais de les installer à différents emplacements.

Notre système standard fonctionne bien avec trois personnes dans la zone de capture ; à partir de quatre, il faut commencer à multiplier les angles de vue en ajoutant des caméras.

 

Quel est votre modèle économique ? Si je voulais déployer votre système en France, par exemple, combien cela me coûterait-il ?

Afin de rester compétitifs, nous n’avons pas de grille tarifaire publique, mais je peux vous dire que notre modèle implique de partager avec nos clients à la fois les risques et les bénéfices. Concrètement, cela signifie que le coût de mise en place de notre système est bien moins élevé que celui de nos concurrents, mais également que nous percevons une partie des bénéfices réalisés grâce à notre plate-forme. De cette manière, le client et nous-mêmes avons intérêt à ce que les images produites soient de la meilleure qualité possible.

C’est pourquoi nous choisissons nos clients avec beaucoup de soin et nouons avec chacun d’entre eux une relation très étroite, que ce soit en matière d’assistance ou de personnalisation du service. La qualité de ces relations est primordiale. Notre rôle n’est absolument pas celui d’un simple fournisseur de matériel et de services techniques se souciant peu des contenus produits par son client : le marché est encore loin d’être assez développé pour qu’une telle approche soit viable !

 

Envisagez-vous la possibilité d’exclusivités territoriales ? Ou bien, est-il possible que plusieurs acteurs dans une région donnée utilisent votre technologie ?

Nous n’avons pas encore eu ce besoin, notamment au vu de l’énorme variété des usages possibles de nos solutions : jeux vidéo, marketing numérique, effets spéciaux, AR, VR… Au Japon, par exemple, je ne peux pas parler de clients spécifiques mais nous avons actuellement trois studios de capture volumétrique et leurs différents utilisateurs ne sont pas en concurrence les uns avec les autres. À terme et au vu de notre approche très personnalisée de la relation client, il est toutefois possible que nous limitions le nombre de nos clients dans une région donnée.

 

Pouvez-vous nous donner une idée du prix d’une séance de capture volumétrique avec une ou deux personnes à l’écran ?

Cela varie énormément en fonction de l’accord spécifique que nous avons passé avec un client donné. Le coût de la production à proprement parler ne représente qu’une partie de l’équation. Il y a une multitude d’autres facteurs et même d’acteurs en jeu, par exemple dans le cadre de campagnes de markéting numérique. Le coût dépend aussi de la région et, même si je ne peux pas entrer dans les détails en raison d’accords de confidentialité, le prix d’une capture est généralement plus élevé dans la région Asie/Pacifique et aux États-Unis qu’en Europe.

 

Article paru pour la première fois dans Mediakwest #39, p. 116-118. Abonnez-vous à Mediakwest (5 numéros/an + 1 Hors série « Guide du tournage) pour accéder, dès leur sortie, à nos articles dans leur intégralité.

 

[envira-gallery id= »119598″]