Effigy est un studio spécialisé dans la numérisation 3D de modèles vivants, par photogrammétrie numérique. La photogrammétrie trouve ses origines dans la photographie stéréoscopique, réalisée à l’aide de deux appareils photo dont les axes optiques parallèles sont à une distance équivalente à la parallaxe moyenne séparant les yeux humains; la stéréoscopie reproduit ainsi la vision en volume avec perception de la profondeur. Le procédé a été expérimenté dès le milieu du XIXe siècle, notamment par Nadar qui a effectué des prises de vues aériennes de Paris depuis une montgolfière. Les courbes de niveaux indiquant l’altitude sur les cartes topographiques ont été élaborées tout au long du XXe siècle par des moyens de photogrammétrie optiques. Désormais, toutes sortes d’engins volants sont couramment utilisées pour réaliser des mesures photogrammétriques à des fins de relevés topographiques, de modélisation d’architecture ou encore de cubature (calcul de très gros volumes de matériaux).
La photogrammétrie permet aussi la reconstruction 3D du volume et de la texture pour la modélisation humaine. Il existe des systèmes de scan utilisant le balayage d’un laser pour des modèles inertes. Mais la capture 3D photographique au flash est particulièrement adaptée aux modèles vivants, qui sont reconstitués ensuite pour des applications d’effets spéciaux, de jeux vidéo, de réalité virtuelle (VR), de réalité augmentée (AR) ou pour des catalogues 3D de présentation multimédia.
L’activité de la société Effigy, créée en 2015 par Vincent Haeffner, a débuté par des portraits 3D de famille : en studio, une personne est « scannée en 3D » le temps d’un éclair de flash, modélisée et retouchée en sculpture numérique, et enfin sa figurine est produite sur l’imprimante 3D couleurs de la société. Le « scanner » se compose d’une sorte de dôme de prise de vue sous tous les angles, constitué de cinquante-cinq boîtiers reflex Nikon identiques, synchronisés par des télécommandes radio. L’éclairage est fourni par quatre flashs professionnels ; la lumière doit être plate et uniforme pour ne pas provoquer de zones d’ombres qui perturberaient l’analyse.
Aujourd’hui, Effigy travaille de plus en plus pour les professionnels de l’image et de l’entertainment, et le studio peut être déplacé sur un plateau, moyennant une demi-journée de temps de montage et d’alignement du système. Les axes optiques sont disposés tous les 20° sur plusieurs « étages ». Le logiciel collecte les métadonnées caractéristiques des capteurs, des optiques et focales ; une surface de recouvrement d’au minimum 25% entre chaque image lui permet de juxtaposer les images pour reconstituer une vue sphérique intégrale.
La capture est instantanée (flash de 1/1000 de seconde), sans contrainte, et on peut flasher rapidement plusieurs modèles (environ cent cinquante scans ont été réalisés en deux jours sur le stand du Paris Image Trade Show). Trois types de fichiers sont livrés : l’un, appelé mesh, reconstitue le volume sous forme de polygones (jusqu’à quinze millions) ; l’autre reproduit les textures photographiques avec les matières et couleurs qui habillent les facettes ; le troisième est celui des maps, des couches graphiques qui optimisent les rendus et poids des fichiers.
Un logiciel professionnel de photogrammétrie procède à l’alignement des photos, et calcule un nuage de points : on emploie Photoscan, un logiciel d’origine russe ou Capture Reality, d’origine hongroise.
Pour le grand-public, le logiciel « 123d » de Autodesk, distribué gratuitement, calcule un modèle 3D à partir d’un lot de photos concentriques prises sur smartphone. Pour une bonne analyse, la lumière renvoyée par les surfaces du sujet doit être interprétable ; on évite les zones obscures ou les surfaces trop brillantes. On utilise, dans des cas difficiles, une lumière dite « cohérente » qui projette un maillage géométrique sur le sujet et aide le système à retrouver les points dans l’espace. Mais il reste préférable d’adapter la tenue vestimentaire des sujets.
Les détails très fins d’aspect, comme les cheveux, les pores de la peau ou plissures des lèvres nécessitent parfois des techniques complémentaires (laser, lumière polarisée…). Des applications dédiées servent pour l’animation des cheveux ; certains sujets sont ainsi scannés avec une charlotte sur la tête, et leur coiffure est reconstituée par calcul.
Le logiciel génère directement le mesh et la texture du sujet ; en quelques minutes pour des résolutions basses ou moyennes adaptées aux moteurs de jeu en temps réel ; en une heure environ pour un rendu visuel en haute définition destiné à la production audiovisuelle. Le mesh – « maillage » en français – est constitué d’un ensemble de facettes, ces surfaces élémentaires définies par trois ou quatre sommets. Les petits écrans des jeux sur smartphone se contentent de modèles entre deux mille et cinq mille facettes. Pour les écrans vidéo, on délivre dix mille à vingt mille facettes. Pour une image en définition 4K, le mesh est constitué de trois cent mille à dix millions de facettes.
Le scan 3D d’un modèle figé au flash permet de faire circuler en postproduction une caméra virtuelle autour du sujet, ou encore de lui appliquer des transformations. Il sert surtout à animer numériquement le sujet grâce à des logiciels spécialisés. Pour le visage, on numérise une trentaine d’expressions de base à partir desquelles on peut reconstruire toutes les expressions courantes du visage humain. On peut aussi scanner le sujet dans une posture caractéristique : avec les bras tendus à l’horizontale (en T) ou à 45 ° du corps (en A).
L’animateur recomposera un squelette élémentaire en plaçant manuellement des points pivots caractéristiques des articulations (rigging). Puis, ce squelette sera animé en y appliquant des données de motion capture, ou provenant de bibliothèques de mouvements qui permettront d’animer des personnages à partir de leur double numérique (digital double).
Les trucages de nombreux films sont réalisés sur ce principe combinant modélisation/texture/ rigging et animation, avec de très bons résultats ; c’était déjà le cas en 1994 dans Jurassic Park. Le scan 3D est donc un outil très complémentaire à la motion capture pour créer le mouvement de personnages hyperréalistes.
En savoir plus : www.effigy-3D.com
* Article paru pour la première fois, dans Mediakwest #19, p.30. Abonnez-vous à Mediakwest (5 nos/an + 1 Hors série « Guide du tournage) pour accéder, dès leur sortie, à nos articles dans leur totalité.