You are currently viewing AI Speech Detector, le nouveau détecteur de voix IA de l’Ircam Amplify
© Mediakwest / Génération Numérique

AI Speech Detector, le nouveau détecteur de voix IA de l’Ircam Amplify

Ircam Amplify, aujourd’hui leader mondial de la technologie audio IA et branche commerciale du laboratoire français de recherche audio IRCAM-Centre Pompidou, a développé AI Speech Detector, un outil qui aide les industries à lutter contre les risques croissants de deepfakes vocaux. AI Speech Detector peut être facilement intégré dans les technologies existantes utilisées par les salles de rédaction des groupes de médias, les plateformes de détection de fausses informations et de fake news, où l’authenticité audio et la détection des voix clonées par l’IA sont essentielles.

 

Se prémunir contre l’utilisation malveillante de voix générées par l’IA

Alors que le marché non réglementé du clonage de voix prend de l’ampleur, avec une croissance annuelle de 27,3 % et une projection de 16,2 milliards de dollars d’ici 2032, il devient indispensable de se prémunir contre l’utilisation malveillante de voix générées par l’IA.

 

Il existe plus de 100 modèles d’IA qui rendent le clonage de voix accessible à n’importe qui dans le monde, ce qui représente un risque majeur pour la démocratie.

 

AI Speech Detector : une réponse efficace aux risques

Le AI Speech Detector de l’Ircam Amplify répond à ce risque croissant en permettant l’identification rapide des voix artificielles avant qu’elles n’atteignent le public. Il détecte les voix clonées dans les fichiers audio et vérifie l’intégrité audio avec une précision de 98 % sans avoir besoin d’une voix de référence pour la comparaison. Ce nouvel outil s’appuie sur le succès du détecteur de musique générée par l’IA de l’Ircam Amplify, lancé en mai de cette année, qui identifie les fichiers musicaux créés par l’IA avec une précision de 98,5 %.

 

Intégration et modularité

La solution est évolutive et rentable, et s’intègre facilement dans les flux de travail et les infrastructures technologiques existants. Elle peut analyser jusqu’à 20 fichiers audio par appel API et traiter des centaines d’appels simultanément. Pour chaque fichier, elle détermine si l’IA a été utilisée dans sa création et fournit un score de confiance, indiquant le pourcentage du fichier qui a été généré par l’IA.

 

Ircam Amplify – branche de l’IRCAM-Centre Pompidou – a entraîné la solution sur 10 modèles d’IA de la génération vocale, y compris les cinq meilleurs modèles commerciaux et les quatre modèles open-source les plus utilisés. En tant que solution agnostique, elle peut en plus ajouter de nouveaux modèles en moins de trois semaines.

 

Transparence et sécurité pour les médias

« L’IA générative devient de plus en plus accessible, mais le risque d’utilisation abusive augmente également. Les imitations vocales constituent une menace importante et croissante pour l’intégrité des médias, la réputation des marques et la confiance du public. Notre AI Speech Detector offre la transparence et la sécurité dont les médias, la détection des fake news et les plateformes sociales ont besoin à une époque où la désinformation peut se propager dans le monde entier à un rythme accéléré. »

 

« Utilisant la toute dernière technologie développée dans notre laboratoire de recherche audio, le AI Speech Detector est une solution puissante et évolutive qui ne nécessite pas de voix de référence pour la comparaison. Nous avons examiné de près les besoins du marché et les principaux acteurs du secteur afin de nous assurer que nous ciblons des modèles populaires et accessibles qui peuvent être à l’origine des activités les plus scabreuses. Nous avons pu développer, tester et améliorer ce nouveau produit en moins de deux mois, en nous appuyant sur le succès du lancement et de la réception commerciale du détecteur de musique générée par l’IA, qui reflète la profonde expertise de notre équipe en matière de reconnaissance audio par l’IA. », souligne Romain Simiand, Chief Product Officer à l’Ircam Amplify.

 

Ircam Amplify offre déjà une suite complète d’outils qui répondent à toutes les étapes de la chaîne d’approvisionnement audio avec des solutions SaaS de pointe, notamment AI-Generated Music Detector, Quality Check, Stereo to Spatial, Music Tagger, Vocal Separator, Loop Extractor, Infringement Detector, Cover Detector et Speech to Text Generator.

 

Pour plus d’informations, visitez le site officiel d’Ircam Amplify en cliquant ici.