OpenAI dévoile « Voice Engine » un outil imitant votre voix en plusieurs langues. Risques reconnus pour la désinformation et la sécurité bancaire

Digital Business Africa

il y a 9 mois

[DIGITAL Business Africa] – Rédigez un texte et soumettez-le à « Voice Engine ». La technologie vocale synthétique, développée et dévoilée par OpenAI le 29 mars 2024, vous le lira avec une précision « surprenante ». Ou comme insérez un son ( voix humaine) dans le moteur d’ Open AI, et l’outil Voice Engine se chargera de le reproduire. Illustration, voici le clip d’une vraie voix humaine, saisie dans le moteur vocal d’OpenAI.

https://www.digitalbusiness.africa/wp-content/uploads/2024/04/20240401-age-of-learning-rainforest.mp3?_=1

Ci-dessous le clip généré par Voice Engine sur la base du son précédent.

https://www.digitalbusiness.africa/wp-content/uploads/2024/04/20240401-age-of-learning-rainforest-1.mp3?_=2

Pour avoir une telle précision, l’outil utilise un échantillon de 15 secondes du sujet. Ce qui lui permet donc de générer une réplique convaincante de sa voix. L’outil peut même utiliser un échantillon de voix dans une langue pour créer une réplique de voix pouvant s’exprimer dans plusieurs autres langues.

Voice Engine, selon OpenAI, n’est actuellement utilisé que par un « petit groupe de partenaires de confiance », dont des entreprises de technologie de l’éducation et de la santé. La société dirigée par Sam Altman indique que plusieurs tests devront être réalisés pour déterminer si et comment autoriser une utilisation plus répandue. Mais avant, Open AI devra prendre toutes les dispositions nécessaires pour lever toute équivoque chaque fois que l’outil sera utilisé.

« Tout déploiement à grande échelle de la technologie vocale synthétique devrait s’accompagner d’expériences d’authentification vocale qui vérifient que l’orateur d’origine ajoute sciemment sa voix au service et d’une liste de voix interdites qui détecte et empêche la création de voix trop similaires à celles de personnalités importantes», a déclaré OpenAI.

Risques de désinformation

Cette avancée technologique n’est pas sans susciter auprès de l’opinion publique, des risques de désinformation, qui plus est, en ces temps d’élections. Que ce soit en Afrique, en Europe en Amérique, les citoyens s’expriment dans les urnes. Les États-Unis d’Amérique auront une échéance cruciale en octobre 2024. Et donc, les observateurs avisés trouvent à cet outil de grands risques, y compris OpenAI.

« Nous reconnaissons que générer un discours qui ressemble à la voix des populations comporte de sérieux risques, qui sont particulièrement importants en période d’élection », a déclaré OpenAI dans un article de blog.

D’après OpenAI, des changements seront toutefois apportés à l’outil, à mesure qu’il sera largement disponible. Même si elle ne prévoit pas de rendre Voice Engine au public immédiatement, OpenAI entend supprimer progressivement l’authentification vocale pour les comptes bancaires.

Une menace pour des comptes bancaires

Avec, l’ intelligence artificielle, il a été prouvé par Joseph Cox le journaliste d’investigation que la sécurité biométrique basée sur la voix est loin d’offrir une protection infaillible. Joseph Cox raconte dans un article publié au Journal le monde en 2023 qu’ il a réussi à tromper le système de sa banque Lloyds Banks avec une voix générée par l’IA.

En fait, lors d’un appel téléphonique à la ligne de service automatisée de sa banque – Voice ID -, Joseph Cox dit s’être servi d’un fichier audio présent sur son ordinateur pour communiquer avec son service bancaire, plutôt que de s’adresser lui-même au service. Joseph Cox s’est simplement servi d’une voix synthétiques pour « briser l’idée selon laquelle la sécurité biométrique basée sur la voix offre une protection infaillible.

Voice Engine devance Sora, l’ outil vidéo généré par l’IA qu’OpenAI, qui peut créer des vidéos réalistes de 60 secondes à partir d’instructions textuelles (prompts), avec la possibilité de proposer des scènes avec plusieurs personnages, des types de mouvements spécifiques et des détails d’arrière-plan élaborés.

Par Jean Materne Zambo

Sources : OpenAI, CNN, lemonde.fr