in

Comment l’appel du 18 juin 1940 du général De Gaulle a été reconstitué grâce à l’intelligence artificielle

Comment l’appel du 18 juin 1940 du général De Gaulle a été reconstitué grâce à l'intelligence artificielle



L’IA peut même partir à la rescousse de l’Histoire. Nos confrères du quotidien Le Monde, en partenariat avec l’Institut de recherche et coordination acoustique/musique (Ircam) et sa filiale technologique Ircam Amplify, a pu reconstituer l’appel du 18 juin 1940, comme il aurait été prononcé par le général De Gaulle, invitant dans les heures les plus sombres tous les Français à ne pas abandonner la lutte contre l’ennemi allemand.

Un corpus audio de la BBC

Jamais enregistré, cet appel a souvent été réinterprété et le texte précis reste encore source de controverses entre historiens. Pour obtenir une version la plus fidèle possible, l’équipe s’est basée sur des documents “à partir de sources suisses, de la presse britannique et française et des recherches historiques sur le sujet”, assure Charles-Henry Groult, chef du service vidéo du quotidien du soir dans une séance de questions/réponses en ligne.

Pour reconstituer la voix originale de Charles De Gaulle, telle qu’elle était très probablement écoutée le 18 juin 1940 lors de sa diffusion, les chercheurs de l’Ircam Amplify se sont appuyés sur plusieurs discours postérieurs, enregistrés sur la BBC par le général entre le 22 juin 1940 et le 6 juin 1944. Les sons ont ensuite été analysés par une intelligence artificielle qui a pu recréer des sonorités proches. “Le système extrait ce qui fait la personnalité de la voix du général, la couleur de sa voix, son timbre”, détaille Frédéric Amadu, responsable technique chez Ircam Amplify. Une personnalité sonore qui sera ensuite apposée sur les phrases prononcées par un acteur, ici François Morel.

Reproduire l’émotion

Nommée voice cloning, cette technique est redoutablement efficace pour reproduire la voix d’une personne. Au total, la reconstitution a nécessité environ un mois de travail, “incluant l’enregistrement du comédien, une semaine complète d’apprentissage par la machine et l’intervention des chercheurs, techniciens et ingénieurs du son pour corriger l’audio”. Pour produire un audio quasi-identique au discours original, le modèle de l’Ircam nécessite encore de nombreuses corrections humaines. Par ailleurs, le programme utilisé par les chercheurs se distingue par sa précision vocale, jusque dans la reproduction de l’émotion que les logiciels disponibles publiquement n’arrivent pas encore à répliquer.

Pour reproduire des voix historiques, l’Ircam doit respecter un protocole interne strict visant à garantir l’éthique des projets menés. “Ce qui est prononcé par la voix de synthèse doit avoir été déjà réellement prononcé ou écrit”, explique Frédéric Amadu. “Quel est l’usage fait d’outils similaires ouverts à tous : encadré ? Respectueux ? Ouvert ? Manipulateur ?”, s’interroge-t-il.

What do you think?

Written by Sonia

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

GIPHY App Key not set. Please check settings

ChatCGT, l'IA conversationnelle à la sauce marxiste

ChatCGT, l’IA conversationnelle à la sauce marxiste

Netflix : un nouveau film Wallace et Gromit attendu pour 2024

Netflix : un nouveau film Wallace et Gromit attendu pour 2024