1 IA Google peut traduire votre discours tout en gardant votre voix

Le système d’IA de traduction Google, surnommé Translatotron, est constitué de 3 éléments capables d’analyser un spectrogramme audio (un instantané visuel des fréquences utilisées lorsque le son est reproduit), souvent appelé empreinte vocale. Si les résultats ne sont pas encore parfaits, l’IA de Google peut conserver la voix et le ton de l’orateur original. Et ce parce que le système convertit l’entrée audio directement en sortie audio sans aucune étape intermédiaire. A contrario, les systèmes de traduction traditionnels convertissent l’audio en texte, traduisent le texte, puis resynthétisent l’audio, perdant ainsi les caractéristiques de la voix originale en cours de route. Pourquoi c’est important ? Parce que cette approche produit des traductions plus nuancées en conservant d’importants indices non verbaux. En théorie, elle devrait également minimiser les erreurs de traduction, car elle réduit le nombre d’étapes du processus.

La suite ici (Karen Hao)

(Visited 126 times, 1 visits today)